有了 Delta-hedged 期权收益的表达式,便可进入本文的正题,考察期权因子的构造及表现。首先来看一个代表性因子:股票异质波动率(IVOL)。之所以选择异质波动率因子,一方面,异质波动率我们已经非常熟悉。另一方面,异质波动率因子是较早提出的期权因子之一,由 Cao and Han (2013) 提出。这篇文章的写作也非常清晰、规范,是很好的写作模板。Cao and Han (2013) 认为,期权市场中也存在异质波动率效应,即对于那些异质波动率较高的股票的期权,其 Delta-hedged 期权收益会显著更低。为实证检验这一论点,在其主要分析中,Cao and Han (2013) 为每只股票仔细筛选了最接近平值(at-the-money)的看涨期权,并要求期权在到期日之前不会除权。作者还剔除了那些价格显著违背看涨看跌期权平价关系的期权。此外,为排除微观噪声的影响,还依据交易量、买卖报价等做了进一步的过滤。表 1 展示了其基准结果。Panel A 表明,利用不同方法估计股票波动率,都能发现 Delta-hedged 期权收益与股票波动率之间存在显著的负相关关系。Panel B 进一步将波动率拆分为异质波动率(标准算法:前一月的股票日度超额收益对 Fama-French 三因子模型回归的残差的标准差)和系统性波动率(),结果表明期权收益与股票波动率的负向关系主要由 IVOL 所驱动,而系统性波动率与期权收益的关系实际上是显著为正的。采用月度数据估计波动率,或依据 GARCH(1, 1) 模型来估计预期 IVOL,结果也非常稳健。为理解上述发现,Cao and Han (2013) 着重强调了受到约束的中介机构的作用,而这本质上与套利限制(litmits-to-arbitrage)有关。具体来看,高 IVOL 股票的期权可能吸引更多的投机者,也使得卖出这些期权的中介机构更加难以对期权进行有效的对冲。为此,中介机构需要额外的补偿才有动机承担相关的风险。这使得高 IVOL 股票的期权价格上升,从而显著降低了其预期收益。沿着这一思路,代表套利限制的代理变量也应对 Delta-hedged 期权收益有显著影响,且控制这些变量可能有助于缓和期权收益与 IVOL 的负相关性。Cao and Han (2013) 进一步的实证分析表明的确如此。其中尤其重要的套利限制因素/代理变量是股票的流动性(用经典的 Amihud illiquidity measure 代表)和股票价格:流动性越差、市值越小,Delta-hedged 期权收益也越低。而控制这些因素后,IVOL 对 Delta-hedged 期权收益的影响则显著下降(系数从 -0.0405 下降至 -.0233),但仍然显著。换言之,套利限制有助于解释 Delta-hedged 期权授予与股票 IVOL 之间的负相关性,但并不能完全解释这一发现。Cao and Han (2013) 还考虑了诸多其他可能性。例如,这一发现是否来自于与波动率有关的期权定价偏误等原因。其实证分析表明结果是非常稳健的。您如果对相关细节感兴趣,可找原文自行阅读。
3. 期权收益预测与因子模型
以异质波动率因子为代表介绍了期权(单)因子研究后,接下来我们来看如何利用期权及股票特征对期权收益的预测以及如何构建简约的期权因子模型。借鉴 Gu et al. (2020) 关于用机器学习方法预测股票收益的经典研究,Bali et al. (2023) 这篇 RFS forthcoming 的文章考察了用机器学习方法和大量期权与股票特征来预测期权收益的可行性。值得注意的是,考察机器学习方法对期权收益的预测能力的 motivation 并不仅仅是简单的方法应用。其核心在于由于期权本身的特征,Delta-hedged 期权收益与期权及股票特征之间可能存在显著的非线性关系,且非线性的重要性可能远高于股票。而机器学习方法则有助于更好地捕捉这一非线性关系。具体来看,参照 Gu et al. (2020),作者考察了十余种常见机器学习方法。而在预测特征方面,Bali et al. (2023) 构建了一个非常丰富的特征库,其中包括 80 种期权特征、94 种股票特征,90 个行业虚拟变量(dummy variables),以及已有文献发现的其他可能有助于预测 期权收益的特征,如违约风险。图 1 展示了其主要结果。不考虑集成学习方法(ensemble methods),表现最好的单一方法是 GBR,即梯度提升回归,这是一种典型的非线性方法。值得注意的是,与作者的猜想一致,线性模型的表现不佳,无论是惩罚回归(Ridge/Lasso/Elastic Net),还是主成分回归(PCR)和偏最小二乘(PLS),样本外 都是负的。基于线性模型的集成学习方法(L-En)有正的样本外 ,但仍显著低于非线性方法。有鉴于此,期权因子模型中大概也应该包含能考虑非线性特征或关联的因子。实证资产定价中的两位扛把子 Bryan Kelly 和前文提及的 Turan Bali,各自与合作者做了一个期权因子模型。先来看 Büchner and Kelly (2022) 的三因子模型。其出发点是,由于期权价格和特征往往会快速变化,这往往会导致期权的因子暴露在短期内发生迅速变化,因此,需要充分考虑 conditional factor exposures. 自然地,Kelly, Pruitt and Su (2020) 提出并在 Kelly 的多篇顶刊论文中已成功应用的工具 PCA (Instrumented PCA, IPCA) 方法便再合适不过。但需要注意的是,Büchner and Kelly (2022) 聚焦在 S&P 500 股指期权、而非个股期权上。他们利用 IPCA 方法构造了一个三因子模型,这个模型可以解释 S&P 500 股指期权超过 85% 的收益变化。有趣的是,这一三因子模型还可与经济直觉关联起来,大体可以对应经典的水平(level)、斜率(slope)和偏度(skew)。Bali et al. (2022) 则与本文介绍的其他研究类似,聚焦于个股期权,并提出了一个包括了多个非线性特征的期权定价模型。与前述 Bali et al. (2023) 关于期权收益预测的研究不同,Bali et al. (2022) 并非用机器学习方法从数据中提取非线性因子,而是采取了更符合经济学、金融学传统研究的方式:首先从理论上推导预期 Delta-hedged 期权收益同期权和股票特征之间的关系,进而按照理论关系构建因子和因子模型。具体来看,利用测度变换和一些数学推导,Bali et al. (2022) 证明,预期 Delta-hedged 期权收益可以分解为以下两个部分:
Bali, Turan G., Jie Cao, Fousseni Chabi-Yo, Linjia Song, and Xintong Zhan. "A factor model for stock options." Available at SSRN 4308916 (2022).
Bali, Turan G., Heiner Beckmeyer, Mathis Moerke, and Florian Weigert. "Option return predictability with machine learning and big data." Review of Financial Studies forthcoming (2023).
Büchner, Matthias, and Bryan Kelly. "A factor model for option returns." Journal of Financial Economics 143.3 (2022): 1140-1161.
Cao, Jie, and Bing Han. "Cross section of option returns and idiosyncratic stock volatility." Journal of Financial Economics 108.1 (2013): 231-249.
Ehsani, Sina, and Juhani T. Linnainmaa. "Factor momentum and the momentum factor." Journal of Finance 77.3 (2022): 1877-1919.
Käfer, Niclas, Mathis Moerke, and Tobias Wiest. "Option factor momentum." Available at SSRN 4405852 (2023).
Kelly, Bryan T., Seth Pruitt, and Yinan Su. "Instrumented principal component analysis." Available at SSRN 2983919 (2020).
Leippold, Markus, and Hanlin Yang. "The anatomy of factor momentum." Available at SSRN 3517888 (2021).