文献阅读荟-No.298-利用隐含波动率和已实现波动率之间的差值实现收益

2024-11-20 10:01   广东  

论文:利用隐含波动率和已实现波动率之间的差值实现收益

Umarov J, Lütkebohmert E, Halbleib R. Exploiting the Gap Between Implied and Realized Volatility[J]. Journal of Derivatives, 2024, 31(4).

下载地址:

https://doi.org/10.3905/jod.2024.1.202


01 引言
CBOE波动率指数(VIX)是评估市场波动性的常用指标,代表市场30天年化隐含波动率,衍生自标普500指数期权的价格,图1比较了VIX与已实现波动率(通过计算标普500指数30个日历日的年化波动率得出),表明期权隐含波动率通常高于标的的已实现波动率。
期权隐含波动率与标的的已实现波动率存在差值有利于期权卖方通过卖出相对昂贵的期权并收取期权溢价,图2展示了CBOE标普500市场中性波动风险溢价优化指数SVRPO(卖出标普500指数的1月期看跌和看涨期权)的表现,该指数旨在捕捉标普500指数期权的波动率风险溢价。如图2所示,该策略显著超越市场,进一步表明隐含波动率与已实现波动率之间差值的潜在盈利性。

02 期权策略和预测模型
本文构建了一种期权交易策略,使得套利者可以利用隐含波动率和已实现波动率之间的差值实现收益。该策略的核心是找到期权隐含波动率相对于预测的未来已实现波动率被高估的期权,卖出一组期权组合,这些期权在已实现波动率低于隐含波动率时,有很高的概率到期时处于虚值状态。因此,该策略关键依赖于确定正确的行权价格,而这一点依赖于精确预测VaR所提供的阈值水平,该水平在给定的时间段内以某一置信水平不会被股价突破。因此,这些阈值确定了交易看涨(看跌)期权的行权价格,使得这些期权有很高的概率到期时处于虚值状态,从而使期权卖方受益。
因此,对于每只考虑的股票,本文会在一定的置信水平下,预测未来一周的VaR。所选择的置信水平基于个人投资者的风险偏好,然而选择非常高的置信水平可能导致策略中期权行权价格位于股价分布的极端位置,从而导致期权流动性差。本文选择了1%和99%的置信水平。尽管可能能得到非常精确的VaR预测值,但在实践中,由于期权行权价格的离散性,无法充分利用其精度。因此,需要选择与预测最接近的行权价格。对于看跌的VaR预测(标的负收益),选择看跌期权;对于看涨的预测(标的正收益),选择看涨期权,这两种类型的期权,都建立空头头寸,这个组合称为短期宽跨式空头策略,收益函数示例如图3所示。

用于预测VaR的模型可以分为以下几类:

03 数据说明
3.1 数据获取
本文获取到的股票价格数据涵盖2000年1月1日到2023年1月1日(来源于Intrinio)。前三年数据用于确定特征计算和数据处理方式。VaR模型的训练从2003年1月1日开始,前五年用于模型训练,因此预测从2008年1月1日开始。
此外,本文使用高频数据构建了已实现分位数数据(来源于NYSE Trade and Quote)。数据的时间范围从2001年1月1日至2023年1月1日,涵盖了道琼斯工业平均指数(DJIA)成分股中的27只股票(于NYSE中交易)。DJIA成分股具有高度的流动性和较大的市场资本化,这些特征是流动性期权市场的基本要求。期权流动性对于评估并实际执行本文构建的交易策略至关重要。
用于机器学习模型的特征数据来自CBOE。此外,从FRED在线平台收集到以下数据:每日10年期国债到期收益率减去3个月国债到期收益率的差值;穆迪Baa级公司债收益率相对于10年期国债到期收益率的差值;3个月商业票据利率减去联邦基金利率的差值;10年期盈亏平衡通胀率;以及每周的圣路易斯联储金融压力指数。还从OECD Stat获取了OECD领先指标的月度扩散指数。所有这些数据的时间范围与股价数据相同,即从2000年1月1日至2023年1月1日。
3.2 股票数据处理
每周期权于周五到期。因此,以周滚动数据形式汇总日频股票价格数据(从周五到下周五)。然而,为了增加某些模型训练样本的数量,进一步对其他日期的数据进行汇总(如从周一到下周一、从周二到下周二等)。尽管这种方式会导致训练数据的部分重叠,但这是为了在确保足够数据量的同时做出的一种折衷。通过学习这些重叠数据,模型能够更好地泛化。这种处理方式仅适用于从表格数据中学习的模型,而对于从历史观察数据中学习的模型,不混合其他工作日的数据,仅使用“周五到下周五”的数据。
输入到机器学习模型的特征是基于日频和周频数据计算得出的,分为统计类、技术类、宏观经济类和经典VaR四类。
由于特征对不同股票的预测能力可能有所不同,本文还针对具体股票进行特定的特征选择。在每只股票和VaR显著性水平的每个训练窗口开始时,执行特征筛除过程(删除缺失值占比较高的特征、删除相关性过高的特征和删除非重要特征)。
3.3 期权数据处理
由于数据中包含流动性较差的期权,数据集中存在一些异常价格。因此,本文采用以下数据清理方法,从数据集中删除无效预测值。按照定义,隐含波动率不能为负,因此任何隐含波动率小于或等于零的观测值也会被移除。此外,对于买价或卖价违反无套利规则和期权价格界限的期权也予以剔除。要求看涨期权的价格随行权价格严格递减(看跌期权则相反,价格严格递增),卖价必须大于或等于买价。还剔除了发行少于四天的期权以及距离到期日期少于八天的期权。不考虑交易计划在交易周内进行股票拆分的个股的期权。

04 实证分析
4.1 VaR预测评估
模型评估指标针对每只股票、每种模型,以及多头和空头预测分别进行计算。简洁起见,通过简单平均将每种模型的结果在所有个股间进行汇总。模型按照前文所述进行分类,仅讨论每类模型的平均结果和最佳结果。图4展示了VaR预测的一个示例。如图所示,VaR预测在整个股票价格的演变过程中形成包络线。折线的阶梯状特征反映了预测的周频性质。
所有模型评估均通过交叉验证法在样本外数据上进行,采用年度扩展滚动窗口,在每个日历年的年末训练模型,并预测下一年度的表现。所有预测都经过合理性检查,并清除技术性错误,对异常值使用前向填充处理。
首先使用分位数损失函数来评估VaR预测的准确性,表5报告了所有股票的平均分位数损失,以及每个类别中最佳模型的表现,此外还显示了每个模型类别的平均值。最佳得分由集成模型和高频模型获得。然而,平均而言集成模型的表现略逊于高频模型,这表明模型的选择和/或组合方式也起着重要作用。
本文还应用MCS对模型进行分析,旨在根据给定的标准(损失函数)从大量候选模型中找到一组在统计上表现相同的优越模型。本文使用15%的置信水平来决定是否将某个模型从模型集合中剔除。结果显示,波动率模型、高频模型和集成模型在超过90%的情况下都进入了MCS,而其他模型则较少进入MCS。这表明,高频模型似乎是预测VaR最优的选择。
本文还使用基于VaR突破的经典统计回测方法。表6展示了每个测试在各资产上的平均通过率,其中,如果测试的p值大于0.05,则通过率为1,否则为0。除了高频模型,所有其他模型的表现平均较差,这再次表明,考虑日内信息在准确预测未来损失方面相较于仅使用低频输入信息的经典模型或机器学习模型具有巨大的优势。
4.2 期权策略回测
基于数据集中27家公司在2009年5月1日至2023年1月1日期间数据分别在1%和99%的置信水平上预测下一周的VaR,然后选择与VaR预测最接近的行权价格的看跌和看涨期权,并开设短期宽跨式期权空头仓位。为了在评估策略时更接近现实,本文采用较保守的方式,假设所有交易都以对策略不利的价格执行。因此,对于空头仓位,假设实际的卖出价格不会是中间价,而是偏向买价三分之四(即卖出价格=0.75×买入价+0.25×卖出价),四舍五入到1美分。为了提高回测的准确性,本文考虑了经纪商、交易所和监管机构收取的所有费用。
本文使用Interactive Brokers提出的保证金要求:
  • 如果短期看跌期权的初始保证金>短期看涨期权的初始保证金,则初始保证金=短期看跌期权的初始保证金+短期看涨期权的价格;
  • 如果短期看涨期权的初始保证金≥短期看跌期权的初始保证金,则初始保证金=短期看涨期权的初始保证金+短期看跌期权的价格。
表7展示了策略的回测表现统计数据,结果按VaR预测模型类别进行汇总,最佳模型是通过最大化年化夏普比率来选择的。无风险利率设定为1月期国债利率,年化平均利率为0.57%。
总体而言,展示在表7中的回测结果以及图5中的表现,表明该期权策略能够轻松地超过市场收益,无论是在绝对收益还是风险调整后的收益方面。尽管在非常强烈的市场冲击事件中会遭受较大的损失,但能够迅速修复。这证明了隐含波动率和已实现波动率之间的差值确实可以通过上述交易策略来实现收益。
最后,测试收益是否可以通过共同的市场风险因素来解释。为此,本文实现了Fama和French(1993)三因子模型。本文对各个模型分类中表现最好的模型的收益进行线性回归,回归变量包括三因子以及无风险利率。结果见于表8。
注意到,整体模型的拟合效果非常差,R-square值为0.01到0.02,说明三因子仅能解释极小部分的方差。MKT和HML因子都在统计上不显著,因此,结果无法通过市场收益来解释。相比之下,SVRPO的收益在一定程度上可以通过市场收益来解释。对于某些模型(如波动率模型和GBR模型),SMB因子显著,这可能与样本中选取的来自DJIA的个股有关。总体而言,结果确认大部分由策略生成的收益无法通过共同风险因子来解释。此外,所有模型的截距项都高度显著,证明该期权策略在统计上和经济上都能够产生正的alpha。

05 结论
本文提出了期权隐含波动率与标的已实现波动率之间差值实现收益的复杂交易策略,高度依赖于准确的VaR预测。为此,本文实施了多种经典以及高频和机器学习模型来进行VaR预测。结果表明,该策略有利可图,并且在纯收益和风险调整后的收益方面都优于市场基准(如标普500指数),结果在考虑到现实交易摩擦时依然稳健。

讨论时刻:
       本文构建了复杂的期权交易策略,有效利用隐含波动率与已实现波动率之间的差值实现收益。与以往通过预测已实现波动率实现收益的思路不同,本文通过预测在一定置信水平下标的股票价格的VaR确定卖出期权的行权价格。实证结果表明,策略成功地在统计上和经济上产生了正的alpha。


如果有好的建议,请留言给我们。

"大于研究"是华南理工大学经济与金融学院、金融工程研究中心于老师和学生对外分享研究成果和学习的心得的公众号。

对我们的研究感兴趣的可以联系fofscut@scut.edu.cn


大于研究
大于研究是华南理工大学金融工程研究中心的老师和学生对外分享研究成果和学习的心得的公众号。对我们的研究感兴趣的可以联系fofscut@scut.edu.cn。
 最新文章