论文:预测已实现波动率:HAR对主成分组合、神经网络和GARCH
Vortelinos D. Forecasting realized volatility: HAR against Principal Components Combining,neural networks and GARCH[J]. Research in International Business and Finance, 2017, 39: 824-839.下载地址:
https://doi.org/10.1016/j.ribaf.2015.01.004
01 摘要
02 引言
期权价格、风险价值(VaR)、夏普比率等投资指标对波动率的依赖性揭示了准确预测波动率的重要性。波动率预测中最准确的模型是一个活跃的研究领域。此外,没有足够的证据表明,究竟是简单模型更好地预测波动性,还是更复杂的模型更好。本文研究了主成分组合(PCC)模型和神经网络(NN)模型的预测性能是否能产生相当准确的已实现波动率预测。通过双尺度实现波动率估计器对日波动率进行非参数估计。其次,检验PCC和NN模型是否比广义自回归条件异方差(GARCH)和异构自回归(HAR)模型更好地预测了已实现波动率序列。
03 数据
神经网络(NN)在金融领域预测波动性的应用。神经网络因其能够模拟人脑神经元网络的复杂非线性结构而得名,已成为计算机科学特别是人工智能领域的一个重要分支。根据Zhang (2007)的观点,任何NN研究至少应包括数据分割和处理、网络架构、训练设置以及所采用的算法。
本文在神经网络模型的应用上,采取了以下步骤满足最低要求:
(1)使用统计归一化方法对数据序列进行标准化处理,以便于输入和输出。
(2)所有样本内数据序列作为神经网络的输入,输入节点数量根据Akaike信息准则(AIC)确定,与滞后观测值的数量相对应。
(3)时间序列被分为训练集、测试集和验证集,分别用于学习数据模式、评估网络泛化能力以及包含最新观测值。
(4)网络结构通常包括一个输入层、一个输出层和两个隐藏层,隐藏节点数量与输入节点数量相等,且对预测性能影响不大。
(5)网络是完全连接的,所有节点仅与上一层的所有节点相连,除了输出层。
(6)使用双曲正切函数作为激活函数,Levenberg-Marquardt方法作为训练算法,学习速率统一设置为0.5。
4.3 GARCH模型
Engle (1982) 提出了广义自回归条件异方差(GARCH)模型,用于捕捉金融时间序列的波动性。GARCH模型的核心特点是它能够处理非恒定方差(异方差性)并考虑到条件方差对过去的依赖性。
在本文中,使用的是GARCH(1,1)模型,它是GARCH家族中最简单的形式,表达式如下:
GARCH(1,1)模型包含三个参数:α0是常数项,α和β是模型参数,分别代表了前一期残差平方和前一期波动的权重。
4.4 HAR模型
异构自回归(HAR)模型使用一天、一周和一个月的滞后实现方差作为回归量。Corsi(2009)和Corsi and Reno(2012)的研究分别使用5天和22天作为周回归量和月回归量的滞后数
其中RV(t+1)-q,t是q期为平均q周期滞后波动率。作为解释变量,有每日(对于q = 1)、每周(对于q = 5)和每月(对于q = 20)波动率。
4.5 AR模型
AR预测模型是最简单的线性预测模型,然而它在不同数据和高频日内数据采样频率方面具有良好的预测性能。AR(pAIC) 过程是:
表3展示了PCC、NN、GARCH和HAR模型的相对预测性能,这是将这些模型的MAE标准与AR(p)模型的MAE标准的比例。MAE标准涉及平均绝对误差损失函数。比率低于1表示该模型比AR(pAIC)基准更好地预测波动性。PCC和HAR模型是唯一在所有金融市场上预测波动性优于AR(pAIC)基准的模型。HAR和PCC再次占据了前两个排名。在滚动预测中,HAR排名第一,PCC排名第二;而在递归预测中,PCC排名第一,HAR排名第二。在两种预测方法中,NN都排在第三位,GARCH排在最后。
表4指出了PCC、NN、GARCH和HAR模型的相对预测性能,这是将这些模型的R2标准与AR(p)模型的R2标准的比例。R2标准涉及Mincer-Zarnowitz回归的调整后R2。比率高于1表示该模型比AR(pAIC)基准更好地预测波动性。在滚动预测中,没有模型的预测性能优于AR(pAIC)。在递归预测中,只有HAR模型的性能优于AR(pAIC);其次是PCC,第三是NN,最后是GARCH。
表5展示了PCC、NN、GARCH和HAR模型的相对预测性能,这是将这些模型的方向标准与AR(p)模型的方向标准的比例。方向标准表明了实际波动性序列的方向(一阶差分)与预测的方向(一阶差分)相同的次数(百分比)。比率高于1表示该模型比基准AR(pAIC)更好地预测波动性。在滚动预测中,PCC是唯一在所有金融市场上比AR(pAIC)基准更好地预测波动性的模型。其次是NN,第三是GARCH,最后是HAR。在递归预测中,PCC仍然是第一;然而,HAR现在是第二,NN第三,GARCH最后。
表7总结了结果,报告了每个金融市场和每个评估方法的最佳预测模型。异质自回归(HAR)模型和主成分结合(PCC)模型是表现最佳的。然而,HAR略优于PCC。
06 结论
一个有趣的结果是,具有完全不同规格的预测模型的性能收敛到相似的预测性能;这一结果在不同的评价标准和财务时间序列中是一致的。在已实现的波动率预测中,长记忆似乎很重要。HAR模型产生的预测足够准确,可以与第二好的PCC模型竞争。这一证据对所有评价方法都有效,并且在滚动预测和递归预测中都是一致的。
根据RMSE、MAE、R2和Direction标准,HAR模型是最好的;其次是PCC;三是神经网络;最后是GARCH。在所有评估方法(RMSE、MAE、R2和方向标准以及Diebold Mariano检验)中,异质性自回归(HAR)模型的预测最准确,其次是主成分组合(PCC)模型。
如果有好的建议,请留言给我们。
"大于研究"是华南理工大学经济与金融学院、金融工程研究中心于老师和学生对外分享研究成果和学习的心得的公众号。
对我们的研究感兴趣的可以联系fofscut@scut.edu.cn