应用实操|基于 Alpha101 的沪深300指数增强策略

文摘   财经   2024-03-16 09:49   日本  

0 前言

Alpha101 是 WorldQuant LLC 提出的因子集,在其公布的文章中通过实践证明,给出的因子集对于股票收益是具有影响的。

本篇文章旨在使用 Alpha101 进行择时模型的训练,实现对沪深300股票池进行挑选,并得到对应的投资组合,最后通过回测模块评估出,指数增强策略相比于基准指数的历史表现。

本次实践仅作为实验记录,内容只表示历史观点,不代表任何推荐建议。


一级目录二级目录三级目录
沪深300编制方案


样本空间

选样方法

定期调样审核时间


审核参考依据


样本调整数量

临时调样
沪深300增强策略


数据生成

数据处理遍历现有数据的每一个标的


遍历现有数据的每一个日期

因子评估

模型预测

策略回测参数配置


回测评估

1 沪深300编制方案

在我们进行指数增强策略研发的筹备工作时,首先需要对目标指数的编制方法知己知彼才行。

这里简单引用2021年中证公布的编制方案,详情可以移至参考文献四。

1.1 样本空间

指数样本空间由同时满足以下条件的非 ST、*ST 沪深 A 股和红筹企业发行的存托凭证组成:

  • 科创板证券、创业板证券:上市时间超过一年。
  • 其他证券:上市时间超过一个季度,除非该证券自上市以来日均总市值排在前 30 位。

1.2 选样方法

沪深 300 指数样本是按照以下方法选择经营状况良好、无违法违规事件、财务报告无重大问题、证券价格无明显异常波动或市场操纵的公司:

  • 对样本空间内证券按照过去一年的日均成交金额由高到低排名,剔除排名后 50% 的证券。
  • 对样本空间内剩余证券,按照过去一年的日均总市值由高到低排名,选取前 300 名的证券作为指数样本。

1.3 定期调样

1.3.1 审核时间

一般在每年 5 月和 11 月的下旬审核沪深 300 指数样本,样本调整实施时间分别为每年 6 月和 12 月的第二个星期五的下一交易日。

1.3.2 审核参考依据
  • 每年 5 月份审核样本时,参考依据主要是上一年度 5 月 1 日至审核年度 4 月 30 日(期间新上市证券为上市第四个交易日以来)的交易数据及财务数据。

  • 每年 11 月份审核样本时,参考依据主要是上一年度 11 月 1 日至审核年度 10 月 31 日(期间新上市证券为上市第四个交易日以来)的交易数据及财务数据。

1.3.3 样本调整数量

定期调整指数样本时,每次调整数量比例一般不超过 10%。

1.4 临时调样

在有特殊事件发生,以致影响指数的代表性和可投资性时,中证指数有限公司将对沪深 300 指数样本做出必要的临时调整。

这些特殊事件分别是新上市证券、收购合并、分立、停牌、退市、破产、实施风险警示。

2 沪深300增强策略

我们将指数增强策略的研发流程简单定义为如下系列步骤。

2.1 数据生成

在现有数据的基础上,使用下面的方法完成更符合实际情况的行情数据生成:

  • 检验当日是否为交易日
  • 剔除上市时间与当日间隔不满3个月或已经退市的成分股
  • 获取当日的所有成分股的行情
  • 剔除 ST 标记、停牌标记为正的成分股
  • 计算成分股的流通市值,同时标识所属中信一级行业类型

2.2 数据处理
在这一节中,我们参考相应证券研究报告,对生成的数据进行清洗,提高数据的质量。
2.2.1 遍历现有数据的每一个标的

  • 计算未来 5 天通过静态持有方法得到的收益率序列
2.2.2 遍历现有数据的每一个日期
  • 中位数去极值
  • 行业填缺失值:将因子缺失值填补成相同中信一级行业的个股因子平均值
  • 市值行业中性化:以因子作为因变量,市值及行业哑变量作为自变量,取残差作为新的因子值
  • 标准正态缩放
  • 涨跌标签计算:收益位于前十分之三作为正收益、收益位于后十分之三作为负收益

2.3 因子评估

我们对论文提出的 101 个因子进行简单的评估,并根据信息比率进行降序排列。

对于前二十个表现最好的因子,选作为后续择时模型的训练资料。

因子编号最大收益率最小收益率信息系数均值信息系数方差信息比率
alpha07322.61-31.450.040.120.36
alpha03528.54-17.310.030.110.30
alpha06415.16-19.140.030.100.29
alpha08616.14-20.590.030.100.28
alpha08430.57-8.590.030.110.26
alpha06510.16-12.790.020.100.25
alpha0019.80-23.660.030.100.25
alpha0999.15-18.830.020.100.24
alpha00610.44-14.960.020.090.21
alpha060-1.05-27.680.020.090.20
alpha0685.00-9.830.020.100.19
alpha0812.47-15.280.020.100.19
alpha0036.77-11.340.010.080.18
alpha0747.69-12.960.020.100.18
alpha01410.88-10.100.020.090.17
alpha016-0.63-7.830.010.080.16
alpha0275.65-13.430.020.100.16
alpha0404.11-6.810.010.090.15
alpha0153.52-6.050.010.080.15
alpha1016.41-15.070.020.110.14

2.4 模型预测

为了更好的控制数据偏移现象及模型泛化性,我们采用模仿实际应用的固定窗口滚动训练方式。

简单来说,每个时间点都是使用过去固定数量的样本进行参数估计。

时间节点准确率精确率召回率F1值
2020 年0.810.820.780.80
2021 年0.830.850.800.82
2022 年0.810.830.780.81
2023 年0.840.860.810.83

2.5 策略回测

策略回测是一种策略评估方法,它将特定的投资策略应用于历史市场数据,以期望评估出该策略的历史表现。

2.5.1 参数配置
  • 开始日期:2020-01-01
  • 结束日期:2023-06-26
  • 回测资金:100W
  • 佣金设置:千分之三
  • 调仓方式:每五天进行投资组合等权调仓
  • 交易滑点:未考虑
  • 冲击成本:未考虑
2.5.2 回测评估

下图是我们搭建的指数增强策略与沪深300指数在历史区间的累积收益率表现。

策略相比于基准,在捕获相似的风险的同时,上涨动力却相对薄弱。

3 参考文献

  1. WorldQuant LLC 的《101 Formulaic Alphas》
  2. 东北证券的《Alphalens 使用教程》
  3. 华泰证券的《人工智能选股之随机森林模型》
  4. 中证指数的《2021年沪深 300 指数编制方案》
  5. 华泰证券的《华泰单因子测试之海量技术因子》
  6. 申万研究的《交易型量价因子挖掘与有效性研究》
  7. 渤海证券的《技术因子的再挖掘之 Alpha 101》
  8. 华泰证券的《机器学习选股模型的调仓频率实证》
  9. 财通证券的《行业因子选取,中信一级还是申万一级?》
  10. 中信证券的《中信证券行业分类标准2.0 版及修订说明》

知守溪的收纳屋
存放觉得有用的文章。关键词:金融量化、因子选择、因果推断、可解释性、人工智能
 最新文章