神经网络模型——以GRU为代表的优化探索
对于GRU模型,我们发现利用日度K线和转债的三种溢价率作为输入,可以取得最好的效果。为了提升模型的多头表现,我们尝试使用专注于多头的损失函数,但效果不佳,反而导致信息比率和多空指标下滑。为应对训练样本不足的问题,我们引入了数据增强策略,尤其在2022年之前的数据上取得了显著成效。然而,在数据充足的2022年之后,使用原始数据反而更能适应市场变化。通过这一模型调整,GRU模型在多头和多空上的表现均有所提升,这表明数据增强在数据量较少的情况下对于提升模型性能是有效的。
决策树模型——以LGBM为代表的优化探索
对于LGBM模型,我们将转债和正股的Alpha158因子,以及一组手工构建的12个因子作为输入,以提供多样化的因子视角。结果显示,转债和正股的Alpha158因子的组合在LGBM模型中实现了最佳的多头表现,而手工构建的因子表现不佳,可能需要进一步的因子扩充来满足模型需求。
机器学习转债择券策略
GRU模型与LGBM模型训练得到的因子相关性较低,仅为0.35,因此我们将两者等权合成得到机器学习转债择券因子(ML因子)。ML因子在全部转债上IC均值为9.71%,5分组多头年化收益率为22.80%,多空年化收益率31.83%;在偏股/平衡/偏债型转债上IC均值为8.41%/9.42%/8.90%,多头年化收益率为28.36%/18.99%/15.32%,多空年化收益率39.04%/25.41%/20.04%。进一步考虑扣费和换手率缓冲,使用20%的转债,相对中证转债指数构建机器学习转债择券策略,该策略在全部转债上年化收益率14.59%,跟踪误差5.18%,信息比率2.23,超额最大回撤4.24%;在偏股/平衡/偏债型转债上年化收益率分别为20.77%/11.11%/9.09%,信息比率分别为1.44/1.64/0.90。
风险提示
以上结果通过历史数据统计、建模和测算完成,在政策、市场环境发生变化时模型存在时效的风险。策略通过一定的假设通过历史数据回测得到,当交易成本提高或其他条件改变时,可能导致策略收益下降甚至出现亏损。