会议:开源一席谈
傅开波:纪总,首先请介绍一下您的量化投资框架方法论。
傅开波:刚刚您也介绍到机器学习在量化投资中的应用,很多投资者对量化中机器学习/深度学习的应用还是较为模糊的,能否请用些例子再详细介绍一下,机器学习模型在量化投资中的应用及效果?
纪青:首先关于机器学习如何运用到量化投资中,我们是从传统线性多因子模型过渡而来,这个过程是比较自然的。因为从更广义的角度,传统线性多因子模型也是属于机器学习的范畴。本质上来说,机器学习就是以合适的模型来学习某种客观存在的规律,特别是一些通过简单模型无法去精准描述和反应的规律。所以当量化产品在做进行大规模扩容的时候,我们在2019年开始就观察到传统的线性模型没有办法比较好的去捕捉金融市场的定价规律了,我们开始尝试采用结构复杂度更高、更贴合市场本身运行规律、同时也是经过数据验证的其他模型来进行替代。而机器学习模型相对传统模型最大的优势,我认为是在于它对非线性关系信息的挖掘上面,它本身更符合金融市场本身体系的复杂性。而且随着金融量化领域可获得的数据是越来越丰富的,机器学习可以更好地发挥它处理大样本的优势,不断丰富有利于我们做有效定价的因子数据。利用它本身的结构优势可以比较好的处理传统线性模型的一些因子共线性问题,以及我认为是特别难处理的因子赋权问题。而在产品实际运用过程中,我们也确实观察到机器学习模型不会过于依赖一些单因子的表现,从而比较好避免因子拥挤带来的一些风险。
纪青:刚刚也提到了像我们的因子库是从大类上兼顾了基本面和价量的因子信息,我觉得这也是我们比较重要的一个特点。我们虽然整体是机器学习的框架,但我们的输入端并不是纯价量的数据,这样的模型结构也让我们在今年几波价量因子的大幅波动和回撤中避免陷入踩踏的风险,可以观察到我们的超额收益也保持比较稳定表现。但是价量因子作为长期以来确实是有效性非常好的因子群体,它也是我们底层因子中非常重要的组成部分,所以在2022和2023年价量因子表现比较好的这两年中我们的超额收益也是有所体现。所以可以说我们找到了一种机器学习的训练框架,可以比较好的融合和均衡基本面以及价量信息。另外,我们也在尝试不断去丰富我们因子层面的增量信息,比如说引入一些产业层面的信息,还有新闻层面的一些另类数据信息。但是我们也观察到这方面的因子信息挖掘的难度相比上一些传统的因子是比较大的。这当中可能一方面是反映了另类数据移植到金融市场中,相比之前的标准化数据,它具备了更低的信噪比。另外一方面其实也对我们去使用这类信息的处理方式,或者说是因子构造的方式提出了更高的要求。
纪青:相比传统线性模型上来说,机器学习确实存在可解释性上的问题。比如说在非线性结构下,我们去做因子归因就是一件从解释性上来讲是比较困难的事情。但是我觉得在人工智能领域,我们的应用,其实一直是走在学术前面的。那金融市场它的定价本身就是一个非常复杂的决策体系下面所得到的结果。作为从业者,我们近些年的感受就是,在这个复杂体系下,我们市场运行本身的复杂度就是不断提升的。过去的偏单一或者简单的这种逻辑分析体系是越来越容易失效的。所以我认为金融资产的定价问题和机器学习模型本身的复杂度是可以相匹配的。那关于样本外不稳定这个问题,我觉得是因人或者是因模型而异的。首先,在人工智能模型的比较中,我们就发现并不是越复杂就越有效。在我们自己的因子结构下去选择相对合适的模型,我觉得应该是更为重要的。那关于实盘模型失效的问题,虽然我们目前还没有碰到,但我们也在持续做相关的一些应对措施的准备。比如说,我们会进一步的去拓宽我们的策略类型,比如说我们最近也在做深度学习模型样本外的跟踪和优化。我认为多策略的框架应该是对抗风险和波动的最有效同时也是最理性的方式。
纪青:首先,今年以来各项监管措施确实对以价量因子为主的量化策略,特别是高频价量因子为主的量化策略有比较大的影响。这一部分的群体其实主要是以量化私募为主,所以我们可以看到很多量化私募一方面在提升选股域市值的门槛,一方面在提升中低频策略在整体策略中的比重来适应目前的监管环境。作为公募量化团队,我们的量化策略一直以来主要的对标领域就是中低频策略。而且从产品本身的约束来说,我们绝大多数的持仓都属于成分内的选股,再叠加到刚刚我们提到对于市值因子严格的风险敞口暴露的控制,因此我们的模型基本上是没有受到刚刚提及的政策影响的。而且我们在非高频价量因子赛道已经实践了很多年,也践行出了相对稳定的结合基本面和价量因子的量化选股体系。特别是作为比较早就切入人工智能赛道的公募团队,我们既可以利用公募平台研究积累的优势去挖掘一些深度性的因子,也可以利用机器学习等模型获得有效的信息。而且在我们的体系下对市值风格和行业偏好是没有依赖性的,更注重alpha因子的中长期的累积效应。所以从这一点上来说,我认为就是公募量化和私募量化在超额收益端,已经出现比较明显的收敛化表现。这一点从净值表现也是可以反映出来的。
傅开波:请介绍一下富安达基金量化团队的情况及产品线的布局特点。
纪青:富安达基金的量化团队,我们现在主要成员有四个人。我们分别毕业于同济大学、上海交通大学、哥伦比亚大学和约翰霍普金斯大学。我们整个研究方向会覆盖到金融数学、物理学、金融工程和人工智能等等。我们整个团队的打磨时间超过七年,可以看到是比较典型的金融和数理交叉的复合专业背景。我们指数与量化方向的产品线目前主要是分两大部分,一个是指数增强类产品线,我们是以业绩验证期比较久的富安达中证500指数增强基金为代表。同时,我们也刚刚获批了沪深300指数增强基金,后期也会发行。另一部分是我们的主动量化产品线,是以去年发行的富安达智优量化选股基金为代表的,我们这个产品对标的群组就是主动权益型的资金。所以我们整个量化策略都是建立在机器学习的选股框架之上,随着我们整体业绩的不断打磨和经验的累积,也是希望能够为不同的资金配置需求去提供专业、完备的一个量化产品的工具箱。
(全文结束)
(纪要整理:傅绎达)
风险提示:上述内容和意见仅作为客户服务信息,并非为投资者提供对市场走势、个股和基金进行投资决策的参考。本公司对这些信息的完整性和准确性不作任何保证,也不保证有关观点或分析判断不发生变化或更新,不代表本公司或者其他关联机构的正式观点。历史业绩不代表未来收益,基金投资需谨慎。
做「开源」的量化研究
to be a quant,to be open-minded.
更多交流,欢迎联系:
开源证券金融工程团队 | 魏建榕 张翔 傅开波 高鹏 苏俊豪 胡亮勇 王志豪 盛少成 苏良 何申昊 陈威 蒋韬
end
团队介绍
开源证券金融工程团队,致力于提供「原创、深度、讲逻辑、可验证」的量化研究。团队负责人:魏建榕,开源证券研究所副所长、金融工程首席分析师、金融产品研究中心负责人,复旦大学理论物理学博士,浙江大学金融硕士校外导师、复旦大学金融专硕校外导师、上海财经大学数学专硕业界导师。专注量化投资研究10余年,在实证行为金融学、市场微观结构等研究领域取得了多项原创性成果,在国际学术期刊发表论文7篇。系列代表研报《开源量化评论》、《市场微观结构》、《开源基金研究》,在业内有强烈反响。2023年获评金麒麟菁英分析师第1名、Wind金牌分析师第3名、水晶球分析师公募榜单第4名;2022年获评金牛分析师第5名、Wind最佳路演分析师。团队成员:魏建榕/张翔/傅开波/高鹏/苏俊豪/胡亮勇/王志豪/盛少成/苏良/何申昊/陈威/蒋韬。