论文:机器学习如何推动量化资产管理?
Blitz D, Hoogteijling T, Lohre H, et al. How Can Machine Learning Advance Quantitative Asset Management?[J]. Journal of Portfolio Management, 2023, 49(9).下载地址:
https://dx.doi.org/10.2139/ssrn.4321398
大量文献表明,机器学习 (ML) 在许多资产定价应用中是有益的,因为它能够检测和利用非线性与交互效应,而这些效应在更简单的建模方法中往往会被忽视。在本文中,我们通过从审慎的从业者的角度回顾现有的机器学习文献,讨论了将机器学习应用于资产管理的前景和缺陷。重点是可以对预测结果产生重大影响的方法设计选择,以及对宣称机器学习能带来显著性能提升的说法进行评估。
机器学习(ML)已经在许多研究领域中取得了进展,特别是那些涉及大量数据的研究,通常非常适合应用ML方法。尽管金融和投资最终是围绕人类行为的社会科学,但定量分析方法的地位已经被牢固地确立。
传统上,在没有强大的计算能力和大量数据的情况下,人们通常会依赖经济模型来描述理性个体的最佳决策。在经济学中,理论规定了模型,数据决定了模型参数的估计。这样的计量经济模型旨在建立特征和目标变量之间的关系,同时还考虑这些关系是否有意义;换句话说,人们通常在寻找因果关系,而不仅仅是相关性。在聚焦于预测时,ML相对于经典的计量经济学方法具有优势,尤其是在缺乏理论模型的情况下。ML擅长处理大规模和复杂的数据集,特别适合捕捉非线性和交互效应。
本文描述了ML方法在量化资产管理中的具体挑战和机遇,并从机构资产管理者的角度展望了未来发展。随后的部分将解释ML相对于传统计量经济学的优势和缺陷,并讨论在量化资产管理中应用ML模型的不同实践设计选择。接下来的部分将聚焦于ML在股票市场中产生alpha的能力,并讨论其他应用,如预测资产风险、构建最优投资组合或优化交易执行。
机器学习模型和经典计量经济模型之间的区别往往不够明确。本文将机器学习模型定义为那些能够“自我学习”并随后对未见过的数据(样本外数据)进行预测的模型。经典计量经济模型通常是在整个数据集上进行拟合的,没有明确的“学习”元素。它们往往相对简单,通常是线性的,例如普通最小二乘(OLS)回归。在本节中,我们对比了机器学习和计量经济学方法,并讨论了采用机器学习方法所带来的好处和缺陷。
03 资产管理中机器学习的建模选择
尽管ML模型是数据驱动的,但用户仍然需要做出各种重要的选择。这些设计选择可能会对模型预测的质量产生重大影响。一般来说,只要有足够的数据,其中许多问题都可以凭经验回答。然而,数据是量化资产管理中最大的障碍之一,这使得这些设计选择变得更加重要。此外,开源软件可用于所有常见的ML应用,采用免费编程语言,如R或Python。然而,这种可用性可以被认为是一种喜忧参半。虽然人们可以快速提出朴素的ML驱动的预测,但它需要领域知识和专业知识来做出有意义的设计选择,以指导给定的ML算法。在本节中,我们将讨论这些设计选择中最重要的。
1. 方法选择
如果有好的建议,请留言给我们。
"大于研究"是华南理工大学经济与金融学院、金融工程研究中心于老师和学生对外分享研究成果和学习的心得的公众号。
对我们的研究感兴趣的可以联系fofscut@scut.edu.cn