在金融领域,人类是最早的“机器学习”
教育
财经
2024-03-07 22:58
中国香港
在人工智能和机器学习问世之前,经济学家主要通过数学和统计学的方法,结合理论和实证研究来构建经济模型。随着科技的日新月异,新的工具和技术能够如何帮助经济学家提高经济模型的准确性和预测能力?它们又有何局限性?芝加哥大学布斯商学院的Dacheng Xiu分享了他的见解。
机器学习给金融市场带来了许多新的工具。不过我认为,金融领域很早以前就开始使用机器学习的原理了。比如,芝加哥大学布斯商学院的Eugene F. Fama和达特茅斯学院的Kenneth R. French从数千个变量中选出了三个变量来解释资产回报变化。虽然他们利用的是经济学洞察,但其中的工作原理和机器学习实际上是一样的。他们所做的其实是变量选择的一种形式,机器学习现在简化了这个过程。可以说,机器正在模仿人类已经在做的事情。金融行业长期以来一直借鉴学术研究中的洞见,如Harry Markowitz的现代投资组合理论、期权市场中使用的Black-Scholes期权定价模型以及Fama-French因子模型等。但是在机器学习方面,金融行业自六年前便有部分领先于学术界。有一家大型对冲基金的负责人告诉我,他甚至没有读过学术金融论文。因此,我和耶鲁大学的Bryan T. Kelly决定写一篇论文,将机器学习引入学术金融领域。如何利用数百个变量更好地预测回报?我们以此为切入点,提出了采用这些方法的理由。这篇论文引起了学术界和华尔街的关注,这表明人们对该领域的兴趣正与日俱增。最近,我们共同撰写了一份调查报告,总结了已取得的最新进展。在最初的论文中,我们介绍了一些可以用于预测股票收益的先进的机器学习技术,如决策树和神经网络等。在那之后,我们又研究了“替代数据”,解释基于人工智能的图像识别和自然语言处理工具的使用。替代数据包括新闻源,它是最大的文本数据库之一。有了这些,你需要借助机器学习来挖掘文本中嵌入的信息,因为语言是一种高度复杂的信息编码方式。你甚至需要使用大型语言模型来解读字里行间的含义。我们从2019年就开始进行这些研究,当时ChatGPT尚未推出,但研究中使用的模型与其原理相同。如今,资产管理行业越来越引以为傲地展示其机器学习能力,吸引着来自数据科学或机器学习社区的杰出人才。更别提在中国,自2019年以来,量化行业已经发展到了令人难以置信的规模。其中相当多的量化基金资产管理规模已达到100亿日元(近15亿美元)。然而,金融与计算机科学有所不同,我们需要谨慎地采用可能不适用于市场的工具。我们正在试图揭开机器学习的神秘面纱,想要了解其弱点和局限性,以及如何改进优化。在这方面,我们仍缺乏充分的理论指导。目前一个令人担忧的问题是机器学习模型的黑箱性质。当一支基金亏损,其经理需要向投资者解释发生了什么。如果交易策略的制定是基于一千个变量而不是三个变量,就很难准确地找出问题所在。但另一方面,它却可能提供更好的预测结果,如果这是你想要的,或许就要接受它的缺点。性能与可解释性之间需要权衡。金融是一个保守的领域,对于机器学习是否比简单模型更好仍存在疑问。在一些可能不适用的领域,比如长期预测,我们可能不得不更多地依赖经济学家的直觉。但是利用替代数据,我们可以做很多事情。从一开始的分析数字,到文字,再到现在的语境。以前的方法无法做到这一点,但大型语言模型可以。我很高兴成为机器学习技术的早期采用者,也希望它能在未来继续蓬勃发展。在大数据时代,机器学习的潜力远远超过了经济领域最优秀的人才在没有它的情况下所能做到的。Dacheng Xiu为芝加哥大学布斯商学院计量经济学和统计学教授。