康奈尔大学丛林:目标导向搜索与生成式人工智能在金融领域的应用

学术   2025-01-20 10:17   北京  


2024年12月21日至22日,首届ADEFT-XueShuo冬季学术研讨会“社科人工智能与人工智能经济学”在线上成功举办。


此次会议由清华大学孵化的学说平台主办,康奈尔大学商学院金融科技中心和斯坦福金融科技高阶实验室等全球多个研究机构和研究中心提供学术支持。


研讨会联席组委由康奈尔大学约翰逊商学院Rudd家族管理学讲席教授、金融学教授及《Management Science》金融主编叢林(丛林),与斯坦福大学管理科学与工程系终身教授Markus Pelger组成。


来自康奈尔大学丛林Will Cong 教授进行了关于“目标导向搜索与生成式人工智能在金融领域的应用”的精彩分享。




丛林 Will Cong
康奈尔大学约翰逊商学院
康奈尔大学约翰逊商学院Rudd家族管理学讲席教授及金融学正教授,兼任康奈尔中国经济研究、社科研究、新兴市场等中心的附属教授。康奈尔金融科技中心及CBER国际论坛等机构的创始人。他是最早在资产定价和公司金融领域建立人工智能模型的学者之一。美国国家经济研究局资产定价部门研究学者,亚洲金融和经济研究局资深学者,IC3加密和智能合约研究所的科学家,复旦-斯坦福中国金融科技与安全研究院(FS-CFTRA)主任,清华,北大,复旦等学院特聘教授,Kauffman创业基金的青年学者,Poets & Quants世界最佳商学院教授,和多家顶级学术界和业界期刊的编委。

研究领域:金融学、信息经济学、金融科技、创业学(理论以及涉及数字经济和国家发展的实证)、数字经济、中国金融和经济。


参会人员扫描下方二维码👇
即可观看演讲视频回放












目标导向搜索与生成式人工智能(GenAI)在金融领域的应用


在2024人工智能冬季研讨会中,丛林教授以一个全面而深刻的总结开启了他的课程。他指出,在当今数字经济时代,人工智能、数字经济与金融科技(AI, Digital Economics, and Financial Technology - ADEFT) 已成为推动全球经济发展的核心动力。这一领域涵盖了三大关键方向:首先是数据、数字化与网络的深度融合,包括基于群众的平台经济、网红经济与产消者现象,以及数字化对创业、发展与不平等的影响,同时也包含金融科技生态系统与数据经济的创新发展;其次是加密资产、分布式系统与Web3经济的崛起,涉及区块链共识机制、分布式账本技术的应用、代币经济学、去中心化金融以及数字取证与监管等领域;最后是人工智能在经济金融领域的创新应用,包括AI的对齐性研究、行为分析,以及在金融领域的文本分析、强化学习、生成式AI的应用,同时还包括可解释AI和面板树模型等创新技术的开发与应用。这些领域的交叉融合正在重塑我们的经济金融体系,带来前所未有的机遇与挑战。


随后,教授深入探讨了现代人工智能作为目标导向搜索的本质。他强调,现代AI已经从基础机器学习发展到更高级的形式,这包括目标导向的强化学习和生成式建模。在金融领域,AI不仅应用于收益预测和资产定价,更重要的是通过强化学习实现了高效的启发式搜索。这种方法能够在庞大的决策空间中进行经济导向的搜索,特别适用于具有灵活目标的投资组合构建。更令人兴奋的是生成式AI的出现,它为金融领域带来了革命性的变化。通过数据驱动的生成式均衡模型,我们可以更好地理解借贷双方的行为,实现更精确的决策制定。这种方法不仅接近真实生活的决策过程,而且能够灵活地适应各种场景,为金融领域的创新发展开辟了新的方向。教授的这些见解不仅展示了AI在金融领域的巨大潜力,也为我们思考未来金融科技的发展提供了全新的视角。


在前述AI金融创新的基础之上,教授重点介绍了几项开创性的研究:


在Goal-Oriented Portfolio Management Through Transformer-Based Reinforcement Learning (Cong et al., 2019; Cong, Tang, & Zhang, 2022)中首创性地结合Transformer架构与离线深度强化学习,开发出拥有数百万参数的金融大模型,突破传统Markowitz方法的局限。该模型可优化任何可写成累积奖励的投资目标,并利用深度神经网络处理高维非线性数据,精准刻画市场动态。研究团队基于1965-2016年美国市场(CRSP、Compustat、EDGAR),设计51个特征信号,涵盖收益、投资、盈利、价值、交易摩擦等维度,并融入MD&A等文本数据,实现全方位投资决策优化。此研究不仅展现AI在量化投资的潜力,更为智能投研和金融科技创新开辟了新纪元。


丛林教授通过AlphaManager: A Data-Driven-Robust-Control Approach to Corporate Finance (Campello, Cong, & Zhou, 2022)介绍了基于数据驱动和鲁棒控制的公司金融决策模型。这个创新性的框架通过深度强化学习技术,成功解决了传统公司金融研究中的核心难题:如何在复杂、动态和不确定的环境中制定最优管理决策。研究团队使用了从1976年到2023年的大规模数据,包括公司基本面、市场回报和宏观经济变量,构建了一个包含超过300万参数的模型。AlphaManager不仅能够预测企业价值变化,还能通过逆强化学习揭示管理者的真实目标函数,为公司金融研究开辟了全新的数据驱动方法论范式。


丛林教授接下来基于“Growing the Efficient Frontier on Panel Trees”(Cong, Feng, He, & He, 2021)介绍了面板树(Panel Trees)的概念。面板树是一种结合了决策树和面板数据分析的方法。传统的决策树方法假设数据是独立同分布的,这在金融时间序列数据中往往不成立。面板树的目的就是克服这一限制。


丛林教授解释道,面板树可以看作是一种"智能化"的资产分类方法。它不仅考虑了资产的特征,还考虑了时间维度,能够捕捉到资产收益率随时间变化的模式。这种方法特别适合处理金融数据,因为它能够适应低信噪比环境,并捕捉非线性、深层和不对称的交互作用。


丛林教授展示了如何使用面板树方法构建有效前沿。与传统的CART(分类与回归树)不同,面板树考虑了定价核的时变性,不假设收益是独立同分布的,并允许时间序列分割。面板树的分割标准是定价误差的平方和,这使得模型能够全局优化而非局部递归。


为了验证面板树方法的有效性,丛林教授展示了在美国股票市场1981-2020年数据上的应用结果。研究发现,面板树模型在资产定价和投资表现方面都优于传统因子模型,如Fama-French三因子和五因子模型。这一结果不仅证明了面板树方法的有效性,还为资产定价研究提供了新的工具。


在金融市场中,不同资产可能遵循不同的定价规律,传统的“一刀切”模型难以精准刻画这一复杂性。丛林教授在Sparse Modeling Under Grouped Heterogeneity with an Application to Asset Pricing(Cong, Feng, He & Li, 2022)中,引入了贝叶斯聚类模型(BCM)和分组异质性(Grouped Heterogeneity),为资产定价提供了一种更为灵活、精准的方法。BCM不仅能够同时进行观察聚类和变量选择,还能根据资产特征自动识别适用的定价因子,类似一个智能的金融专家系统。分组异质性则挑战了传统定价模型的局限,强调不同资产群体可能“生存”于不同的金融生态系统,遵循各自的定价规则。BCM采用尖峰和平板(Spike-and-Slab)先验进行变量选择,并通过联合边际似然准则优化模型结构,从而兼顾灵活性和可解释性。实证研究显示,该方法能有效识别市场因子和稀有因子,在解释“因子动物园”现象及金融异常方面表现卓越,并在资产定价与投资决策上超越传统方法。这项研究不仅拓展了金融建模的边界,也为因子定价理论提供了新的突破方向。


金融市场的复杂性致使资产收益的可预测性并非均匀分布,而是呈现出时空异质性。丛林教授在“Mosaics of Predictability” (Cong, Feng, He, & Wang, 2024)中提出了预测性马赛克这一创新概念,强调资产收益的可预测性在时间和横截面上存在显著差异。传统方法通常假设所有资产的可预测性类似,或仅关注全局趋势,而预测性马赛克则试图捕捉更精细的结构。丛林教授将其比喻为一幅马赛克画,其中某些区域(特定资产或时间段)颜色更深,代表更强的可预测性,而另一些则较浅,反映出较低的可预测性。为揭示这一结构,研究团队提出了一种基于面板树的新方法,通过最大化R²差异来分割数据,识别高度可预测的资产群体。实证研究显示,高可预测性资产在样本外仍能维持较强的预测能力,并且这些资产往往具有更优的风险调整后回报,挑战了传统的有效市场假说,为智能投资策略提供了全新视角。


随后丛林教授重点分享了Writing Quality and Soft Information in the GenAI Age: Evidence from Online Credit Markets(Cong, Guo, Zhao,Zhou, 2024),一项关于生成式AI在信贷市场应用的重要研究发现。这项研究深入探讨了写作质量在金融领域的重要性,以及ChatGPT等生成式AI工具如何重塑借贷结果。研究发现,生成式AI能显著提升贷款申请的写作质量和感知质量,但这种影响并不均衡:信用良好的借款人从AI改写中获益更多,原因在于他们倾向于将良好信用和优质写作视为替代关系,而这两者实际上是获得贷款的互补因素。通过构建专有语言模型和创新的Heckman深度学习修正程序,研究发现AI的使用降低了文本传递的软信息,可能导致信贷资源错配。然而,当放贷方考虑到借款人使用AI的因素并相应调整决策时,能够重新捕捉部分软信息,从而缓解潜在的资源错配问题。这项研究不仅揭示了生成式AI在信贷市场中的深远影响,也为我们理解金融科技创新与传统信贷决策的平衡提供了新的见解。


丛林教授贯穿整个课程的是目标导向搜索(Goal-Oriented Search)的理念,他将其定义为一种介于监督学习和无监督学习之间的方法,由经济学理论和目标引导。他解释道,纯粹的机器学习方法可能会忽视重要的经济学直觉,而传统的经济学方法可能无法处理大规模复杂数据。目标导向搜索旨在结合两者的优势。


丛林教授将目标导向搜索比喻为一个由经济学知识"编程"的AI探索者,它在复杂的数据空间中搜索,但其搜索方向和目标是由经济学理论预先定义的。这种方法不仅提高了模型的预测能力,还保持了结果的可解释性,这对于金融决策和风险管理至关重要。



系列阅读、搜索论文请点击👇
#学术前沿速递# #期刊目录##国际顶刊中国故事#:讲好中国故事,传播中国声音;#人工智能和机器学习#:AI在经济金融等领域的应用;#中国学术影响力#:国际顶刊中的中国影响力;#热点热议#:聚焦 学术&社会 话题热点;#博士生必读#:博士生、硕博圈干货;#榜单#:经管学术圈最新高校学者研究领域等排行榜。




为了我们不走散,学说请你加星标


疯狂暗示↓↓↓↓↓↓↓↓↓↓↓

学说平台
“学说”平台(www.51xueshuo.com)是清华大学孵化的专业知识传播平台,平台利用学术大数据和人工智能技术,通过学术直播、音视频分享和个性化推送,推动经济金融领域的学术交流和普惠,促进中国科技创新传播与最佳商业实践分享。
 最新文章