(本文阅读时间:16分钟)
近年来,生成式基座模型(Generative Foundation Model)在自然语言处理、图像和视频生成等领域取得了巨大成功,推动了新一轮的学术研究和产业应用浪潮,逐步为多个行业塑造出新的生产范式。生成式基座模型的强大能力离不开三个关键要素:海量且高质量的训练数据;能够将数据中的核心信息(如文本中的语义信息)进行有效的令牌化(tokenization)和序列化(sequentialization);通过自回归(auto-regressive)的训练方式对数据进行建模,从而获得对核心信息的深刻理解和隐含的推理能力。
基于多年来在多个行业成功落地人工智能的实践经验,微软亚洲研究院的研究员们意识到,将这种范式与行业特有的核心数据相结合,可构建出具有行业独特性的生成式基座模型,进而推动相关领域的跨越式发展。
金融市场的交易订单数据就是一个典型例子。研究员们发现,金融市场订单数据具有三大重要特征:
1. 细粒度:订单作为金融场景下最基础的原子数据,能够全面、精细地刻画真实市场,结合相应的撮合规则,能够还原出市场的完整运行过程;
2. 大规模:全球交易所经过多年的电子化交易,积累了海量的交易订单数据;
3. 结构化:订单数据具有良好的结构化特性,便于进行令牌化和序列化。
这些特征使订单流数据有望成为金融市场生成式基座模型的坚实基础。基于此目标,微软亚洲研究院提出了大市场模型 (Large Market Model,LMM),并设计推出了基于 LMM 的金融市场模拟引擎 MarS(Financial Market Simulation Engine Powered by Generative Foundation Model),旨在助力金融研究人员为不同场景定制生成式模型,以及构建适用于金融市场所有下游任务的生成式基座模型应用新范式,为金融行业的效率提升和精准洞察带来变革。
图1:股票交易市场及订单的示意
作为金融市场生成式基座模型的核心要素,订单流数据不仅能精细地体现市场参与者围绕投资标的的实时博弈过程,还在不同尺度下展现出了两类独特的价值:
细粒度的市场反馈:从单一市场参与者的视角来看,每笔订单(特别是大额订单)发出后,其他市场参与者在观察到该订单后可能会调整自身决策。这种调整往往会体现在后续订单中,进而形成市场整体对该订单的反馈。这种反馈展现了金融市场价格博弈过程中的微观视角。
宏观的市场博弈过程:从整体市场的视角来看,所有市场参与者之间的复杂博弈汇聚在一起,形成了某一时间段内的市场交易特性。随着时间的推移,这种交易特性的变化记录了市场中多空双方分歧的起始、演进及最终弥合的博弈过程。
研究员们根据订单流信息的特殊价值,分别对单笔订单及其相关的订单簿,以及一段时间内的所有订单集合进行建模,进而构建了 LMM。两种不同层次的建模分别对应上述的细粒度反馈和宏观市场博弈特性,即订单模型(order model)和批量订单模型(order-batch model)。针对原始订单流数据,图2展示了服务于订单模型和批量订单模型的两种令牌化设计。这种令牌化设计使模型能够精准捕捉订单流中的微观和宏观信息,从而对金融市场的复杂动态进行更准确的建模和模拟。
图2:针对单一订单的令牌化(上)及针对批量订单的令牌化(下)
随着训练数据的增多以及模型参数的扩展,生成式基座模型的能力会持续提升,带来传统小模型难以企及的想象空间。基于上述两种令牌化方式,研究员们在 LMM 中分别设计了基于 Transformer 架构的生成式模型,并在不同规模的训练数据和参数规模下进行了测试。结果如图3所示,无论是订单模型还是批量订单模型,都表现出了显著的扩展定律(scaling law)。这意味着,在生成式基座模型的支持下,金融场景中海量的历史交易数据有望释放其长期潜藏且尚未充分发掘的巨大价值。
在 LMM 中,研究员们还融合了订单模型及批量订单模型,对不同尺度和不同博弈视角的订单流进行建模,保证了模型所生成的订单流能够体现对市场准确且深刻的理解。这不仅提升了模型的生成能力,还为市场订单数据的时序建模开辟了新路径,使 LMM 在生成市场订单流时具有更高的精准性和现实模拟能力。
图3:订单模型及批量订单模型在不同参数规模下的扩展曲线(scaling curve)
生成式基座模型一经训练完成,便能通过简单的适配应用于广泛的下游任务,并且在许多场景中超越为单一任务设计的传统小模型。为了充分发挥 LMM 对金融市场的强大建模能力,研究员们分析了各类金融场景中的潜在下游任务需求,设计并推出了基于 LMM 的金融市场模拟引擎 MarS。
MarS 不仅是一种通用的金融市场模拟工具,还为金融行业的多种下游任务提供了全新的生成式基座模型应用范式。借助 MarS,金融研究人员能够为不同的金融场景定制生成式模型解决方案,覆盖领域广泛,从市场预测、风险评估到交易策略优化等等。
图4:金融市场模拟引擎 MarS 框架图
传统的金融市场解决方案往往需要专家针对不同场景和任务设计专门的算法和策略。然而,金融市场的天然动态性使得这些算法和策略必须不断调整和更新,耗费了相关人员大量的时间和精力。而在生成式基座模型时代,LMM 已经有能力对金融市场进行细致深入的建模,并且可以根据最新的市场数据进行定期更新。因此,研究员们希望利用 LMM 强大的市场建模能力,构建一个适用于金融市场所有下游任务的“一力降十会”的新范式。
在 MarS 中,研究员们设计了模拟真实订单撮合规则的虚拟交易所(如图4右上角所示)。然后在虚拟交易所中撮合由 LMM 生成的订单流,模拟生成与这些订单流相对应的成交情况,并推演出市场的模拟轨迹(simulated market trajectories)。基于这一机制,金融场景中最常见的预测类和检测类任务便有机会在生成式基座模型的框架下,设计出全新的解决方案。
应用于预测类任务
金融市场中的预测类任务非常广泛,任何依赖于对未来市场指标进行估计的任务都属于这一范畴。当前,无论是基于经济学理论还是数据驱动的主流金融预测模型,都遵循“拟合特定场景和指标”的设计范式。这种范式的局限在于,一旦预测目标发生变化,就需要重新调整和设计模型。例如,图5展示了数据驱动模型 DeepLOB 在预测股票价格走势时的情况,通常这种情况需要分别训练5个模型来获得未来1-5分钟的走势预测。
但在 MarS 的新范式下,只需将最近的真实市场数据输入到 LMM 中持续生成未来的订单流,并在虚拟交易所中进行撮合,就能得到一条可能的未来市场轨迹。通过多次模拟,不仅能够获得未来走势的预测,还能推断出其他任何市场指标。如图5所示,基于 MarS 新范式的预测性能显著优于传统的标杆算法,为金融市场的预测类任务提供了极具吸引力的解决方案,同时也从侧面体现了 LMM 在股票市场建模方面的强大能力。
图5:以“预测股票价格未来趋势”任务为例,在金融场景预测类任务中基于 MarS 的新范式具有显著优势
应用于检测类任务
对于金融市场的监管者而言,精准有效地检测潜在的系统性风险或恶意交易行为是维护金融市场健康高效运行的重中之重。检测任务中的关键是在于找到能够区分异常情况与正常市场行为的指征。LMM 所刻画和建模的正是金融市场的通用规律,生成的订单流代表了普遍情况下的市场行为。因此,通过将真实市场轨迹与 MarS 生成的模拟轨迹进行对比,就有机会获得传统方法难以察觉的异常指征。
图6展示了一次真实的恶意市场操纵行为的前、中、后三个时段内,模拟市场轨迹与真实市场轨迹之间的 Spread 分布差异(Spread 指最优买卖价格之间的差值,可用于反映资产的实时流动性,Spread 大意味着流动性较差)。可以明显观察到,在监管机构披露的恶意操纵的时间段内,模拟市场轨迹与真实市场轨迹之间的相关程度显著降低,这是一个有助于监管机构更高效查处恶意市场操纵行为的重要指征。这一类依赖于对微观市场行为有高质量建模的监管指征,在没有高质量的订单流生成的基座模型之前是难以获得的。利用这种方法,许多金融市场的检测类任务都将可以通过对比模拟市场与真实市场,找到高效的检测指征。
图6:模拟市场轨迹与真实市场轨迹在 Spread 分布下的相关度在已被证实的市场操纵的前、中、后的差异,操纵进行中的相关度显著降低,有潜力成为一项检测市场操纵嫌疑的指标。
生成式模型能够通过简单的描述生成符合特定条件的内容。在模拟引擎 MarS 中,研究员们设计了一种方案,可以根据自然语言描述生成特定市场状况下的订单流。考虑到金融场景的极端市场状态具有特殊的研究意义,研究员们特意设计了一套基于层次扩散模型的订单流调控信号生成系统,从而保证即便是在生成真实世界中罕见的极端市场情况下,例如股灾、熔断等,也能生成若干有区别又有高保真度的调控信号。通过这些细粒度的高保真调控信号,MarS 得以将宏观的市场描述转化为对微观订单流的精细调控,实现精准的订单流生成。
此外,由于市场参与者的所有意图和行为最终都会通过订单这一形式表达和交互,所以对市场的研究本质上是对订单及其交互行为的深入分析。MarS 内置了能撮合任意合法订单流的虚拟交易所,通过研究员们开发的机制可以使外部交互订单能够无缝插入由 LMM 生成的订单流中,同时确保后续订单流仍保持高保真度,真实地反映这些交互订单所带来的影响。通过观察外部交互订单对模拟市场的影响,相关研究人员能够在生成式模型的帮助下,收集到以往只能靠投入巨大财力才能获取的珍贵数据。
通过结合 MarS 的可调控订单流生成能力和对交互订单的真实反馈,研究员们发现 LMM 不仅为主流的预测和检测任务提供了一种新的统一范式,更有希望重新定义金融科技的研究方向、应用技术、市场探索以及理解市场的方式。为此,研究员们尝试将原本只能在实验室环境中构想的两类应用场景带入了现实——“假设……会怎样”的分析(“What If” Analysis)以及为强化学习等算法提供接近真实金融市场的数字孪生训练和测试环境。
“如果……会怎样?”类的分析研究任务
“在不同市场环境下,不同规模的交易订单的投入会对市场产生怎样的影响?”这一假设性问题对金融市场非常重要。但传统研究方法依赖于收集真实订单交易的市场反馈以及诸多经验总结和假设,成本高昂,致使相关研究进展缓慢。而生成式模型为这一问题的解决提供了突破性的契机。
图7左上展示了在 MarS 市场模拟中,一批买入订单如何影响资产价格轨迹并演化出不同的市场轨迹。图7右上则展示了 MarS 模拟不同交易策略的市场影响曲线,它们与传统研究总结出的真实市场模式几乎一致,证明了 MarS 在替代传统高成本研究方法上的巨大潜力,也间接证明了 MarS 在模拟和刻画订单间复杂市场行为方面的强大建模能力。
更进一步,研究员们利用 MarS 的低成本优势,通过模拟市场轨迹的大量数据,借助常微分方程(ODE)构建了较为准确的市场影响模型。图7左下展示了通过 ODE 得到的市场影响公式,图7右下则展示了该公式的高可解释性。
研究员们相信,借助 LMM 对金融市场的准确建模,以及 MarS 对可控生成和交互式订单的支持,金融场景中的“假设……会怎样?”类研究问题将迎来快速的发展和显著进步。
图7:基于 MarS 的“订单的市场影响”问题的研究成果示例
金融市场中强化学习算法的训练环境
过去,强化学习等自主探索和优化算法只能在实验室环境下运行,在实际场景中的应用受限。这类算法依赖于在模拟环境中进行结果评估和优化决策。然而,金融市场的行为和决策往往表现为订单流的变化,进而影响市场。如果训练所依赖的模拟环境不能够准确模拟市场影响,且无法根据算法的行为/决策的改变及时调整反馈,那么在模拟环境中表现良好的算法在实际场景中可能无法达到预期。此外,由于强化学习算法需要自主探索和调优,如果模拟环境只能模拟常规场景而无法刻画现实中的极端情况,那么训练得到的算法在实际应用时可能会在极端场景下出现极其不佳的表现。
MarS 的高保真调控生成能力和对外部交互订单的实时反馈,为强化学习算法在金融市场下游任务中的应用提供了更广阔的空间。图8展示了在 MarS 模拟引擎中从头开始训练交易智能体的过程。研究表明,随着市场反馈的不断更新,强化学习算法在真实模拟环境中逐步学会了更优的交易策略,并获得了令人满意的回测结果。这一成果显示了 MarS 作为强化学习训练环境的潜力,将可以为金融市场算法的自主优化提供有力支持。
图8:以 MarS 为环境训练的强化学习交易代理的训练表现。在训练过程中,代理的性能显著提升,展示了 MarS 在帮助训练强大且面向真实市场的强化学习算法的能力。
随着基于生成式基座模型的新范式不断完善,金融市场相关领域的各类下游任务有望通过适配这一新范式实现性能提升和突破。更重要的是,这一新范式具有普适性。未来,其他拥有海量且复杂核心数据的垂直领域,包括医疗健康、能源、物流和制造业等,也具备开发行业特有生成式基座模型的潜力。例如,能源领域可以利用历史能源消耗和价格波动等数据,建立智能化的能源分配和预测系统。
生成式基座模型的广泛应用将不仅仅推动金融市场相关技术的飞跃,也为其他数据密集型领域提供了全新的研究方向和解决方案。伴随新范式的发展,未来会有更多行业和领域在生成式人工智能的支持下,迈向智能化、自动化和精准化的新高度。
相关文献:
MG-TSD: Multi-Granularity Time Series Diffusion Models with Guided Learning Process
https://arxiv.org/abs/2403.05751
Controllable Financial Market Generation with Diffusion Guided Meta Agent
https://arxiv.org/abs/2408.12991
MarS: a Financial Market Simulation Engine Powered by Generative Foundation Model
https://arxiv.org/abs/2409.07486
相关链接:
https://mars-lmm.github.io/
https://github.com/microsoft/MarS
你也许还想看: