论文地址:https://arxiv.org/abs/2411.08899
由芝加哥伊利诺伊大学的 Sorouralsadat Fatemi 和 Yuheng Hu 提出的 FinVision 框架,展示了一种多模态、多智能体系统在股票市场预测中的应用,具有显著的创新性和实用性。
图1:多模态多智能体预测框架
FinVision 的框架采用了一个基于 LLM 的专业智能体团队,每个智能体都擅长处理和解释各种形式的金融数据,如文本新闻报道、蜡烛图(K 线图)和交易信号图。这种多模态数据整合大大提高了模型的可解释性,使得交易决策过程更加透明。
FinVision 框架包含四个主要模块:总结模块、技术分析模块、反思模块和最终决策模块。每个模块都承担特定的功能,协同工作以提供全面的交易建议。
总结模块的主要任务是从输入的文本数据中生成简洁且信息丰富的摘要。
技术分析模块专注于从历史价格数据和技术指标(以图像形式呈现)中提取洞察。
反思模块由两个部分组成,分别分析过去的交易表现和信号。
最终決策模块负责综合前几个模块的分析结果,生成具体的交易建议。
FinVision 的一个主要特点是集成了反思模块,对历史交易信号及其结果进行分析。这一反思过程有助于增强系统对未来交易情景的决策能力。
此外,消融研究表明,反思模块在增强该框架的决策能力方面发挥着关键作用。
实验结果表明,FinVision 框架在年化收益率和夏普比率方面表现优于市场的买入并持有策略,特别是在 AAPL 和 MSFT 这两个股票上。其在 AMZN 上的表现虽然略低于市场,但在风险调整后的表现上显著优于基准模型。这些结果表明,Finvision 框架在保持竞争力回报的同时,有效地管理了风险。
通过与基准模型的比较,FinVision 在所有评估的股票中表现出显著优势,特别是与传统的买入并持有策略和基于强化学习的模型相比。PPO 和 DQN 模型在多个指标上表现不佳,而 Finvision 通过集成多种数据类型和反思模块,展示了其在捕捉复杂市场动态方面的优越性。
论文地址:https://arxiv.org/pdf/2411.09523
随着大语言模型(LLMs)的不断发展,基于 transformer 的模型在众多自然语言处理(NLP)任务中取得了突破性进展,从而出现了一系列使用 LLMs 作为控制中枢的智能体。
虽然 LLM 在各种任务中取得了成功,但它们也面临着许多安全和隐私威胁,而这些威胁在智能体场景中变得更加严重。为了提高基于 LLM 的应用的可靠性,出现了一系列从不同角度评估和减轻这些风险的研究。
图2. 基于 LLM 的智能体的总体框架。
图 3. 基于 LLM 的智能体的六个主要特征:基于 LLM 的控制器、多模式输入和输出、多源输入、多轮交互、记忆机制和工具调用。
最后,基于上述分析,他们分别从数据、方法和政策的角度提出了未来的研究方向。
论文地址:https://arxiv.org/pdf/2411.08147
项目地址:https://github.com/SihengLi99/SEALONG
为了解决这个问题,来自香港中文大学的研究团队及其合作者研究了 LLM 在长上下文推理中自我提高的潜力,并提出了一种专门为此设计的方法——SEALONG。
这种方法简单明了:他们对每个问题的多个输出进行采样,用最小贝叶斯风险(Minimum Bayes Risk)对它们进行评分,然后根据这些输出应用有监督的微调或偏好优化。
在几个领先的 LLM 上进行的广泛实验证明了 SEALONG 的有效性,Llama-3.1-8B-Instruct 的绝对值提高了4.2分。此外,与之前依赖于人类专家或高级模型生成的数据的方法相比,SEALONG 实现了更优越的性能。