【大模型前沿】FinVision:一种用于股市预测的多智能体框架!

文摘   2024-11-19 16:12   广东  

01
FinVision:一种用于股市预测的多智能体框架

  • 论文地址:https://arxiv.org/abs/2411.08899

由芝加哥伊利诺伊大学的 Sorouralsadat Fatemi 和 Yuheng Hu 提出的 FinVision 框架,展示了一种多模态、多智能体系统在股票市场预测中的应用,具有显著的创新性和实用性。

图1:多模态多智能体预测框架

FinVision 的框架采用了一个基于 LLM 的专业智能体团队,每个智能体都擅长处理和解释各种形式的金融数据,如文本新闻报道、蜡烛图(K 线图)和交易信号图。这种多模态数据整合大大提高了模型的可解释性,使得交易决策过程更加透明。

FinVision 框架包含四个主要模块:总结模块、技术分析模块、反思模块和最终决策模块。每个模块都承担特定的功能,协同工作以提供全面的交易建议。

  • 总结模块的主要任务是从输入的文本数据中生成简洁且信息丰富的摘要。

  • 技术分析模块专注于从历史价格数据和技术指标(以图像形式呈现)中提取洞察。

  • 反思模块由两个部分组成,分别分析过去的交易表现和信号。

  • 最终決策模块负责综合前几个模块的分析结果,生成具体的交易建议。

FinVision 的一个主要特点是集成了反思模块,对历史交易信号及其结果进行分析。这一反思过程有助于增强系统对未来交易情景的决策能力。

此外,消融研究表明,反思模块在增强该框架的决策能力方面发挥着关键作用。

实验结果表明,FinVision 框架在年化收益率和夏普比率方面表现优于市场的买入并持有策略,特别是在 AAPL 和 MSFT 这两个股票上。其在 AMZN 上的表现虽然略低于市场,但在风险调整后的表现上显著优于基准模型。这些结果表明,Finvision 框架在保持竞争力回报的同时,有效地管理了风险。

通过与基准模型的比较,FinVision 在所有评估的股票中表现出显著优势,特别是与传统的买入并持有策略和基于强化学习的模型相比。PPO 和 DQN 模型在多个指标上表现不佳,而 Finvision 通过集成多种数据类型和反思模块,展示了其在捕捉复杂市场动态方面的优越性。



02
综述:智能体的安全、隐私和道德威胁

  • 论文地址:https://arxiv.org/pdf/2411.09523

随着大语言模型(LLMs)的不断发展,基于 transformer 的模型在众多自然语言处理(NLP)任务中取得了突破性进展,从而出现了一系列使用 LLMs 作为控制中枢的智能体。

虽然 LLM 在各种任务中取得了成功,但它们也面临着许多安全和隐私威胁,而这些威胁在智能体场景中变得更加严重。为了提高基于 LLM 的应用的可靠性,出现了一系列从不同角度评估和减轻这些风险的研究。

为了帮助研究人员全面了解各种风险,来自浙江大学的研究团队及其合作者收集并分析了这些智能体所面临的不同威胁。为了应对以往分类法在处理跨模块和跨阶段威胁方面的挑战,他们提出了一种基于来源和影响的新型分类框架。

图1. 基于 LLM 的智能体风险分类法的总体框架。

图2. 基于 LLM 的智能体的总体框架。

此外,他们还确定了基于 LLM 的智能体的六个关键特征,并在此基础上总结了当前的研究进展,分析了其局限性。

图 3. 基于 LLM 的智能体的六个主要特征:基于 LLM 的控制器、多模式输入和输出、多源输入、多轮交互、记忆机制和工具调用。

随后,他们选择了四个具有代表性的智能体作为案例,分析它们在实际使用中可能面临的风险。

最后,基于上述分析,他们分别从数据、方法和政策的角度提出了未来的研究方向。



03
SEALONG:大语言模型可在长上下文推理中自我提高

  • 论文地址:https://arxiv.org/pdf/2411.08147

  • 项目地址:https://github.com/SihengLi99/SEALONG

大语言模型(LLM)在处理长上下文方面取得了长足的进步,但在长上下文推理方面仍很困难。现有的方法通常涉及用合成数据对 LLM 进行微调,这依赖于人类专家或 GPT-4 等高级模型的注释,从而限制了进一步的发展。

为了解决这个问题,来自香港中文大学的研究团队及其合作者研究了 LLM 在长上下文推理中自我提高的潜力,并提出了一种专门为此设计的方法——SEALONG

这种方法简单明了:他们对每个问题的多个输出进行采样,用最小贝叶斯风险(Minimum Bayes Risk)对它们进行评分,然后根据这些输出应用有监督的微调或偏好优化。

在几个领先的 LLM 上进行的广泛实验证明了 SEALONG 的有效性,Llama-3.1-8B-Instruct 的绝对值提高了4.2分。此外,与之前依赖于人类专家或高级模型生成的数据的方法相比,SEALONG 实现了更优越的性能。

HsuDan
拥抱AI技术,分享人工智能、机器学习、数据分析等多个领域的优质资讯、学习资源、实践案例、开源项目及开发工具。
 最新文章