【大模型前沿】FinVision：一种用于股市预测的多智能体框架！

文摘 2024-11-19 16:12 广东

FinVision：一种用于股市预测的多智能体框架

论文地址：https://arxiv.org/abs/2411.08899

由芝加哥伊利诺伊大学的 Sorouralsadat Fatemi 和 Yuheng Hu 提出的 FinVision 框架，展示了一种多模态、多智能体系统在股票市场预测中的应用，具有显著的创新性和实用性。

图1：多模态多智能体预测框架

FinVision 的框架采用了一个基于 LLM 的专业智能体团队，每个智能体都擅长处理和解释各种形式的金融数据，如文本新闻报道、蜡烛图（K 线图）和交易信号图。这种多模态数据整合大大提高了模型的可解释性，使得交易决策过程更加透明。

FinVision 框架包含四个主要模块：总结模块、技术分析模块、反思模块和最终决策模块。每个模块都承担特定的功能，协同工作以提供全面的交易建议。

总结模块的主要任务是从输入的文本数据中生成简洁且信息丰富的摘要。
技术分析模块专注于从历史价格数据和技术指标（以图像形式呈现）中提取洞察。
反思模块由两个部分组成，分别分析过去的交易表现和信号。
最终決策模块负责综合前几个模块的分析结果，生成具体的交易建议。

FinVision 的一个主要特点是集成了反思模块，对历史交易信号及其结果进行分析。这一反思过程有助于增强系统对未来交易情景的决策能力。

此外，消融研究表明，反思模块在增强该框架的决策能力方面发挥着关键作用。

实验结果表明，FinVision 框架在年化收益率和夏普比率方面表现优于市场的买入并持有策略，特别是在 AAPL 和 MSFT 这两个股票上。其在 AMZN 上的表现虽然略低于市场，但在风险调整后的表现上显著优于基准模型。这些结果表明，Finvision 框架在保持竞争力回报的同时，有效地管理了风险。

通过与基准模型的比较，FinVision 在所有评估的股票中表现出显著优势，特别是与传统的买入并持有策略和基于强化学习的模型相比。PPO 和 DQN 模型在多个指标上表现不佳，而 Finvision 通过集成多种数据类型和反思模块，展示了其在捕捉复杂市场动态方面的优越性。

综述：智能体的安全、隐私和道德威胁

论文地址：https://arxiv.org/pdf/2411.09523

随着大语言模型（LLMs）的不断发展，基于 transformer 的模型在众多自然语言处理（NLP）任务中取得了突破性进展，从而出现了一系列使用 LLMs 作为控制中枢的智能体。

虽然 LLM 在各种任务中取得了成功，但它们也面临着许多安全和隐私威胁，而这些威胁在智能体场景中变得更加严重。为了提高基于 LLM 的应用的可靠性，出现了一系列从不同角度评估和减轻这些风险的研究。

为了帮助研究人员全面了解各种风险，来自浙江大学的研究团队及其合作者收集并分析了这些智能体所面临的不同威胁。为了应对以往分类法在处理跨模块和跨阶段威胁方面的挑战，他们提出了一种基于来源和影响的新型分类框架。

图1. 基于 LLM 的智能体风险分类法的总体框架。

图2. 基于 LLM 的智能体的总体框架。

此外，他们还确定了基于 LLM 的智能体的六个关键特征，并在此基础上总结了当前的研究进展，分析了其局限性。

图 3. 基于 LLM 的智能体的六个主要特征：基于 LLM 的控制器、多模式输入和输出、多源输入、多轮交互、记忆机制和工具调用。

随后，他们选择了四个具有代表性的智能体作为案例，分析它们在实际使用中可能面临的风险。

最后，基于上述分析，他们分别从数据、方法和政策的角度提出了未来的研究方向。

SEALONG：大语言模型可在长上下文推理中自我提高

论文地址：https://arxiv.org/pdf/2411.08147
项目地址：https://github.com/SihengLi99/SEALONG

大语言模型（LLM）在处理长上下文方面取得了长足的进步，但在长上下文推理方面仍很困难。现有的方法通常涉及用合成数据对 LLM 进行微调，这依赖于人类专家或 GPT-4 等高级模型的注释，从而限制了进一步的发展。

为了解决这个问题，来自香港中文大学的研究团队及其合作者研究了 LLM 在长上下文推理中自我提高的潜力，并提出了一种专门为此设计的方法——SEALONG。

这种方法简单明了：他们对每个问题的多个输出进行采样，用最小贝叶斯风险（Minimum Bayes Risk）对它们进行评分，然后根据这些输出应用有监督的微调或偏好优化。

在几个领先的 LLM 上进行的广泛实验证明了 SEALONG 的有效性，Llama-3.1-8B-Instruct 的绝对值提高了4.2分。此外，与之前依赖于人类专家或高级模型生成的数据的方法相比，SEALONG 实现了更优越的性能。

HsuDan

拥抱AI技术，分享人工智能、机器学习、数据分析等多个领域的优质资讯、学习资源、实践案例、开源项目及开发工具。

最新文章

DeepSeek-R1 成为首个与OpenAI o1比肩的开源推理模型！

首份《人工智能安全指数报告》发布，Anthropic 获得最高安全评级，中国智谱上榜

9h打通顶会壁垒！实现1天内复现任意顶会文章！

【最新开源】VITA-1.5：实时视觉与语音交互，1.5秒互动延迟

【2024年终总结】2024 年最具影响力的AI论文 Part 1

60k感知算法岗面试，考察热门Occ算法及难点！

【2024年终总结】2024年“大模型 & AI应用”值得推荐的好书

【2024年终总结】2024年最值得读的 AI 论文

【2024年终总结】2024年AI大模型总结报告|Artificial Analysis

Artificial Analysis：2024年AI大模型总结报告

端侧AI | 小模型 | SLM（11月-12月）

智源发布 FlagEval 全球100+大模型综合评测结果！国产大模型拿下多个冠军！

NeurIPS 2024 最佳论文揭晓！北大、字节跳动「VAR模型」获最佳论文！

国内“推理模型”卷疯了！类 o1 推理模型，谁更强？

中国生成式AI大会即将登陆上海，全解大模型、AI Infra、端侧AI、视频生成和具身智能，40+位重磅嘉宾抢先看！

吴恩达开源大模型套件 aisuite：一个接口，可调用11个模型平台

清华、北大团队推出 LLaVA-o1：首个自发性视觉 AI 模型

Mistral AI 再发力！最强开源多模态模型 Pixtral Large！对标ChatGPT全面升级le Chat！

【大模型前沿】FinVision：一种用于股市预测的多智能体框架！

【必读】2024 人工智能全景报告《State of AI Report 2024》

最强表格AI问世，浙大开源 TableGPT2！

ChatGPT“频频翻车”，国内「AI搜索」新高度，天工、知乎「专业搜索」很能打！

刚刚，ChatGPT变身”AI搜索”，免费用！

最新开源：英伟达开源Nemotron 70B刷爆SOTA，仅次于o1！

大模型前沿|MLLM篇：苹果多模态模型大升级！首个开源MLLM通用评测器LLaVA-Critic！

大模型前沿|MLLM篇：港科大团队提出PVIT；苹果推出MM-Ego；北大将MLLM作为检索器；首个开源MLLM通用评测器...

6天6奖！2024年诺贝尔奖花落谁家？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉