顶会ACL‘24录取的940篇论文中,LLM-Multi agent居于高频词榜单,热度不断攀升。而ICML’24也是如此,LLM-Multi agent无疑是今年的热点词。北大、中科院、微软等多个国内外权威研究团队都瞄准了这个方向。此外,Multi agent无需针对特定任务或场景进行额外的微调,对算力的需求大大降低,为科研人开辟了一条更高效的探索道路。
为了让大家更好的掌握LLM-Multi Agent发现创新点冲击2025顶会,研梦非凡于10月11日晚(周五),邀请了从事多模态大模型研究的王导师,为大家独家详解《LLM-Multi Agent推理能力提升新策略》(AI前沿直播课NO.73),主要讲解ICML高被引论文以及ACL'24的前沿研究,两篇论文。从LLMs面临的挑战,到多智能体辩论的方法与改进,重点讲解多智能体辩论过程,并具体演示代码,一节课速通多智能体辩论方法,发现论文idea。
凡预约即可免费领取200篇相关论文(20篇多智能体+70篇多模态+120篇大模型)
直播课课程大纲
《Improving Factuality and Reasoning in Language Models through Multiagent Debate》
一、研究背景
关注的问题 LLMs面临的挑战 多智能体辩论的方法
主要贡献
多智能体debate的方法 关于事实准确性的 benchmark 评估 debate 过程的生成表现
二、方法
多智能体辩论(Debate) 辩论过程(如图) 例子:一个数学问题的解决过程
思考
提高了多少推理能力? 提高了多少事实有效性? 什么设计可以让debate提高语言生成的表现?
三、实验分析
在六个推理、事实性和问答任务中评估了辩论方法的表现。 分析了辩论中代理人数量的影响、辩论回合数、辩论长度、初始化提示的不同方式以及使用不同语言模型的效果。 实验结果表明,辩论方法在提高推理和事实准确性方面优于单一模型基线。
凡预约即可免费领取200篇相关论文(20篇多智能体+70篇多模态+120篇大模型)
四、ACL‘24相关工作
《Rethinking the Bounds of LLM Reasoning: Are Multi-Agent Discussions the Key?》
研究背景
现有研究表明,多智能体讨论可以改善LLM的推理能力。本文重新评估了这一观点,通过系统实验提出了一种新的群体讨论框架。
方法
CMD框架 小组讨论阶段 投票阶段 最终决策阶段
实验分析
五、总结和展望
导师介绍
凡预约即可免费领取200篇相关论文(20篇多智能体+70篇多模态+120篇大模型)
研梦非凡科研论文指导
研梦非凡部分导师介绍
我们不是小作坊哦~我们背靠研途考研(就是张雪峰老师和徐涛老师在的那个研途考研),做教育十余年,重交付,重口碑,是我们一贯的公司理念!