成果｜大模型驱动的多智能体协作网络 MacNet，探究多智能体协作的Scaling Law

学术 2024-06-13 17:36 北京

近日，我组提出基于图结构的多智能体协作网络MacNet (Multi-Agent Collaboration Networks)，并对多智能体的协作缩放定律 (Collaborative Scaling Law) 进行了探究。

论文信息

多智能体协作网络 MacNet 示意图

➤ 论文地址

🔗https://arxiv.org/abs/2406.07155

➤ ChatDev链接

🔗https://github.com/OpenBMB/ChatDev

相关成果将开源到 ChatDev 项目，敬请期待。

研究背景

在迅速发展的人工智能领域，大语言模型（LLMs）因其卓越的语言能力在多个领域引发了变革性的转变，能够无缝整合广泛的世界知识。这一突破的核心在于神经缩放定律（Neural Scaling Law），即训练良好的神经网络通常表现出与神经元数量呈幂律尺度关系。在大模型基础之上，被赋予了工具使用、长期记忆、决策规划等高级功能的智能体（Agent）能够自主完成任务，展现出了更高层面的自主任务解决能力。近期，多智能体协作则进一步拓展了智能体能力，展现出群体超越单体的可能性。

受神经缩放定律的启发，一个自然的研究问题浮现：在多智能体协作中增加智能体数量是否会展现类似规律？研究协作缩放定律对于准确估计多智能体系统的计算资源与性能趋势之间的关系至关重要。这种理解有助于优化资源利用，最大限度地减少不必要的浪费，最终实现更具可扩展性、实用性和资源高效的智能体系统。

为了探究协作缩放定律，本文将多智能体系统建模为一个由专业智能体组成的有组织团队，研究它们在自主解决复杂问题时的相互依赖互动推理和集体智慧。通过设计适当的拓扑结构和有效的互动机制，旨在有效提高智能体系统的协同效率和可扩展性。

技术路线

技术上，通过有向无环图连接多智能体，通过拓扑排序路由它们的交互次序，并从其对话中获取解决方案。即给定任意一个有向无环图，策略性地将智能体部署在该图网络上：每一个节点被部署了一个助理智能体（Assistant），每一条边上部署了一个发令智能体（Instructor），据此构筑出多智能体协作网络MacNet。

左图：本文所采用的代表性拓扑结构

右图：在边和节点上部署不同的智能体

MacNet 采用拓扑顺序来引导智能体按照序列进行交互，使得交互信息在网络上进行“流动”。具体来说，针对每一条单独的边上的多名智能体，拓扑序列中前一个节点输出它的信息并交给发令智能体进行意见指引，发令智能体给出反馈后交与后续相邻的助手智能体进行解决方案的一次精炼。在信息传递时，MacNet仅抽取出智能体给出的解决方案（而不是全程对话）进行网络传输，极大降低超长上下文隐患，有效承载上千个智能体协同工作的同时不会超出上下文限定。

采用拓扑排序来引导智能体按序交互，使得交互信息在网络上进行“流动”

实验评估

不同拓扑结构下多智能体协作的缩放效应

实验评估中，本文在MMLU、HumanEval、SRDD、CommonGen-Hard四个数据集上进行了测试。作为默认设置的链式结构方法在大多数指标上始终优于所有基准方法，表现出显著的优势，实验结果也表明群体智能优于单智能体推理，因为后者相当于高维多智能体组合空间的特征“池化”，缺乏灵活性来探寻更优配置。

横向对比，不同的拓扑结构展现出了各自的优势；例如，链式拓扑更适合软件开发，而网状拓扑在逻辑选择方面表现出色；没有单一的拓扑结构能在所有任务中均显现最佳结果。进一步观察表明，有着较小平均路径长度的“小世界”拓扑结构往往表现出更优越的性能（称之为“小世界协作现象”）。与此同时，实验结果表明在智能体规模增长过程中，协作的性能表现大致呈现出Sigmoid形函数的趋势，且相较神经缩放法则更“早”被观测（即在较小规模体量下便可呈现出涌现效果）。

不同拓扑结构下多智能体协作的缩放效应

总结

本篇论文提出了多智能体协作网络 MacNet，以有向无环图的结构来组织多智能体协同工作，基于此网络对群体智能的协作缩放定律进行了初步研究，并针对六种经典的图结构进行了广泛实验，实验结果证明了本框架能够支持异构拓扑下的大规模智能体协同；同时还发现多智能体协作网在规模增大时表现出 “小世界协作现象”（越接近小世界网络属性的拓扑，其综合性能更优越）；此外，该研究归纳出了协同缩放法则，即缩放智能体量的综合性能大致遵循 Sigmoid 形趋势，相较神经缩放法则更 “早” 被观测。该结果有望为多智能体系统的资源预测和优化提供启发、并据此指导或改善未来智能体系统的效率和可扩展性。

相关工作成果

我组和面壁智能研究团队在智能体应用框架、单体智能和群体智能等技术上均有深入探索，是最早在 AI 智能体 (Agent) 底层技术上取得突破的人工智能队伍之一。目前已成功推出了大模型驱动的 Al Agent“三驾马车”：XAgent、AgentVerse 和 ChatDev。

➤ 查看往期推送了解更多智能体相关研究

🔗 新闻 | 我组联合面壁探索大模型驱动自动化软件开发ChatDev

🔗 成果｜多智能体经验迭代精炼框架——实现多智能体经验动态积累以增强任务解决能力

🔗 成果 | 大模型驱动的自主智能体与群体智能

🔗 成果｜我组提出多智能体学习框架：经验式共同学习，增强多智能体协作式软件开发能力

作者简介

/ 钱忱 /

论文主要作者

清华大学软件学院博士，现于清华大学自然语言处理实验室（THUNLP）担任博士后，清华大学水木学者，主要研究方向为预训练模型、自主智能体、群体智能；合作导师为孙茂松和刘知远教授，曾在ACL、SIGIR、ICLR、AAAI、CIKM等人工智能、信息管理、软件工程等相关的国际学术会议或期刊上以第一作者身份发表论文数篇。在群体智能方面，主持发布了大语言模型驱动的群体协作框架ChatDev、群体共学习范式Co-Learning、群体协同网络MacNet，并参与构建了用于任务完成和社会模拟的多智能体平台AgentVerse。其中ChatDev在世界影响力最大的开源平台 Github 上获得超过2.4万个星标关注，催生出了一系列以任务解决为导向的研究方向，受到了国内外众多知名学者和企业的高度评价，吴恩达（Andrew Ng）教授（人工智能和机器学习领域国际上最权威的学者之一）于2024年3月发表智能体方面的最新趋势与洞察，把ChatDev作为唯一代表性案例进行了重点论述。

🔥活动预告

6月14日下午，我组刘知远副教授和钱忱博士将出席智源大会Agent专题论坛。刘知远副教授将担任论坛主席，钱忱博士将以「大模型驱动的群体智能」为题作专题演讲，介绍大语言模型驱动的群体协作框架ChatDev、群体共学习范式Co-Learning 和群体协同网络MacNet等相关技术。届时大会将同步向全球线上直播。

➤ 官网预约线上直播

🔗 https://2024.baai.ac.cn/

线下地址：Agent论坛（万春厅）

会议时间：6 月 14 日下午

论坛主席丨主持人：刘知远 - 清华大学副教授、智源学者

时间

内容

13:25-13:30

论坛背景与嘉宾介绍

刘知远 | 清华大学副教授、智源学者

13:30-14:15

大模型驱动的群体智能

钱忱 | 清华大学博士后

14:15-15:00

AIOS：大模型智能体操作系统

张永锋 | 美国罗格斯大学计算机科学学院助理教授

15:00-15:45

Finding the scaling law of agents

李国豪 | CAMEL-AI.org

15:45-16:30

From Deep Reinforcement Learning to LLM-based Agents: Perspectives on Current Research

Stefano V. Albrecht | 爱丁堡大学助理教授

16:30-17:30

圆桌讨论

*最终安排以现场为主。

关于我们

清华大学自然语言处理与社会人文计算实验室（TsinghuaNLP）成立于 20 世纪七十年代末，是国内开展自然语言处理研究最早、深具影响力的科研单位，也是中国中文信息学会计算语言学专业委员会及中国人工智能学会因果与不确定性人工智能专业委员会的挂靠单位。实验室在学术总体带头人孙茂松教授及学术方向带头人刘洋教授、刘知远副教授的带领下，围绕以中文为核心的自然语言处理，在语言大模型、跨模态大模型、中文信息处理、机器翻译、知识图谱、智慧教育、社会人文和艺术计算等方面开展系统深入的研究，在国内外具有较大的学术影响。近年来，实验室承担了国家 973 项目、国家重点研发项目、国家社会科学基金重大项目等多项重要研究任务，并与腾讯、华为、搜狗等企业建立密切的学术合作关系。

Website：http://nlp.csai.tsinghua.edu.cn/

Email：thunlp@163.com

GitHub：https://github.com/thunlp

https://github.com/OpenBMB

Twitter：https://twitter.com/TsinghuaNLP

THUNLP 长期开放招聘

清华大学自然语言处理与社会人文计算实验室，是中国中文信息学会计算语言专业委员会和中国人工智能学会不确定性专业委员会的挂靠单位。负责人为清华大学计算机科学与技术系孙茂松教授，核心骨干为刘洋教授，刘知远副教授。

最新文章

招聘｜个性化学生成长助手“清小搭”团队实习生招募

新闻｜我组5篇论文成果被 COLING 2025 收录

新闻｜清华本科生习作集结成书《AI群星闪耀时》正式出版

成果｜打破传统轮次规则，MiniCPM-duplex双工模型助力即时交互

获奖｜我组博士毕业生陈驰学位论文入选2024年度中国中文信息学会“博士学位论文激励计划”

获奖｜我组与幂律智能、清华大学法学院联合研究成果荣获2024“钱伟长中文信息处理科学技术奖”一等奖

新闻｜我组博士后研究员李霜洁顺利出站

《语言战略研究》多人谈：学术的激烈交锋会促进科技的深入发展

获奖｜我组教师刘知远获2024年北京市高校青年教学名师奖

成果｜RAGEval：实现实际场景检索增强生成系统（RAG）的“精准诊断”

招聘｜清华NLP实验室博士后招聘

招聘｜清华NLP实验室招聘工具学习与自主智能体方向科研实习生

新闻｜我组7篇论文成果被NeurIPS 2024录用

新闻｜我组7篇论文成果被 EMNLP 2024 录用

预告｜CNCC 2024技术论坛：端侧大模型

新闻｜我组师生参加 ACL 2024 学术会议

获奖｜我组荣获英特尔中国学术成就奖

成果｜LEGENT：具身智能体开放平台

新闻｜我组6篇论文成果被 COLM 2024 录用

获奖｜我组多名毕业生顺利毕业，并获多项荣誉

经典大模型公开课第二季，梦幻回归

成果｜基于深度学习的多策略增强对联自动生成方法

成果 | 智能体互联网（IoA）：编织异构智能体的协同智能网络

获奖｜我组毕业生丁宁、姚远获2024世界人工智能大会云帆奖

招聘｜清华NLP实验室诚聘大模型英才

OpenBMB × Hugging Face × THUNLP，联袂献上经典大模型课

讲座预告｜夏梦舟：训练与对齐语言模型：目标与数据管理的算法进展

成果｜Seq1F1B：节省50%显存的长文本模型流水线并行训练技术

成果｜大模型驱动的多智能体协作网络 MacNet，探究多智能体协作的Scaling Law

招聘｜清华NLP实验室招聘法律智能方向博士后及科研实习生

新闻｜我组2篇论文成果被 ACL 2024 Demo 录用

成果｜多智能体经验迭代精炼框架——实现多智能体经验动态积累以增强任务解决能力

StableToolBench：稳定的工具学习评测数据集

MiniCPM-V 2.5：登顶HuggingFace和GitHub Trending榜双榜首

成果 | CODIS：评估多模态大模型结合上下文理解图像的能力

新闻｜我组多篇论文成果被 ACL 2024 收录

预告｜CCF ADL第146期讲习班周五开讲，欢迎广大学者报名

新闻｜我组师生参加ICLR 2024学术会议

新闻｜我组6篇论文成果被 ICML 2024 收录

获奖 | 我组师生参加“吴文俊人工智能科学技术奖”颁奖典礼

清华NLP实验室招聘大模型方向博士后及研究员

预告｜CCF ADL讲习班第146期 “大模型自主智能体与群体智能”

成果 | 大模型驱动的自主智能体与群体智能

成果｜ProSparse：打造更加稀疏高效的大模型

成果 | MatPlotAgent：大模型驱动的数据可视化智能体

新闻｜我组三篇论文成果被 CVPR 2024 收录

成果｜大语言模型只懂自然语言？AutoForm通过非自然语言形式提升智能体推理与沟通效率

获奖 | 我组博士生姚远获2023年度吴文俊人工智能科学技术奖优秀博士学位论文奖

成果｜OlympiadBench: Olympiad-level 的双语、多模态的科学评测集

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉