一个充满多智能体的数字社会正在浮现，商业的底层逻辑已进入重构倒计时

文摘科技 2023-09-16 16:31 云南

序

从Lilian Weng的《LLM Powered Autonomous Agents》让我们初步了解，基于大型语言模型的AI-Agents systems是一个什么样的架构形式，从单一智能体的Planning \Tools\Memory\Action四大构成部分，让我们初步理解了智能体作为一种迈向为了通用人工智能应用的一种可能形态，我们似乎可以借助智能体处理我们日常工作中的一切问题；

在谷歌与斯坦福的研究员联合发表的《Generative Agents: Interactive Simulacra of Human Behavior》的论文中，我们看到的以大型语言模型驱动的，多智能体在沙盒环境中的可能发展形态，25个小镇居民NPC的背后是由25个智能体驱动，在沙盒环境中，围绕日常生活展开一系列的交互行为，无论是工作还是生活，智能体都在小镇沙盒中展开了完全自主驱动的自动化行为。事实上，学术领域展开了进一步的探讨，我们将能够摘取智能体在沙盒环境中的劳动结果。

事实上，随着AGI技术愿景的驱动，大型语言模型将进一步重构整个互联网成为智能网络时，智能体将成为人类与智能网络，建立交互协作的一个关键，具有自主性的智能体将遍布整个智能网络，多智能体协作网络，将会成为改变我们未来社会生产关系的核心力量。

正如超级个体与一人公司的叙事崛起，正是由于人类掌握了智能体团队，参与到智能体协作网络中，实现更高效的生产效益。如果我们要提前未来的社会形态如何，未来的商业规律如何，我们必须深刻理解，什么是多智能体，多智能体如何更好地帮助人类实现自动化工作，如何帮助整个社会如何做出更好地发展决策？

未来已来，一个遍布智能体的数字社会正在浮现。本次推荐的十篇论文，将有助于你理解多智能体对我们未来的影响，以及将通过何种方式陆续呈现。

Part.1

MetaGPT: 多智能体协同框架的元编程

论文标题：MetaGPT: Meta Programming for Multi-Agent Collaborative Framework

论文地址：https://arxiv.org/pdf/2308.00352.pdf

最近，通过使用大型语言模型（LLMs）驱动的多智能体，自动任务解决取得了显著进展。然而，现有基于LLM的多智能体工作主要集中在解决简单的对话任务上，很少研究复杂任务，主要是由于LLM幻觉问题。这种幻觉问题在天真地链接多个智能代理时会成倍增加，导致无法有效解决复杂问题。因此，我们引入了MetaGPT，这是一个创新性的框架，将高效的人类工作流程作为元编程方法融入基于LLM的多智能体协作中。

具体而言，MetaGPT将标准化操作流程（SOPs）编码为提示，以增强结构化协调。随后，它要求模块化输出，赋予代理人与人类专业人员相媲美的领域专业知识，以验证输出并最小化累积错误。通过这种方式，MetaGPT利用了装配线范式，为各种智能体分配不同的角色，从而建立了一个可以有效且协调地解构复杂多智能体协作问题的框架。

我们在协作软件工程基准测试上的实验表明，与现有的基于聊天的多智能体系统相比，MetaGPT生成了更连贯和正确的解决方案。这凸显了将人类领域知识整合到多智能体系统中的潜力，从而为解决复杂的现实世界挑战创造了新机会。

本项目的GitHub存储库可在以下链接上公开访问：https://github.com/geekan/MetaGPT。

Part.2

GPT 循环：多智能体系统的自适应决策

论文标题：GPT-in-the-Loop: Adaptive Decision-Making for Multiagent Systems

论文地址：https://arxiv.org/pdf/2308.10435.pdf

本论文介绍了一种新颖的方法，称为“GPT-in-the-loop”方法，它将大型语言模型（LLMs）如Generative Pretrained Transformers (GPT)的高级推理能力与多智能体（MAS）系统相结合。与通常需要长时间培训过程的传统自适应方法不同，我们的框架采用了GPT-4以提高问题解决和解释能力。

我们的实验背景是智能路灯物联网（IoT）应用。在这里，代理使用传感器、执行器和神经网络创建节能照明系统。通过集成GPT-4，这些代理实现了卓越的决策能力和适应性，无需进行大量培训。我们将这种方法与传统的神经进化方法以及软件工程师提供的解决方案进行了比较，突显了GPT驱动的多智能体系统在IoT中的潜力。

在结构上，本文概述了将GPT整合到物联网（IoT）驱动框架（FIoT）中，介绍了我们提出的GPT-in-the-loop方法，在IoT上下文中呈现了比较结果，并以见解和未来方向作出了总结。

关键词：GPT-in-the-loop，LLM-in-the-loop，多智能体系统（MAS），自适应，Generative pre-trained transformer（GPT）。

Part.3

使用大语言模型模块化地构建合作体验智能体

论文标题：Building Cooperative Embodied Agents Modularly with Large Language Models

论文地址：https://briefgpt.xyz/a/2307.02485

大型语言模型（LLMs）已经在各个领域的单一智能体具体任务中展示出令人印象深刻的规划能力。然而，它们在多智能体合作中的规划和沟通能力仍然不清楚，尽管这些是智能具体智能体关键的技能。

在本文中，我们提出了一个新颖的框架，利用LLMs进行多智能体合作，并在不同的具体环境中进行测试。我们的框架使具体智能体能够有效地规划、沟通和与其他具体智能体或人类合作，以完成长期任务。我们证明了最近的LLMs，如GPT-4，可以在不需要精细调整或少量提示的情况下超越强大的基于规划的方法，并使用我们的框架展示出新兴的有效沟通能力。

我们还发现，使用自然语言进行沟通的LLM基础的代理可以赢得更多的信任并更有效地与人类合作。我们的研究强调了LLMs在具体智能体领域的潜力，并为未来的多智能体合作研究奠定了基础。

有关视频可以在项目网站https://vis-www.cs.umass.edu/Co-LLM-Agents/ 上找到。

Part.4

基于自适应大型语言模型（LLM）的多智能体系统

论文标题：Self-Adaptive Large Language Model (LLM)-Based Multiagent Systems

论文地址：https://briefgpt.xyz/a/2307.06187

在自主计算中，自适应已被提出作为管理多智能体系统（MASs）复杂性的基本范 paradigm。通过扩展一个系统以支持监控和自适应自身以实现特定的关注点，这一目标得以实现。

在涉及代理互动的场景中，这些系统中的通信至关重要，因为它通过实现直接、清晰的信息交流，增强了合作并减少了协调挑战。然而，改进与MASs的交互通信的表达能力并非没有挑战。在这方面，自适应系统与有效沟通之间的相互作用对于未来MAS的进展至关重要。在本文中，我们提出将大型语言模型（LLMs）如基于GPT的技术集成到多智能体系统中。

我们将我们的方法基于MAPE-K模型，该模型以其在监控、分析、规划和执行系统自适应以响应动态环境方面的强大支持而闻名。我们还提供了所提出方法的实际示例，其中我们实施和评估了一个基于MAS的基本应用程序。该方法通过提出一种基于LLM能力的自主系统的MAS自适应的新范 paradigm，显著推进了自适应系统的最新技术水平。

关键词—自适应、软件开发、多智能体系统、MAPE-K、大型语言模型、通用技术。

Part.5

AgentVerse：促进多智能体协作并探索智能体的 emergent behaviors

论文标题：AgentVerse: Facilitating Multi-Agent Collaboration and Exploring Emergent Behaviors in Agents

论文地址：https://arxiv.org/pdf/2308.10848.pdf

论文概述：由大型语言模型（LLMs）赋能的自主代理经历了显著的改进，使它们能够在广泛的任务范围内进行泛化。然而，在现实世界的情景中，个体之间的合作通常是为了增强任务完成的效率和效果而必要的。

因此，受到人类群体动态的启发，我们提出了一个多智能体框架AGENTVERSE，它可以协同并动态地调整其构成，形成一个大于部分之和的系统。我们的实验表明，AGENTVERSE框架可以有效地部署多智能体群体，胜过单一代理。此外，我们深入探讨了在协作任务完成过程中个体代理之间的社会行为的出现。

鉴于这些行为，我们讨论了一些可能的策略，以利用积极的行为并减轻消极行为，以提高多智能体群体的协作潜力。我们的AGENTVERSE代码将很快发布在https://github.com/OpenBMB/AgentVerse。

Part.6

ChatEval：基于多智能体辩论的 LLM 评估器改进

论文标题：ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate

论文地址：https://arxiv.org/pdf/2308.07201.pdf

文本评估在历史上一直面临着重大挑战，通常需要大量的人力和时间成本。随着大型语言模型（LLMs）的出现，研究人员开始探索LLMs作为人工评估替代方法的潜力。虽然这些基于单一代理的方法显示出前景，但实验结果表明需要进一步的改进来弥合它们当前的有效性与人工评估质量之间的差距。

鉴于人工评估过程的最佳实践通常涉及多个人工标注者协作进行评估，我们采用了一种多智能体辩论框架，超越了单一代理的提示策略。多智能体的方法使一组LLMs能够与各种智能对手协同合作，利用他们独特的能力和专业知识，提高处理复杂任务的效率和效果。

在本文中，我们构建了一个名为ChatEval的多智能体裁判团队，用于自主讨论和评估不同模型在开放式问题和传统自然语言生成（NLG）任务中生成的响应的质量。我们从人类发起团队讨论进行头脑风暴的实际情景中提取见解和经验，并在ChatEval中提出不同的沟通策略。我们在两个基准任务上的实验表明，ChatEval在准确性和与人工评估一致性方面表现出卓越的性能。

此外，我们发现在多智能体辩论过程中，不同角色的提示（不同的人物角色）是必不可少的；也就是说，在提示中使用相同的角色描述可能导致性能下降。我们的定性分析还显示，ChatEval超越了纯文本评分，提供了可靠评估的模仿人类评估过程。

我们的代码可在https://github.com/chanchimin/ChatEval 上获得。

Part.7

一种多智能体框架，用于异步和协作扩展多任务机器学习系统

论文标题：A Multiagent Framework for the Asynchronous and Collaborative Extension of Multitask ML Systems

论文地址：https://arxiv.org/pdf/2209.14745.pdf

论文概述：传统的机器学习开发方法不允许大量不同目标的贡献者集体共同创建和扩展共享智能系统。启用这种协作方法可以加速创新速度，增加机器学习技术的可访问性，并促使新的能力出现。

我们认为，通过模块化表示机器学习模型和定义新的抽象，允许实现和执行各种方法来异步使用和扩展模块化智能系统，可以展示这种新颖的机器学习开发方法。我们提出了一个多智能体框架，用于协同和异步扩展动态的大规模多任务系统。

Part.8

通过多智能体辩论提高语言模型的事实性和推理能力

论文标题：Improving Factuality and Reasoning in Language Models through Multiagent Debate

论文地址：https://arxiv.org/pdf/2305.14325.pdf

论文概述：近年来，大型语言模型（LLMs）在语言生成、理解和少样本学习方面展示出了显著的能力。大量研究工作已经探讨了如何通过提示工具进一步提高它们的性能，包括验证、自我一致性或中间草稿。

ji'ogu在本文中，我们提出了一种补充性的方法，以改善语言响应，其中多个语言模型实例提出并讨论它们的个体响应和推理过程，经过多轮辩论最终得出共同的最终答案。我们的研究结果表明，这种方法显著提高了在多个任务中的数学和战略推理能力。我们还证明了我们的方法提高了生成内容的事实准确性，减少了当代模型容易产生的错误答案和幻觉。我们的方法可以直接应用于现有的黑盒模型，并对我们调查的所有任务使用相同的过程和提示。

总的来说，我们的研究结果表明，这种“思维之社”方法有潜力显著提升LLMs的能力，并为语言生成和理解领域的进一步突破铺平了道路。项目网站位于https://composable-models.github.io/llm_debate/。

Part.9

团队体育分析中的多智能体挑战

论文标题：Presenting Multiagent Challenges in Team Sports Analytics

论文地址：https://arxiv.org/pdf/2303.13660.pdf

本文探讨了团队体育分析领域的若干挑战和机遇与多智能体系统（MAS）关键研究领域之间的相关性。我们具体考虑了入侵类比赛，这些比赛被定义为球员侵入对方团队领地并可以在比赛场地上的任何地方进行互动的比赛，如冰球、足球和篮球。

我们认为MAS非常适合研究入侵类比赛，并将使MAS和体育分析领域都受益。我们的讨论突出了在两个方向上进行MAS实施和进一步发展的领域：短期比赛策略（教练）和长期团队规划（管理）。

Part.10

网络代理的去中心化多智能体强化学习：最新进展

论文标题：Decentralized Multi-Agent Reinforcement Learning with Networked Agents: Recent Advances

论文地址：https://arxiv.org/pdf/1912.03821.pdf

论文概述：多智能体强化学习（MARL）长期以来一直是机器学习和控制领域的一个重要且持久的研究课题。随着最近单一智能体深度强化学习的发展，人们对开发新的MARL算法产生了兴趣复苏，尤其是那些经过理论分析支持的算法。

在本文中，我们回顾了这个主题的一个子领域的一些最新进展：具有网络化智能体的分散MARL。具体而言，多个智能体在共同的环境中进行顺序决策，而没有任何中央控制器的协调。相反，允许智能体在通信网络上与它们的邻居交换信息。这种设置在机器人、无人车辆、移动传感器网络和智能电网的控制和运营中有广泛的应用。

这个回顾基于我们在这个方向上的一些研究努力，以及其他研究人员在这个领域取得的一些进展。我们希望这个回顾能激发更多的研究力量投入到这个充满挑战但令人兴奋的领域。

关键词：强化学习；多智能体/网络系统；共识/分布式优化；博弈论。

end

📢 AI-Agents前沿观察站

AI-Agents前沿观察站是一个围绕AI-Agents这一方向进行前沿探索与观察的社群，随着更多Agents项目开源，近期也将展开更多的商业合作，以及具有建设性的主题交流，符合以下四个身份的朋友可申请加入：

1，AI-Agents的应用开发者

2，LLM算法工程师；

3，学术研究者；

4，AI-Agents技术背景出身的创业者；

*这是一个具有学术研究到工程应用落地的社区，兴趣爱好者勿扰。目前仅限投身于Agents领域研究与建设的朋友可进；

请加微信Z10850，备注：AI-Agents，（申请加群请做自我介绍，谢谢）

其他相关阅读

算法驱动的市场经济政策，智能体如何帮助人类实现经济利益最大化

AI智能体与人类的未来协作方式、合作组织与生产空间（万字长文）

多智能体革命，人类将如何沦为被AI支配的低端劳动力

如果你在多智能体时代，成为超级个体并经营一人公司感兴趣，

请看下文链接》

超级个体成长计划第三期：如何组建AI团队并经营一人公司，实现可持续发展之道

http://mp.weixin.qq.com/s?__biz=Mzg2NzEyMjY1OA==&mid=2247487762&idx=1&sn=4dddef1acabd76e76bee437ab0451ca6

VION WILLIAMS

推动人类文明的进步与发展

最新文章

Attention is Not You Need：论量化社区公共贡献的治理悖论

超越数字游民的新叙事，论AI时代的青年将何去何从？

让 AI 时代的青年人联合起来！在创造中实现解放！

Sora深度研究空间与“Sora卷王”研究小组

9场干货拉满的Workshop，助你找到AI+Web3的发展之道

超越技术的界限：AI+Web3的未来发展之道 | 2万字全文

Vision Pro即将掀起内容经济的商业革命：Workshop如何构建注意力资产

5 场干货Workshop 带你深入了解AI+Web3，抓住 2024 发展机遇

WS-02：使用三种概念史时间分析法，建立AI+Web3的100个关键概念知识图谱

WS-01：构建AI+Web3的价值分析光谱/5大赛道10个项目的案例分析

Workshop Part-1：如何设计AI+Web3的价值分析光谱/如何理解AI+Web3的价值

AI+Web3的可能性：一场深度干货的研究型WorkShop

Gen AI的下一代计算平台：空间计算 Spatial Computing 完整指南

Super-X Plan 4.1 ：探索基于AI-Agents的人类工作技能的协同发展与增强系统

从认知行为学看人类如何借助AI-Agents实现技能学习的协同进化

人工智能崛起的时代，我们需要什么样的科技叙事

元宇宙对宗教互动仪式的超越性，论AGI时代的人类精神世界

多智能体古城大理黑客松项目暂缓延期，以及AI+X World Tour 大理站的活动调整

AI+X World Tour 2023-2024，叙事如何让科技变得更好

Magic Science：叙事小组课程与活动更新

未来已来！超级个体、一人公司、智能体社会等前沿科技叙事，将在大理落地为现实！

Super-X Plan 4.0：与MindOS携手创建你的智能体团队，打造个人商业变现新模式

基于多模态大模型的多智能体，将如何改变人类在城市的生存方式

【版本更新】Super-X Plan _ 3.1 版本 / 超级个体计划更名为Super-X Plan

【万字长文】中国年轻一代科技从业者，将如何改变全球AI发展格局

一个充满多智能体的数字社会正在浮现，商业的底层逻辑已进入重构倒计时

超级个体成长计划第三期：如何组建AI团队并经营一人公司，实现可持续发展之道

科技叙事魔法研究：AGI超级个体的顶级成长叙事/构建用户社区的底层叙事逻辑

科技叙事魔法班：科技行业如何讲好品牌故事

算法驱动的市场经济政策，智能体如何帮助人类实现经济利益最大化

AI智能体与人类的未来协作方式、合作组织与生产空间（万字长文）

超级个体公开课第一期（PPT版）：超级个体与AI-Agents如何实现自动工作

职业能力模型化是搭建AI工作流的前提条件，也是构建AI-Agents团队实现自动化任务执行的必要因素。在当下的科技大时代，技术如何赋能个体更好地发展，如何经营未来的一人公司事业，如何研究与了解未来的商业合作与发展模式，可以通过AGI超级个体的科普课与咨询课，进行了解与掌握。参加方式，详见海报。

科技浪潮下如何与时代共处？NCC「AI共学小组」招募开启，探索重新出发的路

多智能体革命，人类将如何沦为被AI支配的低端劳动力

中国为何缺乏引领科技创新的叙事能力

10篇值得一看AI论文，助你洞察AI-Agents与人类的情感共生关系

Think about Web3 with AGI：AI-Agents如何实现DAO的自动化治理

10个具有代表性的AI-Agents，将如何改变互联网/重塑Web3

AGI科技叙事·内容IP共学小组（招募）

十篇高质量的AI-Agents相关论文，让AI教你认识AI-Agents

A16Z联合创始人眼中的美好AI，却被马斯克讽刺“AI距离杀死人类还有多少年？”

AGI与Web3时代，14岁弃学的00后如何活出你未曾想过的精彩？

OpenAI对超级智能的治理，初窥AGI时代的公共治理之道

Planning for AGI and beyond：OpenAI的未来规划

「全球首发」NFT如何赋能DAO的BUILDer，MultiPass如何实现DAO的权益互通性

ChatGPT的“言出法随”如何改变人类的世界观

如何通过Web3在元宇宙中打造出一个伟大的品牌「巅峰之作」

Web3品牌符号「大爆炸」：从小径分岔的花园到赛博朋克大都会

驱散DAO的战争迷雾：批判与重建Vitalik的DAO定义/寻找DAO的未来发展命运

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉