北大校友打造的1000个智能体「我的世界」，背后原理揭晓了！

科技 2024-11-06 17:25 广东

来源：量子位

团队全新公开35页技术报告，详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……

其中最精彩的，当数团队整活儿：

让牧师NPC引入虚拟宗教，最后发现该宗教在500个智能体（横跨6大城乡）中进行了广泛传播。

据介绍，项目整体由一个名为PIANO的架构提供支持，它核心解决多智能体交互问题，用于确保多个输出流的一致性。

接下来，团队使用受人类历史启发的文明基准，来分别评估单个智能体和多智能体的行为表现。

出人意料的是，在投放了30个初始配置完全相同的智能体后，一群AI经过一番互相试探，最终竟产生了社会分工。

而在更大范围内，有关舞蹈、生态意识和恶作剧等话题的讨论表明，多智能体在不同区域竟形成了不同文化圈。

看完这些，难怪有网友惊呼：

我们生活在模拟矩阵中，未来就是现在。

全新PIANO架构

这个项目代号Sid，由北大校友、MIT教授Robert Yang发起，最终目标是将智能体无缝整合进人类社会中。

前一阵，团队展示了由GPT-4驱动的1000个智能体如何在「我的世界」中创建新文明，当时就引发大量关注。

不过对Sid团队来说，这离最终目标还很远，其交互范围和复杂性仍然有限。

按他们的话来说：

目前单个智能体在自主决策和执行上已经有了很大提升，但构建能够自发社交互动甚至共同进步的智能体仍然是一项根本挑战。

与此同时，靠大模型驱动的智能体也存在诸多问题。

比如，即使配备了用于规划和反思的模块，智能体也经常陷入重复，甚至在幻觉积累到一定程度后出现错误。

更可怕的是，这种错误还会出现“人传人现象”，导致进一步的幻觉和循环。

对此，团队提出了全新架构“PIANO”（通过神经编排的并行信息聚合），其中P代表感知模块，I代表智能核心，A则是行动模块。

这一架构被用来回答：

智能体如何在多个时间尺度上有意识和潜意识地同时思考和行动？

团队打了个比方，这就好比钢琴的琴键，代表着不同的大脑模块，当它们一起演奏时，可以产生优美的和弦。而在智能体中，同样产生了类人的特质。

具体而言，PIANO架构基于两个原则设计：

并发性原则
连贯性原则

首先，类似于系统1系统2，智能体应该能够同时思考和行动，这意味着智能体可以在处理即时反应的同时，进行缓慢的深思熟虑。

这种设计允许智能体在实时环境中与低延迟交互，同时保持复杂决策的能力。

其次，智能体产生的多个输出应该是一致的。

为了确保这一点，PIANO引入了认知控制器（CC）模块，它负责做出高层决策，并将这些决策转化为下游决策，以将其转换为每个电机模块中的适当输出。

这一设计减少了信息量，并使得智能体能够在多个输出流之间保持一致性。

基于上述原则，PIANO由10个并发运行的不同模块组成：

比如，目标生成模块可以根据智能体的经验和环境的相互作用，来生成智能体的目标。

举个例子，假如一个智能体以前是干物流的，现在新遇到了堵车情况，这个模块可能就会生成一个新目标：

与其他智能体协作，设计一种新的物流方案。

在这里，感知处理模块负责处理来自环境的输入信息，如视觉和听觉感知，并将其转化为智能体可以理解和处理的信息。

接下来，技能执行模块可以让智能体在环境中执行特定技能或动作，如在Minecraft中挖掘、制作或建造结构。

遇到一些突发情况，动作反射模块负责处理即时反应和行动，这个模块由小型、快速的非LLM神经网络构成。

而且，在整个过程中，智能体还可以通过行动意识模块评估自己的状态和表现，从而实现即时的调整和自我改进。

若遇到与其他智能体交流的情况，还有Talk模块负责解释并生成语音。

除此之外，社会意识模块也在其间发挥作用。它使得智能体能够解释和响应来自其他智能体的社交线索，支持合作与交流。

这还不算完，甚至还有一个专门的社会交互模块，负责处理智能体之间的社交交互，如对话的理解和回应。

当然，关键核心还是记忆模块。它负责存储和检索不同时间尺度上的对话、动作和观察，包括工作记忆（WM）、短期记忆（STM）和长期记忆（LTM）。

这个模块主打一个细致，智能体不仅能记住每个步骤的描述，甚至还能记住对话中的提问、回答的顺序以及双方强调的重点内容。

最后，前面提到的认知控制器（CC）模块，负责保证整体输出连贯性。

新的文明诞生了

为了评估智能体的表现，团队分别测试了单智能体和多智能体的行为。

对于单智能体，一个重要评价标准为：能否产生专业化分工。

为此，团队提出了评估智能体专业化的3个基本原则：

在角色选择和转换方面，拥有自主性
其专业化应该通过互动和经验来体现，没有明确的方向和限制
其选择的角色，应该体现在与其专业相一致的行为中

展开来说，团队在一个Minecraft村庄中，投放了30个初始配置完全一样的智能体。

实验预设的前提是，只有存在社会意识，才会驱动社会分工产生。

而这30个智能体需要通过社交互动，了解其他人的行为动机，并最终确定自己的分工目标。

最后结果显示，这群智能体自行发展了不同的职业，有农民、工程师等。

且一旦移除社会意识，智能体会选择更多的同质角色，这些角色也不会随着时间推移而持续下去。

接下来，团队继续测试了多智能体，主要聚焦在一群AI如何处理社会规则。

通过观察一个由25位选民组成的社会，团队发现这群智能体最初遵守了预设的税法，按照规定的时间缴纳税费。

然而，随着社会中有影响力的个体对公众舆论产生影响，选民们通过民主投票决定了税率的调整。

当然，新的税率通过后，大家也按照新税率完成了税款支付。

更进一步，团队继续扩大了测试范围——分布在6个城乡的500位智能体组建的社会。

结果显示，智能体自发地创造并传播了文化内容，例如舞蹈、生态意识和恶作剧等，而且还形成了一个虚拟的宗教，并通过智能体协会进行传播。

更有意思的是，城乡之间最终还形成了不同的文化圈。

看完智能体的上述表现，网友们也直言非常兴奋，纷纷期待更大规模智能体的到来！

你怎么看？

论文：
https://www.openread.academy/zh/paper/reading?corpusId=512036838
GitHub：
https://github.com/altera-al/project-sid

参考链接：
[1]https://digitalhumanity.substack.com/p/project-sid-many-agent-simulations
[2]https://x.com/GuangyuRobert/status/1852397383939960926[3]https://news.ycombinator.com/item?id=42035319

阅读最新前沿科技研究报告，欢迎访问欧米伽研究所的“未来知识库”

未来知识库是“欧米伽未来研究所”建立的在线知识库平台，收藏的资料范围包括人工智能、脑科学、互联网、超级智能，数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料。欢迎扫描二维码或点击本文左下角“阅读原文”进入。

截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告

接下来，我们将为您逐一展示这100部精选报告的完整标题列表。

1. 牛津大学博士论文《深度具身智能体的空间推理与规划》230页

2. 2024低空经济场景白皮书v1.0（167页）

3. 战略与国际研究中心（CSIS）人类地月空间探索的总体状况研究报告（2024）

4. 人工智能与物理学相遇的综述（86页）

5. 麦肯锡：全球难题，应对能源转型的现实问题（196页）

6. 欧米伽理论，智能科学视野下的万物理论新探索（50页报告）

7. 《美国反无人机系统未来趋势报告（2024-2029 年）》

8. Gartner 2025 年主要战略技术趋势研究报告

9. 2024人工智能国外大模型使用手册+中文大模型使用手册

10. 详解光刻巨人ASML成功之奥妙-241015（94页）

11. CB Insights：未来变革者：2025年九大科技趋势研究报告

12. 国际电信联盟2023-2024年联合国人工智能AI活动报告388页

13. 《人工智能能力的人类系统集成测试和评估》最新51页，美国防部首席数字和人工智能办公室（CDAO）

14. 2024瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

15. MHP：2024全球工业4.0晴雨表白皮书

16. 世界经济论坛白皮书《AI价值洞察：引导人工智能实现人类共同目标》

17. 瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

18. AI智能体的崛起：整合人工智能、区块链技术与量子计算(研究报告，书）

19. OpenAI o1 评估：AGI 的机遇和挑战（280页）

20. 世界知识产权组织：2024 年全球创新指数（326页）

21. 美国白宫：国家近地天体防御策略与行动计划

22. 【CMU博士论文】持续改进机器人的探索，243页

23. 中国信通院：量子计算发展态势研究报告2024年58页

24. 2024年OpenAI最新大模型o1革新进展突出表现及领域推进作用分析报告

25. 【新书】通用人工智能，144页

26. 联合国：《未来契约》、《全球数字契约》和《子孙后代问题宣言》三合一

27. 世界气候组织：2024团结在科学中，守卫地球系统的未来

28. 世界经济论坛《量子技术助力社会发展：实现可持续发展目标》研究报告

29. 人工智能科学家：迈向全自动开放式科学发现

30. 欧盟：石墨烯旗舰项目十年评估报告

31. 美国信息技术和创新基金会：美国的数字身份之路研究报告

32. 麦肯锡：2024能源转型挑战未来研究报告

33. 联合国贸易与发展会议：2024世界投资报告

34. 兰德：评估人工智能对国家安全和公共安全的影响

35. 兰德：2024评估人工智能基础模型市场的自然垄断条件

36. 经合组织：2015-2022 年生物多样性与发展融资

37. ITIF：中国半导体创新能力研究报告

38. 英国皇家学会：数学未来计划，数学和数据教育的新方法研究报告

39. 欧盟：10年人类大脑计划创新评估报告

40. GLG格理集团：2024深度解读半导体行业关键趋势和专家洞见报告15页

41. 华为智能世界2030报告2024版741页

42. 联合国：2024为人类治理人工智能最终报告

43. 达信Marsh：2024全球科技产业风险研究报告英文版27页

44. 鼎帷咨询：2024英伟达人工智能发展战略研究报告149页

45. 【博士论文】大语言模型的测试与评价：准确性、无害性和公平性，223页pdf

46. 麦肯锡：2024世界能源产业展望

47. 世界经济论坛《太空：全球经济增长的 1.8 万亿美元机遇》

48. 世界经济论坛：世界“技术先锋”名单100家公司名单

49. 世界经济论坛：2024绘制地球观测的未来：气候情报技术创新

50. 核聚变技术作为清洁能源供应替代来源的全球发展和准备情况

51. 大模型生成的idea新颖性与人类对比研究报告（94页）

52. IQM ：2024 年量子状况报告

53. 2024十大新兴技术研究报告

54. 2024地球观测 (EO) 洞察带来的全球价值（58页）

55. 2023-2024世界基础设施监测报告

56. 世界银行：2024世界发展报告，中等收入陷阱

57. 2024国际前沿人工智能安全科学报告132页

58. 斯坦福大学2024人工智能指数报告

59. 美国总统科学技术顾问委员会：《利用人工智能应对全球挑战》63页报告

60. 柳叶刀行星健康：2024地球系统安全与健康评估报告

61. 中国未来50年产业发展趋势白皮书III

62. OpenAI o1系列产品原理与安全最新研究报告（80页）

63. 国家互联网信息办公室：国家信息化发展报告2023年110页

64. 埃森哲：2024年风险研究报告-重大颠覆需要持续重塑英文版39页

65. 36氪研究院：2024年中国城市低空经济发展指数报告41页

66. 美国信息技术与创新基金会：《中国在量子领域的创新能力如何》研究报告

67. 理解深度学习500页报告

68. 鼎帷咨询：2024全球人工智能发展研究报告44页

69. 【伯克利博士论文】大型语言模型迈向能够学习和发现一切的机器

70. 《量子技术：前景、危险和可能性》45页报告

71. 英国皇家学会报告：人工智能在科学、技术、工程和数学领域的应用

72. 未来今日研究所：2024世界技趋势报告（980页）

73. 面向大规模脉冲神经网络：全面综述与未来方向

74. 大模型+知识库市场全景报告

75. 《太空力量的理论基础：从经济学到不对称战争》2024最新94页报告

76. CBInsights：2024年第二季度全球企业风险投资状况报告英文版124页

77. 英国科学院：数据管理和使用：21 世纪的治理（2024），99页

78. 兰德智库：展望2045 一项前瞻性研究探讨未来 20 年全球趋势的影响

79. 世界知识产权组织：2024年世界知识产权报告：让创新政策促进发展

80. 全球灾难风险研究所：评估大型语言模型接管灾难的风险

81. 牛津马丁学院：人工智能风险国际科学评估的未来

82. 联合国贸易和发展署：2024世界投资报告

83. 兰德公司：人工智能军事应用的新风险和机遇

84. 英国皇家学会：AI时代的科学发展趋势研究报告

85. 百页风电行业研究方法论：从中国到世界从陆地到海洋-240902，98页

86. 中国信通院发布《大模型落地路线图研究报告（2024年）》

87. 星河智源：2024年无人驾驶技术全景报告35页

88. 星河智源：2024年光刻机技术全景报告37页

89. 人形机器人行业研究方法论：特斯拉领衔人形机器人的从1到N

90. 兰德：展望2045一项关于未来20年全球趋势影响的前瞻性研究报告英文版45页

91. 《军事创新与气候挑战》2024最新152页报告

92. 麦肯锡：2024困难点：驾驭能源转型的物理现实（196页）

93. 《麻省理工科技评论》万字长文：什么是人工智能？

94. 软件与服务行业：从特斯拉智能驾驶看人形机器人发展路径

95. 中国信通院：中国数字经济发展研究报告2024年82页

96. CB Insights：2024年第二季度全球风险投资状况报告 244页

97. 脑启发的人工智能：全面综述

98. 二十年关键技术跟踪报告

99. 中国首部城市大脑系列建设标准（8项）汇编

100. 麦肯锡2024技术趋势展望报告100页

http://mp.weixin.qq.com/s?__biz=MzIwOTA1MDAyNA==&mid=2650020120&idx=2&sn=f062733ac6b25cc55b9b62ec94c31e60

人工智能学家

致力成为权威的人工智能科技媒体和前沿科技研究机构

最新文章

万物智能演化理论（欧米伽理论）的核心观点

美国国家科学院院刊：人工智能的下一个进化，从我们开始

大语言模型技术演进与启示！

涌现的计算方法：从计算力学到层级涌现

走出元宇宙阴影、拥抱开源AI模型，Meta实现“扎克伯格式复兴”

瑞士洛桑联邦理工学院：人工智能中的创造力：进展与挑战

各路大佬纷纷给 AGI 立下“最后期限”，27 岁创始人已经给 AI 准备好「人类最终测试」！

陶哲轩宣布“等式理论计划”成功，人类AI协作，57天完成2200万+数学关系证明

谷歌 AlphaChip 论文再被质疑，DeepMind 驳斥都没做与训练，顺带还揪出了“内鬼”？

复旦大学：《大模型AI智能体的兴起和潜力：综述》

斯坦福大学发布全球人工智能实力排行榜

意识是一种模拟状态，它只能存在于梦中，而不是在物理世界中

步步紧逼谷歌！OpenAI正在研发与ChatGPT集成的浏览器

2秒完成检测，将AI与3D打印相结合，科学家实现小型核反应堆高级监测

从具身到智能，无尽前沿丨智源具身智能峰会观点集锦（上）

从具身到智能，无尽前沿丨智源具身智能峰会观点集锦（下）

Nature：刷新了传统认知！蔡欣童/刘长亮等揭示多巴胺快速波动既不调控运动、也不编码奖赏

Nature :谷歌学术搜索能否在人工智能革命中幸存下来？

AI智能体的崛起，开启人工智能的下一个黄金时代

强化学习之父Richard Sutton：AGI研究的下一个范式

Science:如何理解大模型的智能本质

诺奖得主 Demis Hassabis教皇科学院开讲：AI 是一项令人难以置信的技术，发展模式需重新思考

性能提升在即！吴恩达谈 LLM 新方向：优化智能体工作流

模拟到现实无缝转换！麻省理工学院研究团队提出生成模型LucidSim，破解机器人训练难题！

人形机器人的兴起

Grok-3 与黎曼猜想：人工智能带来的震撼与挑战

斯坦福伯克利重磅发现DNA Scaling Law，Evo荣登Science封面！AI设计DNA/RNA/蛋白质再突破

AI 求解量子多体问题：GPT 理解人类语言，也理解量子语言吗？

真的撞墙？OpenAI 的任务对齐主管：2025年AI会在高阶应用突破，但一般人会感觉停滞

transformer的细节到底是怎么样的？Transformer 连环18问！

牛津大学报告：《无法被AI取代的力量：人类认知的理论驱动力》

吴恩达最新观点：LLM的下一个新兴方向是Agentic AI

Stephen Wolfram与计算的未来：一本带你认识世界的新书

研究人员发明了一种新的逻辑系统，有望提升批判性思维和人工智能的能力

马斯克新官上任再起诉OpenAI！新证据称Ilya七年前就不放心奥特曼了

OpenAI首位投资者《时代》刊文：AI将重新定义「人类的意义」

复旦大学：2024大语言模型的能力边界与发展思考报告

Anthropic创始人访谈：不是因为Altman 与微软合作而离开OpenAI、Scaling Law不会撞墙、未来招聘将放缓

生命的公式？新模型计算了宇宙中及宇宙之外存在智慧生物的可能性

MIT对大模型数理原理的强有力证明

智能时代：大统一理论与万物理论的追求、挑战与突破

黄仁勋对话孙正义：日本的AI新饼、Arm的AI野心与英伟达的东亚新机会

AI寒冬真的要来了！Ilya：I told you so

WHALE来了，南大周志华团队做出更强泛化的世界模型

李彦宏：智能体是AI应用最主流形态，即将迎来爆发点｜百度世界2024

奥特曼专访自曝：OpenAI将实现AGI第三级，一人也能打造10亿独角兽

开源的定义要变了！开源AI标准成照妖镜：Meta、谷歌家大模型只是在假装开源？

Scaling Law撞墙，AI圈炸锅了！OpenAI旗舰Orion被曝遭遇瓶颈，大改技术路线

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉