北大校友打造的1000个智能体「我的世界」，背后原理揭晓了！

学术 2024-11-06 15:30 北京

团队全新公开35页技术报告，详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……

其中最精彩的，当数团队整活儿：

让牧师NPC引入虚拟宗教，最后发现该宗教在500个智能体（横跨6大城乡）中进行了广泛传播。

据介绍，项目整体由一个名为PIANO的架构提供支持，它核心解决多智能体交互问题，用于确保多个输出流的一致性。

接下来，团队使用受人类历史启发的文明基准，来分别评估单个智能体和多智能体的行为表现。

出人意料的是，在投放了30个初始配置完全相同的智能体后，一群AI经过一番互相试探，最终竟产生了社会分工。

而在更大范围内，有关舞蹈、生态意识和恶作剧等话题的讨论表明，多智能体在不同区域竟形成了不同文化圈。

看完这些，难怪有网友惊呼：

我们生活在模拟矩阵中，未来就是现在。

全新PIANO架构

这个项目代号Sid，由北大校友、MIT教授Robert Yang发起，最终目标是将智能体无缝整合进人类社会中。

前一阵，团队展示了由GPT-4驱动的1000个智能体如何在「我的世界」中创建新文明，当时就引发大量关注。

不过对Sid团队来说，这离最终目标还很远，其交互范围和复杂性仍然有限。

按他们的话来说：

目前单个智能体在自主决策和执行上已经有了很大提升，但构建能够自发社交互动甚至共同进步的智能体仍然是一项根本挑战。

与此同时，靠大模型驱动的智能体也存在诸多问题。

比如，即使配备了用于规划和反思的模块，智能体也经常陷入重复，甚至在幻觉积累到一定程度后出现错误。

更可怕的是，这种错误还会出现“人传人现象”，导致进一步的幻觉和循环。

对此，团队提出了全新架构“PIANO”（通过神经编排的并行信息聚合），其中P代表感知模块，I代表智能核心，A则是行动模块。

这一架构被用来回答：

智能体如何在多个时间尺度上有意识和潜意识地同时思考和行动？

团队打了个比方，这就好比钢琴的琴键，代表着不同的大脑模块，当它们一起演奏时，可以产生优美的和弦。而在智能体中，同样产生了类人的特质。

具体而言，PIANO架构基于两个原则设计：

并发性原则
连贯性原则

首先，类似于系统1系统2，智能体应该能够同时思考和行动，这意味着智能体可以在处理即时反应的同时，进行缓慢的深思熟虑。

这种设计允许智能体在实时环境中与低延迟交互，同时保持复杂决策的能力。

其次，智能体产生的多个输出应该是一致的。

为了确保这一点，PIANO引入了认知控制器（CC）模块，它负责做出高层决策，并将这些决策转化为下游决策，以将其转换为每个电机模块中的适当输出。

这一设计减少了信息量，并使得智能体能够在多个输出流之间保持一致性。

基于上述原则，PIANO由10个并发运行的不同模块组成：

比如，目标生成模块可以根据智能体的经验和环境的相互作用，来生成智能体的目标。

举个例子，假如一个智能体以前是干物流的，现在新遇到了堵车情况，这个模块可能就会生成一个新目标：

与其他智能体协作，设计一种新的物流方案。

在这里，感知处理模块负责处理来自环境的输入信息，如视觉和听觉感知，并将其转化为智能体可以理解和处理的信息。

接下来，技能执行模块可以让智能体在环境中执行特定技能或动作，如在Minecraft中挖掘、制作或建造结构。

遇到一些突发情况，动作反射模块负责处理即时反应和行动，这个模块由小型、快速的非LLM神经网络构成。

而且，在整个过程中，智能体还可以通过行动意识模块评估自己的状态和表现，从而实现即时的调整和自我改进。

若遇到与其他智能体交流的情况，还有Talk模块负责解释并生成语音。

除此之外，社会意识模块也在其间发挥作用。它使得智能体能够解释和响应来自其他智能体的社交线索，支持合作与交流。

这还不算完，甚至还有一个专门的社会交互模块，负责处理智能体之间的社交交互，如对话的理解和回应。

当然，关键核心还是记忆模块。它负责存储和检索不同时间尺度上的对话、动作和观察，包括工作记忆（WM）、短期记忆（STM）和长期记忆（LTM）。

这个模块主打一个细致，智能体不仅能记住每个步骤的描述，甚至还能记住对话中的提问、回答的顺序以及双方强调的重点内容。

最后，前面提到的认知控制器（CC）模块，负责保证整体输出连贯性。

新的文明诞生了

为了评估智能体的表现，团队分别测试了单智能体和多智能体的行为。

对于单智能体，一个重要评价标准为：能否产生专业化分工。

为此，团队提出了评估智能体专业化的3个基本原则：

在角色选择和转换方面，拥有自主性
其专业化应该通过互动和经验来体现，没有明确的方向和限制
其选择的角色，应该体现在与其专业相一致的行为中

展开来说，团队在一个Minecraft村庄中，投放了30个初始配置完全一样的智能体。

实验预设的前提是，只有存在社会意识，才会驱动社会分工产生。

而这30个智能体需要通过社交互动，了解其他人的行为动机，并最终确定自己的分工目标。

最后结果显示，这群智能体自行发展了不同的职业，有农民、工程师等。

且一旦移除社会意识，智能体会选择更多的同质角色，这些角色也不会随着时间推移而持续下去。

接下来，团队继续测试了多智能体，主要聚焦在一群AI如何处理社会规则。

通过观察一个由25位选民组成的社会，团队发现这群智能体最初遵守了预设的税法，按照规定的时间缴纳税费。

然而，随着社会中有影响力的个体对公众舆论产生影响，选民们通过民主投票决定了税率的调整。

当然，新的税率通过后，大家也按照新税率完成了税款支付。

更进一步，团队继续扩大了测试范围——分布在6个城乡的500位智能体组建的社会。

结果显示，智能体自发地创造并传播了文化内容，例如舞蹈、生态意识和恶作剧等，而且还形成了一个虚拟的宗教，并通过智能体协会进行传播。

更有意思的是，城乡之间最终还形成了不同的文化圈。

看完智能体的上述表现，网友们也直言非常兴奋，纷纷期待更大规模智能体的到来！

你怎么看？

论文：
https://www.openread.academy/zh/paper/reading?corpusId=512036838
GitHub：
https://github.com/altera-al/project-sid

参考链接：
[1]https://digitalhumanity.substack.com/p/project-sid-many-agent-simulations
[2]https://x.com/GuangyuRobert/status/1852397383939960926
[3]https://news.ycombinator.com/item?id=42035319

文章来源：量子位

IEEE Spectrum

《科技纵览》

官方微信公众平台

往期推荐

芯片扩展中的摩尔定律

为何臃肿依然是软件最大的弱点

假如拥有一台行星级计算机会怎样？

http://mp.weixin.qq.com/s?__biz=MzI3NjUyMTgxNQ==&mid=2247553627&idx=1&sn=fa6e2c17ffdb8ca923ef55eab706c18b

悦智网

IEEE Spectrum是国际期刊界卓越的技术写作和报道的一盏明灯。我们旨在提供一个跨学科技术领域的“全局”，让读者了解工程学、科学和技术领域的创新成果与发展趋势。

最新文章

雷达猫咪探测器

Science | 浙江大学：高效生长铝纳米线森林的新技术！

人形机器人的兴起

印度初创公司在72小时内打印出火箭发动机

电动汽车的未来发展

湖南大学/河北师范大学合作，Nature Nanotechnology！

激光雷达芯片进入发展快车道

比利时微电子研究中心计划利用超导缩小计算机

效仿芯片制造的血糖监测仪

3所高校，新晋ESI前万分之一

海洋封存碳的速度比以前想象的要慢

首次在液体中发现热电效应

测量时间和空间的畸变

生成性人工智能的未来发展

这位工程师负责欧洲核子研究组织的粒子加速器正常运行

提高天基功率的一种方法：继电器

西湖大学，Nature Materials！

ARTEMIS：卫星导航电离层精准监测助力北斗高精度应用

毫米波或许不是最有前景的6G频谱？

武汉大学/北京大学合作， Science！

风电制氢技术走向海洋

被遗忘的中文键盘史

反应堆燃料可用于核炸弹

北京理工大学，Nature！

生成式人工智能带来的电子废弃物垃圾不容忽视

人工智能在心智理论测试中战胜人类

2mm芯片植入视网膜，盲人重获阅读能力

华北电力大学，首篇Science！

北大校友打造的1000个智能体「我的世界」，背后原理揭晓了！

民勤盐渍农田磷肥利用状况与科学施肥对策建议（项目咨询报告）

睡眠可以修复心脏

以太坊智能合约安全漏洞检测

复旦大学，Nature！

新型载液使氢气更容易运输

超人的速度！自主驾驶无人机击败最优秀的人类选手

新能源汽车电磁安全测评技术

苹果最强芯M4 Max首发！新MacBook Pro顶配57099元

中国科学院最新Nature！

AI-HIFU人工智能超声无创手术机器人——引领人工智能无创伤外科医学新纪元

国自然基金重大调整，这4点需要关注！

新型混合存储器旨在减少人工智能的能源使用

芯片扩展中的摩尔定律

量子纠缠如何为雷达安全保驾护航？

Nature | 北京大学钱珑、张成课题组开发表观比特DNA存储新技术

海龟激发心脏监测器设计灵感

最新自然指数TOP200！

量子纠缠的发生需要多久？

高温超导胶带

通往100%可再生能源之路

特斯拉机器人能自己走，自由穿梭工厂，手上还能抱11kg重物！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉