1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

科技 2024-11-05 12:40 北京

n一水发自凹非寺
量子位 | 公众号 QbitAI

北大校友打造的1000个智能体「我的世界」，背后原理揭晓了！

团队全新公开35页技术报告，详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……

其中最精彩的，当数团队整活儿：

让牧师NPC引入虚拟宗教，最后发现该宗教在500个智能体（横跨6大城乡）中进行了广泛传播。

据介绍，项目整体由一个名为PIANO的架构提供支持，它核心解决多智能体交互问题，用于确保多个输出流的一致性。

接下来，团队使用受人类历史启发的文明基准，来分别评估单个智能体和多智能体的行为表现。

出人意料的是，在投放了30个初始配置完全相同的智能体后，一群AI经过一番互相试探，最终竟产生了社会分工。

而在更大范围内，有关舞蹈、生态意识和恶作剧等话题的讨论表明，多智能体在不同区域竟形成了不同文化圈。

看完这些，难怪有网友惊呼：

我们生活在模拟矩阵中，未来就是现在。

全新PIANO架构

这个项目代号Sid，由北大校友、MIT教授Robert Yang发起，最终目标是将智能体无缝整合进人类社会中。

前一阵，团队展示了由GPT-4驱动的1000个智能体如何在「我的世界」中创建新文明，当时就引发大量关注。

不过对Sid团队来说，这离最终目标还很远，其交互范围和复杂性仍然有限。

按他们的话来说：

目前单个智能体在自主决策和执行上已经有了很大提升，但构建能够自发社交互动甚至共同进步的智能体仍然是一项根本挑战。

与此同时，靠大模型驱动的智能体也存在诸多问题。

比如，即使配备了用于规划和反思的模块，智能体也经常陷入重复，甚至在幻觉积累到一定程度后出现错误。

更可怕的是，这种错误还会出现“人传人现象”，导致进一步的幻觉和循环。

对此，团队提出了全新架构“PIANO”（通过神经编排的并行信息聚合），其中P代表感知模块，I代表智能核心，A则是行动模块。

这一架构被用来回答：

智能体如何在多个时间尺度上有意识和潜意识地同时思考和行动？

团队打了个比方，这就好比钢琴的琴键，代表着不同的大脑模块，当它们一起演奏时，可以产生优美的和弦。而在智能体中，同样产生了类人的特质。

具体而言，PIANO架构基于两个原则设计：

并发性原则
连贯性原则

首先，类似于系统1系统2，智能体应该能够同时思考和行动，这意味着智能体可以在处理即时反应的同时，进行缓慢的深思熟虑。

这种设计允许智能体在实时环境中与低延迟交互，同时保持复杂决策的能力。

其次，智能体产生的多个输出应该是一致的。

为了确保这一点，PIANO引入了认知控制器（CC）模块，它负责做出高层决策，并将这些决策转化为下游决策，以将其转换为每个电机模块中的适当输出。

这一设计减少了信息量，并使得智能体能够在多个输出流之间保持一致性。

基于上述原则，PIANO由10个并发运行的不同模块组成：

比如，目标生成模块可以根据智能体的经验和环境的相互作用，来生成智能体的目标。

举个例子，假如一个智能体以前是干物流的，现在新遇到了堵车情况，这个模块可能就会生成一个新目标：

与其他智能体协作，设计一种新的物流方案。

在这里，感知处理模块负责处理来自环境的输入信息，如视觉和听觉感知，并将其转化为智能体可以理解和处理的信息。

接下来，技能执行模块可以让智能体在环境中执行特定技能或动作，如在Minecraft中挖掘、制作或建造结构。

遇到一些突发情况，动作反射模块负责处理即时反应和行动，这个模块由小型、快速的非LLM神经网络构成。

而且，在整个过程中，智能体还可以通过行动意识模块评估自己的状态和表现，从而实现即时的调整和自我改进。

若遇到与其他智能体交流的情况，还有Talk模块负责解释并生成语音。

除此之外，社会意识模块也在其间发挥作用。它使得智能体能够解释和响应来自其他智能体的社交线索，支持合作与交流。

这还不算完，甚至还有一个专门的社会交互模块，负责处理智能体之间的社交交互，如对话的理解和回应。

当然，关键核心还是记忆模块。它负责存储和检索不同时间尺度上的对话、动作和观察，包括工作记忆（WM）、短期记忆（STM）和长期记忆（LTM）。

这个模块主打一个细致，智能体不仅能记住每个步骤的描述，甚至还能记住对话中的提问、回答的顺序以及双方强调的重点内容。

最后，前面提到的认知控制器（CC）模块，负责保证整体输出连贯性。

新的文明诞生了

为了评估智能体的表现，团队分别测试了单智能体和多智能体的行为。

对于单智能体，一个重要评价标准为：能否产生专业化分工。

为此，团队提出了评估智能体专业化的3个基本原则：

在角色选择和转换方面，拥有自主性
其专业化应该通过互动和经验来体现，没有明确的方向和限制
其选择的角色，应该体现在与其专业相一致的行为中

展开来说，团队在一个Minecraft村庄中，投放了30个初始配置完全一样的智能体。

实验预设的前提是，只有存在社会意识，才会驱动社会分工产生。

而这30个智能体需要通过社交互动，了解其他人的行为动机，并最终确定自己的分工目标。

最后结果显示，这群智能体自行发展了不同的职业，有农民、工程师等。

且一旦移除社会意识，智能体会选择更多的同质角色，这些角色也不会随着时间推移而持续下去。

接下来，团队继续测试了多智能体，主要聚焦在一群AI如何处理社会规则。

通过观察一个由25位选民组成的社会，团队发现这群智能体最初遵守了预设的税法，按照规定的时间缴纳税费。

然而，随着社会中有影响力的个体对公众舆论产生影响，选民们通过民主投票决定了税率的调整。

当然，新的税率通过后，大家也按照新税率完成了税款支付。

更进一步，团队继续扩大了测试范围——分布在6个城乡的500位智能体组建的社会。

结果显示，智能体自发地创造并传播了文化内容，例如舞蹈、生态意识和恶作剧等，而且还形成了一个虚拟的宗教，并通过智能体协会进行传播。

更有意思的是，城乡之间最终还形成了不同的文化圈。

看完智能体的上述表现，网友们也直言非常兴奋，纷纷期待更大规模智能体的到来！

你怎么看？

论文：
https://www.openread.academy/zh/paper/reading?corpusId=512036838
GitHub：
https://github.com/altera-al/project-sid

参考链接：
[1]https://digitalhumanity.substack.com/p/project-sid-many-agent-simulations
[2]https://x.com/GuangyuRobert/status/1852397383939960926
[3]https://news.ycombinator.com/item?id=42035319

— 完 —

评选征集中

「2024人工智能年度评选」

量子位2024人工智能年度评选已开启报名通道，评选从企业、人物、产品三大维度设立了5类奖项。

欢迎扫码报名评选！评选结果将于12月MEET2025智能未来大会公布，期待与数百万从业者共同见证荣誉时刻。

点这里👇关注我，记得标星哦～

一键三连「点赞」、「分享」和「在看」

科技前沿进展日日相见 ~

http://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==&mid=2247756623&idx=3&sn=be783b02adcd95d627b1f17530a2333d

量子位

追踪人工智能新趋势，关注科技行业新突破

最新文章

百度打通两大国民产品！六边形AI创作新物种「自由画布」来了

小度为何押注AI眼镜？

今日最热论文：Scaling Law后继乏力，量化也不管用，AI大佬齐刷刷附议

稚晖君后宇树也来玩开源了：机器人操作数据集，采用抱抱脸LeRobot训练测试，网友：泰裤辣！

最后3天！2024人工智能年度评选，AI时代的行业先锋就等你来

摩尔线程冲刺IPO：国产GPU，英伟达中国一把手打造，估值已超255亿

OpenAI总裁回归！将更专注重大技术挑战，“结束人生最长假期”

小米上新二代大模型！窗口长度翻至50倍，平均性能提升超45%

Claude三巨头回应一切！Opus3.5仍可能发布，5小时超长视频10万人围观

最强开源CodeLLM模型深夜来袭！320亿参数，Qwen2.5-Coder新模型超越GPT-4o

马斯克招人策略曝光：9轮面试，底薪低于同行，只招“铁杆特斯拉人”

o1不是唯一路径！MIT新研究：在测试时训练，模型推理能力最高升至5.8倍

开源版SearchGPT来了，两张3090就可复现，超越Perplexity付费版

最后4天！2024人工智能年度评选，AI时代的行业先锋就等你来

诺奖AI成果开源了！AlphaFold3代码人人可以免费下，Nature亲自撰文推荐

0元起步打造你的AI搜索！实测秘塔知识库新功能，竟能指导我升职加薪了

浙大开源“最懂Excel的GPT”！首次将结构化数据作为独立模态训练，刷榜提升40百分点

o1/Claude集体翻车！陶哲轩等60+顶尖数学家合力提出新数学基准，大模型正确率通通不足2%

树莓派爆改国际象棋，棋子活了自己动

用LLM一键生成百万级领域知识图谱！中科大新框架入选ACL 2024

最后5天！2024人工智能年度评选，AI时代的行业先锋就等你来

GPT-5被曝不及预期，OpenAI员工：没什么科学突破了，接下来只需要工程

AI毒液刷屏抖音小红书！闲鱼10元代生成一次，但官网其实免费

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

多模态模型免微调接入互联网，即插即用新框架，效果超闭源商用方案

最后一周！2024人工智能年度评选，AI时代的行业先锋就等你来

OpenAI华人VP翁荔离职：北大校友，掌管安全，最近B站分享被热议

全球首个法律o1大模型发布，System2范式下慢思考法律专家｜港科大&北大

清华厦大等提出“无限长上下文”技术，100万大海捞针全绿，Llama\Qwen\MiniCPM都能上分

国产AI可以拍微电影了！4K、60帧高清画质，自带音效

蚂蚁集团前端技术团队分享：AI 浪潮下，前端开发将迎来怎样的机遇与变革？

AI蛋白质诺奖后再登Nature，第一性原理级精度，微软亚研院4年之作

一个弹窗整懵Claude，瞬间玩不转电脑了 | 斯坦福&港大新研究

评估大模型不看输出看「内在」，上交大新测试指标入选NeurIPS 2024

最后两周！2024人工智能年度评选，AI时代的行业先锋就等你来

黄仁勋：AI算力集群会扩展到100万芯片，没有任何物理定律可以阻止

鸿蒙的“AI野望”：让AI融入操作系统，数亿补贴寻应用开发者

首批嘉宾定了，李开复周志华都要来！MEET2025智能未来大会报名通道已开启

我在淘天做算法：十年拍立淘，一部视觉算法技术演变史

免训练加速DiT！Meta提出自适应缓存新方法，视频生成快2.6倍

50s完成7B模型量化，4bit达到新SOTA，大模型低比特量化有新招了 | NeurIPS 2024 Oral

李开复和周志华都来了，MEET2025智能未来大会报名正式启动！

登顶的小熊猫模型出AI产品了！3步10秒出一张海报，可免费商用

大模型重构生命科学！最大基础模型面世，解锁DNA超长序列，参数规模达2100亿

最高精度1公里*1公里*1小时！达摩院发布气象大模型，大山东已经在用了

GPT-4o加钱能变快！新功能7秒完成原先23秒的任务

零一万物战略骤转！国内聚焦toB，toC先走海外

轻松搭建AI版“谁是卧底”游戏，muAgent框架让知识图谱秒变编排引擎，支持复杂推理+在线协同

最后两周！2024人工智能年度评选，AI时代的行业先锋就等你来

腾讯算出MoE模型Scaling Law：C≈9.59ND+2.3×10⁸D，最佳激活参数量58.1B

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

1000个智能体打造《我的世界》，北大校友35页技术报告揭秘

n一水 发自 凹非寺量子位 | 公众号 QbitAI

全新PIANO架构

新的文明诞生了

n一水发自凹非寺
量子位 | 公众号 QbitAI