北大校友打造的1000个智能体「我的世界」,背后原理揭晓了!

科技   2024-11-06 17:25   广东  

来源:量子位
北大校友打造的1000个智能体「我的世界」,背后原理揭晓了!
团队全新公开35页技术报告,详尽解密AI智能体如何产生专业化分工、社交互动、甚至传播虚拟宗教……
其中最精彩的,当数团队整活儿:
让牧师NPC引入虚拟宗教,最后发现该宗教在500个智能体(横跨6大城乡)中进行了广泛传播。
据介绍,项目整体由一个名为PIANO的架构提供支持,它核心解决多智能体交互问题,用于确保多个输出流的一致性。
接下来,团队使用受人类历史启发的文明基准,来分别评估单个智能体和多智能体的行为表现。
出人意料的是,在投放了30个初始配置完全相同的智能体后,一群AI经过一番互相试探,最终竟产生了社会分工。
而在更大范围内,有关舞蹈、生态意识和恶作剧等话题的讨论表明,多智能体在不同区域竟形成了不同文化圈。

看完这些,难怪有网友惊呼:

我们生活在模拟矩阵中,未来就是现在。

全新PIANO架构

这个项目代号Sid,由北大校友、MIT教授Robert Yang发起,最终目标是将智能体无缝整合进人类社会中。

前一阵,团队展示了由GPT-4驱动的1000个智能体如何在「我的世界」中创建新文明,当时就引发大量关注。

不过对Sid团队来说,这离最终目标还很远,其交互范围和复杂性仍然有限。

按他们的话来说:

目前单个智能体在自主决策和执行上已经有了很大提升,但构建能够自发社交互动甚至共同进步的智能体仍然是一项根本挑战。
与此同时,靠大模型驱动的智能体也存在诸多问题。
比如,即使配备了用于规划和反思的模块,智能体也经常陷入重复,甚至在幻觉积累到一定程度后出现错误。
更可怕的是,这种错误还会出现“人传人现象”,导致进一步的幻觉和循环。
对此,团队提出了全新架构“PIANO”(通过神经编排的并行信息聚合),其中P代表感知模块,I代表智能核心,A则是行动模块。
这一架构被用来回答:

智能体如何在多个时间尺度上有意识和潜意识地同时思考和行动?

团队打了个比方,这就好比钢琴的琴键,代表着不同的大脑模块,当它们一起演奏时,可以产生优美的和弦。而在智能体中,同样产生了类人的特质。

具体而言,PIANO架构基于两个原则设计:

  • 并发性原则
  • 连贯性原则

首先,类似于系统1系统2,智能体应该能够同时思考和行动,这意味着智能体可以在处理即时反应的同时,进行缓慢的深思熟虑。

这种设计允许智能体在实时环境中与低延迟交互,同时保持复杂决策的能力。

其次,智能体产生的多个输出应该是一致的。

为了确保这一点,PIANO引入了认知控制器(CC)模块,它负责做出高层决策,并将这些决策转化为下游决策,以将其转换为每个电机模块中的适当输出。

这一设计减少了信息量,并使得智能体能够在多个输出流之间保持一致性。

基于上述原则,PIANO由10个并发运行的不同模块组成:

比如,目标生成模块可以根据智能体的经验和环境的相互作用,来生成智能体的目标。

举个例子,假如一个智能体以前是干物流的,现在新遇到了堵车情况,这个模块可能就会生成一个新目标:

与其他智能体协作,设计一种新的物流方案。

在这里,感知处理模块负责处理来自环境的输入信息,如视觉和听觉感知,并将其转化为智能体可以理解和处理的信息。

接下来,技能执行模块可以让智能体在环境中执行特定技能或动作,如在Minecraft中挖掘、制作或建造结构。

遇到一些突发情况,动作反射模块负责处理即时反应和行动,这个模块由小型、快速的非LLM神经网络构成。

而且,在整个过程中,智能体还可以通过行动意识模块评估自己的状态和表现,从而实现即时的调整和自我改进。

若遇到与其他智能体交流的情况,还有Talk模块负责解释并生成语音。

除此之外,社会意识模块也在其间发挥作用。它使得智能体能够解释和响应来自其他智能体的社交线索,支持合作与交流。

这还不算完,甚至还有一个专门的社会交互模块,负责处理智能体之间的社交交互,如对话的理解和回应。

当然,关键核心还是记忆模块。它负责存储和检索不同时间尺度上的对话、动作和观察,包括工作记忆(WM)、短期记忆(STM)和长期记忆(LTM)。

这个模块主打一个细致,智能体不仅能记住每个步骤的描述,甚至还能记住对话中的提问、回答的顺序以及双方强调的重点内容。

最后,前面提到的认知控制器(CC)模块,负责保证整体输出连贯性。

新的文明诞生了

为了评估智能体的表现,团队分别测试了单智能体和多智能体的行为。

对于单智能体,一个重要评价标准为:能否产生专业化分工。

为此,团队提出了评估智能体专业化的3个基本原则:

  • 在角色选择和转换方面,拥有自主性

  • 其专业化应该通过互动和经验来体现,没有明确的方向和限制

  • 其选择的角色,应该体现在与其专业相一致的行为中

展开来说,团队在一个Minecraft村庄中,投放了30个初始配置完全一样的智能体。

实验预设的前提是,只有存在社会意识,才会驱动社会分工产生。

而这30个智能体需要通过社交互动,了解其他人的行为动机,并最终确定自己的分工目标。

最后结果显示,这群智能体自行发展了不同的职业,有农民、工程师等。

且一旦移除社会意识,智能体会选择更多的同质角色,这些角色也不会随着时间推移而持续下去。

接下来,团队继续测试了多智能体,主要聚焦在一群AI如何处理社会规则。

通过观察一个由25位选民组成的社会,团队发现这群智能体最初遵守了预设的税法,按照规定的时间缴纳税费。

然而,随着社会中有影响力的个体对公众舆论产生影响,选民们通过民主投票决定了税率的调整。

当然,新的税率通过后,大家也按照新税率完成了税款支付。

更进一步,团队继续扩大了测试范围——分布在6个城乡的500位智能体组建的社会。

结果显示,智能体自发地创造并传播了文化内容,例如舞蹈、生态意识和恶作剧等,而且还形成了一个虚拟的宗教,并通过智能体协会进行传播。

更有意思的是,城乡之间最终还形成了不同的文化圈。

看完智能体的上述表现,网友们也直言非常兴奋,纷纷期待更大规模智能体的到来!

你怎么看?

论文:
https://www.openread.academy/zh/paper/reading?corpusId=512036838
GitHub:
https://github.com/altera-al/project-sid

参考链接:
[1]https://digitalhumanity.substack.com/p/project-sid-many-agent-simulations
[2]https://x.com/GuangyuRobert/status/1852397383939960926[3]https://news.ycombinator.com/item?id=42035319


阅读最新前沿科技研究报告,欢迎访问欧米伽研究所的“未来知识库”


未来知识库是“欧米伽未来研究所”建立的在线知识库平台,收藏的资料范围包括人工智能、脑科学、互联网、超级智能,数智大脑、能源、军事、经济、人类风险等等领域的前沿进展与未来趋势。目前拥有超过8000篇重要资料。每周更新不少于100篇世界范围最新研究资料欢迎扫描二维码或点击本文左下角“阅读原文”进入。



截止到10月25日 ”未来知识库”精选的100部前沿科技趋势报告


接下来,我们将为您逐一展示这100部精选报告的完整标题列表。

1. 牛津大学博士论文《深度具身智能体的空间推理与规划》230页

2. 2024低空经济场景白皮书v1.0(167页)

3. 战略与国际研究中心(CSIS)人类地月空间探索的总体状况研究报告(2024)

4. 人工智能与物理学相遇的综述(86页)

5. 麦肯锡:全球难题,应对能源转型的现实问题(196页)

6. 欧米伽理论,智能科学视野下的万物理论新探索(50页报告)

7. 《美国反无人机系统未来趋势报告(2024-2029 年)》

8. Gartner 2025 年主要战略技术趋势研究报告

9. 2024人工智能国外大模型使用手册+中文大模型使用手册

10. 详解光刻巨人ASML成功之奥妙-241015(94页)

11. CB Insights:未来变革者:2025年九大科技趋势研究报告

12. 国际电信联盟2023-2024年联合国人工智能AI活动报告388页

13. 《人工智能能力的人类系统集成测试和评估》最新51页,美国防部首席数字和人工智能办公室(CDAO)

14. 2024瑞典皇家科学院诺贝尔化学奖官方成果介绍报告

15. MHP:2024全球工业4.0晴雨表白皮书

16. 世界经济论坛白皮书《AI价值洞察:引导人工智能实现人类共同目标》

17. 瑞典皇家科学院诺贝尔物理学奖科学背景报告资料

18. AI智能体的崛起:整合人工智能、区块链技术与量子计算(研究报告,书)

19. OpenAI o1 评估:AGI 的机遇和挑战(280页)

20. 世界知识产权组织:2024 年全球创新指数(326页)

21. 美国白宫:国家近地天体防御策略与行动计划

22. 【CMU博士论文】持续改进机器人的探索,243页

23. 中国信通院:量子计算发展态势研究报告2024年58页

24. 2024年OpenAI最新大模型o1革新进展突出表现及领域推进作用分析报告

25. 【新书】通用人工智能,144页

26. 联合国:《未来契约》、《全球数字契约》和《子孙后代问题宣言》三合一

27. 世界气候组织:2024团结在科学中,守卫地球系统的未来

28. 世界经济论坛 《量子技术助力社会发展:实现可持续发展目标》研究报告

29. 人工智能科学家:迈向全自动开放式科学发现

30. 欧盟:石墨烯旗舰项目十年评估报告

31. 美国信息技术和创新基金会:美国的数字身份之路研究报告

32. 麦肯锡:2024能源转型挑战未来研究报告

33. 联合国贸易与发展会议:2024世界投资报告

34. 兰德:评估人工智能对国家安全和公共安全的影响

35. 兰德:2024评估人工智能基础模型市场的自然垄断条件

36. 经合组织:2015-2022 年生物多样性与发展融资

37. ITIF:中国半导体创新能力研究报告

38. 英国皇家学会:数学未来计划, 数学和数据教育的新方法研究报告

39. 欧盟:10年人类大脑计划创新评估报告

40. GLG格理集团:2024深度解读半导体行业关键趋势和专家洞见报告15页

41. 华为智能世界2030报告2024版741页

42. 联合国:2024为人类治理人工智能最终报告

43. 达信Marsh:2024全球科技产业风险研究报告英文版27页

44. 鼎帷咨询:2024英伟达人工智能发展战略研究报告149页

45. 【博士论文】大语言模型的测试与评价:准确性、无害性和公平性,223页pdf

46. 麦肯锡:2024世界能源产业展望

47. 世界经济论坛《太空:全球经济增长的 1.8 万亿美元机遇》

48. 世界经济论坛:世界“技术先锋”名单100家公司名单

49. 世界经济论坛:2024绘制地球观测的未来:气候情报技术创新

50. 核聚变技术作为清洁能源供应替代来源的全球发展和准备情况

51. 大模型生成的idea新颖性与人类对比研究报告(94页)

52. IQM :2024 年量子状况报告

53. 2024十大新兴技术研究报告

54. 2024地球观测 (EO) 洞察带来的全球价值(58页)

55. 2023-2024世界基础设施监测报告

56. 世界银行:2024世界发展报告,中等收入陷阱

57. 2024国际前沿人工智能安全科学报告132页

58. 斯坦福大学2024人工智能指数报告

59. 美国总统科学技术顾问委员会:《利用人工智能应对全球挑战》63页报告

60. 柳叶刀行星健康:2024地球系统安全与健康评估报告

61. 中国未来50年产业发展趋势白皮书III

62. OpenAI o1系列产品原理与安全最新研究报告(80页)

63. 国家互联网信息办公室:国家信息化发展报告2023年110页

64. 埃森哲:2024年风险研究报告-重大颠覆需要持续重塑英文版39页

65. 36氪研究院:2024年中国城市低空经济发展指数报告41页

66. 美国信息技术与创新基金会:《中国在量子领域的创新能力如何》研究报告

67. 理解深度学习500页报告

68. 鼎帷咨询:2024全球人工智能发展研究报告44页

69. 【伯克利博士论文】大型语言模型迈向能够学习和发现一切的机器

70. 《量子技术:前景、危险和可能性》45页报告

71. 英国皇家学会报告:人工智能在科学、技术、工程和数学领域的应用

72. 未来今日研究所:2024世界技趋势报告(980页)

73. 面向大规模脉冲神经网络:全面综述与未来方向

74. 大模型+知识库市场全景报告

75. 《太空力量的理论基础:从经济学到不对称战争》2024最新94页报告

76. CBInsights:2024年第二季度全球企业风险投资状况报告英文版124页

77. 英国科学院:数据管理和使用:21 世纪的治理(2024),99页

78. 兰德智库:展望2045 一项前瞻性研究探讨未来 20 年全球趋势的影响

79. 世界知识产权组织:2024年世界知识产权报告:让创新政策促进发展

80. 全球灾难风险研究所:评估大型语言模型接管灾难的风险

81. 牛津马丁学院:人工智能风险国际科学评估的未来

82. 联合国贸易和发展署:2024世界投资报告

83. 兰德公司:人工智能军事应用的新风险和机遇

84. 英国皇家学会:AI时代的科学发展趋势研究报告

85. 百页风电行业研究方法论:从中国到世界从陆地到海洋-240902,98页

86. 中国信通院发布《大模型落地路线图研究报告(2024年)》

87. 星河智源:2024年无人驾驶技术全景报告35页

88. 星河智源:2024年光刻机技术全景报告37页

89. 人形机器人行业研究方法论:特斯拉领衔人形机器人的从1到N

90. 兰德:展望2045一项关于未来20年全球趋势影响的前瞻性研究报告英文版45页

91. 《军事创新与气候挑战》2024最新152页报告

92. 麦肯锡:2024困难点:驾驭能源转型的物理现实(196页)

93. 《麻省理工科技评论》万字长文:什么是人工智能?

94. 软件与服务行业:从特斯拉智能驾驶看人形机器人发展路径

95. 中国信通院:中国数字经济发展研究报告2024年82页

96. CB Insights:2024年第二季度全球风险投资状况报告 244页

97. 脑启发的人工智能:全面综述

98. 二十年关键技术跟踪报告

99. 中国首部城市大脑系列建设标准(8项)汇编

100. 麦肯锡2024技术趋势展望报告100页

人工智能学家
致力成为权威的人工智能科技媒体和前沿科技研究机构
 最新文章