当前,AI Agent技术的发展正在重塑生产力和生产方式,为社会发展带来价值。人工智能著名学者、斯坦福大学教授吴恩达 (Andrew Ng) 指出 “AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型,这是一个值得所有人关注的趋势”,可见 AI Agent 以其强大的智能和自主性,正在改变我们生活的方方面面,无疑是当下大模型发展中最引人注目的主线。
TsinghuaNLP 实验室及其孵化的初创公司面壁智能作为国内最早一批深入 AI Agent的科研团队,现有自研的大模型驱动的 AI Agent 平台-单体-群体三方面的创新成果,AI Agent 的基建已经逐步搭建起来,也被团队内部称为 AI Agent “三驾马车”。
➤ AgentVerse
https://github.com/OpenBMB/AgentVerse
➤ XAgent
https://github.com/OpenBMB/XAgent
➤ ChatDev
https://github.com/OpenBMB/ChatDev
AgentVerse: 智能体协作平台
AgentVerse 作为一个智能体通用平台,构建了一个虚拟空间,用户在此定义并部署各类智能体,扮演不同专业角色,如营销、编程、设计和Bug修复等。平台通过策略性招募流程,优化智能体组合以适应特定任务需求。智能体团队在任务协商和角色分配后,协同执行任务,并完成结果整合。AgentVerse 的工作流程模拟了人类合作解决问题的过程,一共分为4个阶段:
1. 专家招募(Expert Recruitment)
根据当前问题解决进度调整由哪些Agent来处理任务。
2. 协同决策(Collaborative Decision-Making)
由上一阶段招募的Agent根据用户提供的任务,讨论解决问题所需的方案与分工。
3. 执行(Action Execution)
Agent们与环境进行交互,在环境中通过使用工具或与环境进行交互,完成各自的任务。
4. 评估(Evaluation)
任务完成后,此模块中的一个评估员Agent将当前状态与用户期望目标进行比对,如果没有达到预期就撰写反馈,重新回到第一步骤。在下一个循环中,智能体们则会根据上一轮得到的反馈进行改进。
AgentVerse的工作流程
这个框架的通用性使 AgentVerse 团队能够在其基础上开展广泛的工作。可以想见,AgentVerse 对于提升人们日常工作效率给出了初步令人满意的解决方案,同时也为心理学、社会学等学科的模拟实验改进提供了广阔的前景。
如您想了解更多,可复制链接阅读论文:
➤ 论文地址
https://arxiv.org/abs/2308.10848
XAgent:超级智能体
XAgent 是一个用于复杂任务解决的自主大预言模型代理,可以基于规划动态指示做任务分布执行,它扮演着智能体专家的角色,有能力完成比较复杂的工作。相较于 AutoGPT,XAgent 引入了“双循环机制”:在外循环中,负责全局任务规划,XAgent 展现出作为一个“规划者”(PlanAgent)的领导力,将复杂任务分解为可操作的简单任务;在内循环中,XAgent 快速转变身份,展现出作为一个高效“执行者”(ToolAgent)的专业度,负责局部任务执行,确保外循环传递的子任务达到预期。
XAgent为人类生成餐厅推荐名单的过程
当向XAgent发出指令“我周末有几个朋友过来,能推荐几个餐厅吗?”。XAgent的第一步是与你互动,而不是立即执行任务,首先探询偏好,以此来理解使用者需求。接着基于回复进行搜索并提出几个方案。一旦你做出选择,它便会通过连接API直接为你预订餐厅。这不同于我们通常所熟悉的单步问答模式,它展现了智能体提供的一种更优质的体验。
开发团队还对基于GPT-4所打造的XAgent进行了一套基准测试,主要测试XAgent推理、规划和使用外部工具的能力。测试结果显示,XAgent全面优于GPT-4。自开源以来,XAgent多次登上GitHub热榜,截止目前已获得7.3k星标,博主WorldofAI在YouTube对XAgent的部署流程录制了详细教程,获得1.5万观看量。
➤ 部署教程
https://www.youtube.com/watch?v=X6dna0O6pCw&t=129s
XAgent在各类测评指标中领先于AutoGPT和GPT-4
如您想了解更多,可复制以下链接阅读XAgent相关成果:
➤ XAgent相关技术博客
https://blog.x-agent.net/
➤ XAgent相关论文成果
Tool Learning:https://arxiv.org/abs/2304.08354
ToolLLM:https://arxiv.org/abs/2307.16789
ProAgent:https://arxiv.org/abs/2311.10751
ChatDev:群体智能软件开发平台
ChatDev 是基于AgentVerse开发的多智能体应用,旨在构建一个“以Agent为员工的虚拟软件公司”,设定CEO、CTO、产品经理、程序员、设计师等不同角色的智能体,并通过对话链形式协同工作,覆盖软件设计、系统测试和文档编制等关键环节,与瀑布模型相呼应。它能够在不到3分钟的时间内快速开发软件,平均开发时间低于7分钟,成本控制在3元以下。这种创新模式使得“一人团队+多智能体”的创业方式成为现实,为个人和小团队提供了强大的软件开发支持。
自开源以来,ChatDev持续位于GitHub Trending榜首,获得超过21k的星标,可见AI行业对群体智能和多智能体协作应用的广泛认可和期待。斯坦福大学吴恩达教授在红杉资本的 AI Ascent 活动上也点赞了ChatDev项目,以此为例详细阐述了“多智能体协作”趣味和魅力所在。他指出,多智能体多智能体合作的效果超出了许多人的预期,因为它不仅带来了丰富的输入和专业知识,还模拟了真实的工作环境,其中不同角色和专业人员共同努力实现目标。这种合作方式的潜在价值巨大,可广泛应用于内容创作、教育和培训、策略规划等领域,进一步扩展了大型语言模型(LLM)在各行业的应用前景。
吴恩达在红杉美国AI峰会介绍了ChatDev群体智能工作
如您想了解更多,可复制链接阅读论文:
➤ 论文地址
https://arxiv.org/abs/2307.07924
关于我们
清华大学自然语言处理与社会人文计算实验室(TsinghuaNLP)成立于 20 世纪七十年代末,是国内开展自然语言处理研究最早、深具影响力的科研单位,也是中国中文信息学会计算语言学专业委员会及中国人工智能学会因果与不确定性人工智能专业委员会的挂靠单位。实验室在学术总体带头人孙茂松教授及学术方向带头人刘洋教授、刘知远副教授的带领下,围绕以中文为核心的自然语言处理,在语言大模型、跨模态大模型、中文信息处理、机器翻译、知识图谱、智慧教育、社会人文和艺术计算等方面开展系统深入的研究,在国内外具有较大的学术影响。近年来,实验室承担了国家 973 项目、国家重点研发项目、国家社会科学基金重大项目等多项重要研究任务,并与腾讯、华为、搜狗等企业建立密切的学术合作关系。
Website:http://nlp.csai.tsinghua.edu.cn/
Email:thunlp@163.com
GitHub:https://github.com/thunlp
https://github.com/OpenBMB
Twitter:https://twitter.com/TsinghuaNLP
THUNLP 长期开放招聘|含实习
🎓 科研团队:七大研究方向 ➤ 点击阅读原文
模块化大模型
数据-模型孪生技术
工具学习与自主智能体
大模型群体智能
大模型对齐
多模态大模型
大模型训练动力学
💻 工程师团队 ➤ 点击阅读原文
大模型方向研究员
大模型算法工程师
多模态数据工程师
NLP算法工程师
大数据基础架构高级工程师
前端工程师
后端工程师
全栈工程师