谷歌发布双思维AI Agent：像人类一样思考，重大技术突破！

财富 2024-11-29 17:33 浙江

图片来源：由无界AI生成

今年10月，OpenAI高级研究科学家、德扑AI之父Noam Brown，曾在美国旧金山举办的TED AI大会上提出了一个惊人的理论——让AI模型思考20秒所带来的性能提升，相当于将模型扩大100,000倍并训练100,000倍的时间。

Noam所指的技术便是System 1/2 thinking，也是OpenAI最新模型o1正在使用的技术。

谷歌DeepMind研究人员则直接把这项技术集成到AI Agent中开发了Talker-Reasoner框架，让其具备“快”、“慢”两种拟人化思考方式。这对于解决复杂、冗长的任务来说帮助巨大，也突破了传统AI Agent执行业务流程的方法，极大提升了效率。

像人类一样思考——快、慢思维

在介绍谷歌的双思维AI Agent之前，「AIGC开放社区」先为大家简单介绍一下System 1/2的快、慢思维的由来和技术特性，对于理解Talker-Reasoner框架很有帮助。

快、慢思维最早是由诺贝尔经济学奖得主-丹尼尔·卡内曼在其著作《思考，快与慢》中提出，并被广泛接受为理解人类思维的一种重要理论框架。

这两种思维方式分别被称为“System1”和“System 2”，它们各自承担着不同的认知任务，并以独特的方式影响着我们的决策过程。

System 1，所谓的“快思考”，是一种自动化的、迅速的思维模式，几乎不需要消耗大量的认知资源，也不需要个体付出明显的努力。

当我们面对一个熟悉的场景或问题时，System1会迅速作出反应，提供即时的答案或解决方案。例如，当我们看到一辆车突然向我们驶来时，我们会本能地做出躲避的动作；或者当我们听到一个笑话时，我们可能会立即感到好笑并发出笑声。

这些反应都是System1在起作用的结果，它依赖于直觉和经验积累，能够在短时间内处理大量信息，但同时也可能因为缺乏深入分析而产生偏见或错误判断。

相比之下，System2则代表着“慢思考”，这是一种更为复杂和谨慎的思维过程。System2负责执行那些需要更多注意力和努力的任务，如解决复杂的数学问题、进行逻辑推理或是制定长期计划等。

如果你使用过OpenAI的o1或者国内的Deepseek、阿里最新开源的QwQ-32B模型，它们在执行超复杂问题时，便会进入短暂的思考时间。

System2的特点在于其能够对信息进行细致的分析和评估，从而得出更加准确和全面的结论。然而，由于这种思考方式需要消耗较多的认知资源，所以比System1要慢得多。

此外，在面对紧急情况或压力较大的情境下，System2的表现可能会受到影响，导致决策效率降低。

谷歌双思维AI Agent——Talker-Reasoner

而谷歌DeepMind研究人员提出的Talker-Reasoner中，巧妙地将System1/2集成到了AI Agent上。

Talker-Reasoner架构的核心思想是将AI Agent分为两个独立的模块：Talker和Reasoner。这两个模块分别对应于人类的System 1和System 2，各自承担着不同的任务和功能。

Talker模块，类似于System 1，负责快速、直观的对话生成，它能够迅速响应用户的需求，生成自然语言的回答。而Reasoner模块，类似于System 2，负责复杂的多步推理和规划，它需要更多的时间和计算资源来处理复杂的任务，如调用外部工具、检索信息和解决问题。

在Talker模块中，AI Agent被设计为能够理解和处理自然语言，生成连贯和自然的对话。这需要AI Agent具备强大的语言理解和生成能力，以及对上下文的敏感性。Talker模块需要能够快速地从记忆中提取相关信息，以支持其对话生成。

这种记忆可以是对话历史、用户偏好或其他相关信息。Talker模块的设计使其能够模拟人类的直觉反应，即使在信息不完全的情况下也能做出合理的回应。

与Talker模块的快速反应不同，Reasoner模块的设计重点在于深度思考和复杂问题解决。Reasoner模块需要能够执行多步推理，这可能涉及到对大量信息的分析和处理。它需要调用各种工具和数据库，以获取外部知识，支持其推理过程。

Reasoner模块还需要能够形成和更新关于用户状态的信仰，这些信仰以结构化语言对象的形式存储在记忆中。这种信仰建模是Reasoner模块的关键特征，它使得AI Agent能够更好地理解用户的需求和意图，从而提供更准确的服务。

在实际应用中，Talker和Reasoner模块之间的交互是通过记忆来实现的。Reasoner模块负责生成新的信仰状态，并将其存储在记忆中。Talker模块在需要时从记忆中检索这些信仰状态，以支持其对话生成。

这种设计允许Talker模块即使在Reasoner模块尚未完成其推理过程时，也能够继续与用户进行互动。该分工类似于人类的大脑，System 1始终活跃，而System 2则在需要时介入。

Talker-Reasoner测试数据

为了测试Talker-Reasoner的双思维性能，研究人员用这个开发了一个睡眠辅导Agent。在这个场景中，AI Agent需要与用户进行对话，提供关于改善睡眠习惯的建议和计划。

Talker模块负责与用户的直接互动，而Reasoner模块则负责制定和调整睡眠辅导计划。这种分工使得AI Agent能够同时进行快速的对话和复杂的规划，提高了用户体验。

在测试中，Talker模块通过一系列指令编码专家知识，指导其完成睡眠辅导的各个阶段。这些指令不仅包括了与用户互动的规则，还包括了睡眠辅导的具体步骤和策略。Talker模块需要能够理解和回应用户的需求，同时保持对话的连贯性和自然性。

Reasoner模块则需要根据用户的反馈和需求，调整和优化睡眠辅导计划。这可能涉及到调用外部资源，如睡眠相关的研究和建议，以及根据用户的具体情况制定个性化的计划。Reasoner模块的设计使其能够处理复杂的逻辑和推理，为用户提供最合适的建议。

在实际对话中，Talker和Reasoner模块的协同工作被证明是有效的。Talker模块能够流畅地与用户对话，而Reasoner模块则能够根据用户的反馈调整和优化辅导计划。这种分工执行使得AI Agent能够同时处理快速的对话和复杂的规划，极大提高了用户体验。

论文地址：

https://arxiv.org/abs/2410.08328v1

中国AIGC产业应用峰会回顾

2024 年 1 月 5 日，【智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会】在杭州未来科技城会议中心举行。

大会汇集行业资深专家及领军企业，共同聚焦AIGC领域，围绕当下热点话题进行深度延展，探讨行业激烈竞争下的运营新思路、发展新模式！点击文章，回顾精彩内容~

AI新智界园区开放合作啦！

AIGC新智界

专注于 AIGC、数字版权、元宇宙以及区块链等新技术领域的报道。

最新文章

OpenAI直播12天，马斯克融资437亿

日入千元！一个人也能开起AI照相馆了

大模型落地，苦「最强」久矣

媒体再爆：OpenAI的GPT-5训练遇阻，时间延迟且成本高昂

OpenAI成功为自己制造了危机

AI+Emoji，终于打了一场胜仗？

史上最大规模融资！AI巨无霸Databricks诞生，投资细节公开

沾AI价格暴涨十倍，玩具圈想再造一个泡泡玛特

字节丢的面子，正靠AI挽回

OpenAI整大活！ChatGPT新增电话功能，全民AGI要来了

贴身追随OpenAI的中国公司，从智谱换成了月之暗面？

海螺们不想交“买路财”

Sora能带飞剪映吗？

刚刚，智谱又融了30亿！超200亿估值引领大模型创业赛道

26岁OpenAI举报人疑自杀！死前揭ChatGPT训练黑幕

奥特曼，杨植麟的理想型？

柜哥柜姐，AI的新工作

ChatGPT「睁眼」了！OpenAI版「Her」满血上线，还有圣诞限定彩蛋

我用AI 卖大米，一个人就是一个团队

Sora终于来了，但卷王可灵已经「拍」上了AI电影

体操运动，是所有AI视频最残酷的图灵测试

最新国内AI手机排行榜，让人有点破防

Sora发布！这次的惊艳居然不在模型，而是产品设计和制作流

AI公司到底谁在喝汤，谁在吃肉？

第一批 AI 员工，即将入职电商公司

惊喜！OpenAI第3天产品会很炸裂，Sam Altman非常兴奋

大模型创业“生死局”：融资困难、造血乏力、卖身离场

奥特曼悔不当初：OpenAI因无知选择“非营利”

让一让，全球最鲜活的AI小猫来了

AI营销的风，还是吹到了A股

亚马逊祭出地表最强全家桶，多模态Nova却败给Claude 3.5！

马斯克起诉OpenAI：要求开源产品，36页诉状大公开！

AI时代，图库会被媒体抛弃吗？

3个月估值10亿，李飞飞空间智能首个模型诞生！

ChatGPT拒绝谈论这个人，没人知道为什么

第一个被人类骗钱的AI傻了，近5万美元不翼而飞！

如今的华强北，被AI包围

谷歌发布双思维AI Agent：像人类一样思考，重大技术突破！

一家老牌明星AI公司，倒在大模型时代

这个群体，用AI 捏爆款，1人年入百万

这届AI顶流都在小红书？

一文看尽Meta开源大礼包！

人本智能时代：谁在为AI“立规矩”？

Nature：谷歌学术正在被AI工具颠覆

我，机器人艺术家，一幅画卖 700 万

喊着干掉网站和app的AI公司们，却在豪掷数亿疯抢网址域名

仅仅一天，Gemini就夺回了GPT-4o拿走的头名

国产模型指令跟随全球第一！来自LeCun亲推的「最难作弊」大模型新榜单

“一人AI公司”已实现年入百万

开始分家：零一万物计划独立 AI 游戏公司

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉