首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

深度｜OpenAI o1 的思维链与周鸿祎的慢思考

科技科技 2024-09-19 08:57 浙江

OpenAI 在 9 月 13 日发布的 o1-preview 模型后，o1 系列凭借其强大推理能力和解决问题能力得到大家广泛关注。

有业内人士表示，o1 开创了“强化学习的 Scaling Laws”，即“Inference Law”，算力收益要比训练获得的大得多。

对 Inference 系统 1（快思考）和系统 2（慢思想）的讨论一时间成为业内探讨的热点，而该理论正是出自诺贝尔经济学奖得主 Daniel Kahneman 的著作《思考，快与慢》。

英伟达高级科学家 Jim Fan 在 o1 发布后第一时间表示，大量计算将被转移到服务推理而不是训练前/后，o1 将成为数据飞轮，反过来将进一步优化 GPT 未来版本的推理核心。

周鸿祎对 OpenAI 的前瞻性解读

OpenAI o1-preview 在产品中应用 Inference 的背后，正是通过“思维链（CoT）”实现的。基于强化学习，o1 将棘手的问题分解为更简单的步骤，再交给多个子模型来解决，从而提高模型的推理能力。

o1 的思维链模式与 360 的“慢思考”不谋而合。周鸿祎早在 7 月底 ISC.AI 2024 大会上就提出了用基于智能体的框架打造慢思考系统，从而增强大模型的慢思考能力。

周鸿祎认为，OpenAI 遵循的正是《思考，快与慢》中的双系统理论（Dual Process Theory） —— GPT 和 o 系列分别对应系统 1 和 2。

结合双系统理论，以及 GPT 和 o 系列各自特点，我们能发现：

GPT 系列对应系统 1：负责快速、直觉决策，依赖于经验和情感，多模态，快速语言响应；
o1 系列对应系统 2：负责较慢、仔细的思考和推理，依赖逻辑和理性分析，多模态，思维链慢速复杂推理；

周鸿祎还表示，双系统理论的重点/核心在于两种系统并非独立而是协同运作，而 OpenAI 内部构建的更加智能的模型或许是 GPT 和 o 系列的融合/系统。

OpenAI 此前在文章中提到，o1 在对推理要求高的领域受欢迎程度远超 GPT4-o，但是语言为中心的领域却相反，表明两者能力所及互补而非冲突。

OpenAI 除了不断改进 o1 新系列外，还会不断改进 GPT 系列，由此也可知，o1 并不是GPT 的继任者，即两者并非冲突关系，相反大概率是互补关系。

根据周鸿祎的推测，OpenAI 内部可能正在构建双系统的大模型 —— GPT 以及 o1 两个系统将协同运作，当 GPT 的快速反应不足以应对复杂情况时，o1 会介入进行更深入的分析。

CoE 架构与 OpenAI 思维链不谋而合

OpenAI 在“双系统”与思维链的实践，与周鸿祎此前在 7 月底 ISC.AI 2024 大会上宣布的“基于智能体框架打造慢思考系统，从而增强大模型慢思考能力”观点不谋而合。

周鸿祎也在近期多次强调，通过智能体框架，让大模型从快思考切换成慢思考，用多个大模型组合协作来解决业务问题。或许这就是通往 AGI 路上，海内外头部 AI 玩家所给出的答案。

7 月底，360 在正式发布的 CoE（Collaboration-of-Experts，专家协同）架构中强化了推理的使用。

不同于 MoE（Mixture-of-Experts）架构的稀疏混合专家模型，一次只能调用其中的一个专家模型回答，CoE 架构则能让多个模型分工协作、并行工作，执行多步推理。

CoE 模型拥有更精细的分工、更好的鲁棒性、更高的效率和可解释性和更强的泛化能力，可以在加快推理速度的同时，降低 API 和 Token 的使用成本。

CoE 的实际应用，效果超 GPT-4o

目前，CoE 架构在 360 牵头下，已经接入了国内 16 家国内主流大模型厂商的 54 款大模型产品。

产品方面，360 已经有多款基于 CoE 架构的产品上线，360 AI 搜索和 360 AI 浏览器就是基于 CoE 架构的典型应用，涉及多次大模型调用来回复用户意图。

1）CoE 架构实际体验

对于实际体验，用户可以访问 https://www.sou.com/ 打开 360 AI 搜索，在「深入回答」模式中输入“为什么中秋节要吃月饼”，360 AI 搜索便会启动 AI 多任务智能体（Agent）来进行用户搜索意图识别：

值得一提的是， 360 AI 搜索会通过默认的 AI 模型来搜集和总结资料，当然用户也可以在「标准回答」模式中选择任意第三方 AI 模型进行资料的搜集与梳理：

在使用中，360 AI 搜索首先会通过意图分类模型对“为什么中秋节要吃月饼”进行 1 次意图识别。

接下来，360 AI 搜索将调用 1 次搜索改写模型，将用户意图改写成“中秋节吃月饼的起源”、“中秋节吃月饼的文化内涵”以及“不同地区中秋节吃月饼的习俗差异”等 5 个子意图。

随后，360 AI 搜索会通过选择的 AI 大模型对改写的 5 个子意图分别进行搜索，并按一定顺序罗列出来：

最终，通过 AI 大模型从精选的 29 篇参考资料对分类后的 5 个子意图进行总结回复：

360 AI 搜索也支持通过脑图的形式来帮助用户快速找到感兴趣的内容：

此外，360 AI 搜索也支持构建 AI 工作流，使得多个大模型协同运作。比如，面对一道古诗词中译英题目，路由模块就会调用起翻译、反思等多个模型，让这些模型分工配合、共同完成任务：

CoE 架构除了在 360 AI 搜索的应用，还有 360 AI 浏览器中的 AI 助手。用户可以访问 https://bot.360.com/ 来体验其最新的多模态协作功能。

点击左边栏「多模型协作」，用户可以从 16 家国内主流大模型厂商的 54 款大模型中任意选择 3 款大模型进行多模型协作。

在设计思路上，AI 助手设置了“专家”、“反思者”以及“总结者”三个选项，用户需要在每个选项中确定一个模型：

这样即使在第一个专家模型在测试中给出了错误回答，反思模型与总结模型也能通过协作修正结果。

还是以“为什么中秋节要吃月饼”为例，分别选择豆包、文心一言以及智谱清言作为测试模型，首先是豆包作为“专家”给出了初步回答：

接下来，文心一言作为“反思者”对豆包回答的内容进行建议与优化：

最后，由智谱清言作为“总结者”对前两个模型回答进行总结：

目前，AI 助手上线的是三模型协作版本，360 产品团队还计划在 9 月底推出五模型或更多模型协作的版本。

2）CoE 架构的开创性

基于 CoE 架构的方案与 OpenAI o1 通过多个子模型实现“慢思考”的理念类似，而主要差异点在于 CoE 架构集合了国内各家大模型能力，OpenAI 则是基于自研的模型。

360 CoE 架构比 OpenAI 更具开创性的点在于 —— CoE 技术架构不仅为 360 AI 搜索以及 360 AI 浏览器提供了底层技术，同时与国内多家主流大模型厂商通力协作，为国内大模型创造了更开放和多元的环境，而非像 OpenAI 在美国那样。

根据行业专家张俊林的观点，o1-preview 之所以能够更强，其方法本质上是思维链的自动化。

而对于同样应用思维链，且在 7 月底就已推出 CoE 技术架构来讲，则是通过“多系统协同”的方式实现“慢思考”和思维链自动化的。

并且，就在 o1-preview 上线的同时，360 还推出了基于 CoE 架构AI助手-多模型协作（bot.360.com）。用户可以在已经接入 CoE 的大模型中，任意调用三个模型协同工作，实际体验多模型协作中 1+1+1>3 的反思决策效果。

经过 21道复杂逻辑推理题测试结果显示，其效果在多个维度都超越了 GPT-4o，有时还能超越 o1-preview。

http://mp.weixin.qq.com/s?__biz=Mzg3NDkyMTQ5Mw==&mid=2247495860&idx=1&sn=5b716ec55e2fa9899897020b8e415755

无限向新力。

最新文章

深度｜OpenAI o1 的思维链与周鸿祎的慢思考

深度｜VC 今年以来对 AI 初创公司投资达 641 亿美元，接近 2021 年峰值，但全球 AI 年收入总额也才数百亿美元

速递｜英伟达将以 1.65 亿美元收购 AI 初创公司 OctoAI，公司最高峰估值 9 亿美元

速递｜减少英伟达依赖！字节跳动计划向台积电订购数十万块自研 5 nm 芯片，集群性能是 H100 四倍

活动｜S 创上海 2024 日程发布！本年度最值得期待的科创大会不容错过

深度｜OpenAI 最快明年 IPO！1500 亿美元估值背后，年净亏损将超 50 亿美元

速递｜红杉美国 Pat Grady 高盛分享：基础模型投资达 1.5 亿美元，应用层将出现更多 AI 独角兽，资金也高一个数量级

速递｜突发！OpenAI 凌晨发布 o1 系列推理模型的两个 o1-preview 以及 o1-mini，旨在真正像人类一样思考

速递｜智谱携清言视频通话功能亮相 2024 服贸会，开启 AI 新体验

深度｜英伟达飙升 8%！黄仁勋告诉高盛 CEO —— AI 芯片需求实在是太大了！每个客户都想要，都想变强

速递｜李彦宏最新内部讲话：十个大模型认知误区 —— 从大模型竞争、开源模型效率到智能体趋势

速递｜曝 OpenAI 两周内发布“草莓”模型！比 GPT-4o 更会“思考”，最高定价每月 2000 美元

深度｜Anthropic “第八位联合创始人”：Siri 这类产品不是创业公司机会，AI 在这些电商和社交领域有数十亿美元市场

深度｜Siri 满血复活？苹果凌晨发布 iPhone16 系列，搭载最新 A18 芯片与 Apple Intelligence

活动｜2024 年度最值得期待的科创大会来了！全嘉宾阵容公布

深度｜Andrej Karpathy 最新思考：小模型有巨大潜力，大模型用来处理多任务，AI 模型未来聚焦于处理重要信息的能力

速递｜马斯克 xAI 将与特斯拉 FSD 分成，并为车内 AI 语音助手以及 Optimus 提供支持

深度｜高盛最新 AI 洞察：最终赢家是那些坐上“顺风车”的公司，下一阶段将为平台类公司创造机会

速递｜刚刚，穹彻智能完成数亿元 Pre-A 轮融资！Prosperity7 和广发信德领投，还有创新工场、奇绩创坛以及璞跃中国等

速递｜刚刚，Ilya Sutskever 创立的 SSI 获红杉美国以及 a16z 10 亿美元投资，估值 50 亿美元

速递｜付费率仅 0.1～1%！由于性能和成本问题，微软 365 Copilot 遭 Salesforce 与 SAP 吐槽

速递｜OpenAI 基础设施计划曝光！从数据中心到能源，在美投资数百亿美元；联合加拿大、韩国、日本和阿联酋组建全球投资者联盟

速递｜突发！美国消费品安全委员会呼吁对 Shein 以及 Temu 等跨境电商展开调查

深度｜AI + 约会 —— a16z 正在关注的赛道：Tinder 付费用户连续 7 个季度下降，场景变迁背后的需求变化与增长点

速递｜曝字节跳动与银行洽谈 95 亿美元贷款

深度｜红杉美国对话 Sierra 联合创始人 Clay Bavor：B2B AI Agent 如何做到 PMF 以及客户满意？

速递｜Convariant 被亚马逊“收购” ！华人创始团队及 AI 大牛 Pieter Abbeel 将加入机器人配送部门

深度｜Anthropic 创始人 Dario Amodei 最新洞察：关于护城河与风险，AI 大多数情况很难直接替代人

速递｜为什么 OpenAI 需要 IPO？

速递｜突发！曝苹果、英伟达和微软都将参与 OpenAI 新一轮 Thrive 牵头的融资，估值超 1000 亿美元

速递｜Meta 新款 MR 设备曝光！代号 Puffin，重量为 Quest 1/5 ，用户可通过手势与眼球运动交互

速递｜500 亿美元回购！英伟达二季度营收 300 亿美元，同比增长 122%！全年毛利率维持 70%，三季度增速放缓至两位数

活动｜AI+Companion 分享回顾：a16z 榜单中陪伴产品整体更加集中靠前，国内出海产品迭代频次更高，运营与变现能力更强

深度｜OpenAI 今秋发布“草莓”模型！应用于旗舰模型 Orion 训练和即将推出的 Agent，微软合作条款也将发生变化

速递｜刚刚，海德氢能获中国石化恩泽基金与愉悦资本共同投资，此前曾获真格基金天使轮投资

速递｜拼多多暴跌近 30%！CEO 陈磊表示电商行业竞争加剧，营收增速放缓；分析师调低盈利预期至明年

速递｜苹果官宣 9 月 9 日举办 iPhone16 发布会！标语为 Glowtime，暗示重新设计的 Siri 界面

速递｜英伟达第二季度销售额有望翻倍！分析师预计营收 286 亿美元，利润 187 亿美元

速递｜日本今年最大 IPO！闪存制造商 Kioxia 估值超 100 亿美元，预计 10 月上市

速递｜分家！拿了 2.2 亿美元融资不到三个月，DeepMind 系 AI 初创公司 H 因运营分析，两位联合创始人离开

速递｜突发！近 10 亿用户社交媒体 Telegram 创始人&CEO 在法国巴黎被捕！

速递｜外媒曝 Coatue 考虑出售数亿美元字节跳动股份

深度｜软件吞噬世界，我们错失了什么？

速递｜里程碑！Anthropic Claude 移动应用收入超过 100 万美元

深度｜重磅！a16z 发布 Top100 AI 产品最新榜单：Perplexity 时长超 ChatGPT，字节多款应用上榜

深度｜红杉第三代掌门人：创业公司需要建立一种允许犯错的文化，99% 已知生物都已经消失，生存的唯一途径是尝试新事物

速递｜捕捉 AI 时代 IP 价值！a16z 联手 K11 郑志刚投资了一位欧巴，也是韩国最大区块链基金 Hashed 合伙人

深度｜Cohere 创始人最新思考：模型进展已经变得越来越难！AI 下一个大的突破在机器人，模型需要更强大更便宜

速递｜OpenAI 正式推出 GPT-4o 微调服务！

深度｜AI+Marketplaces：Agent 如何模糊货架电商与兴趣电商的界限？以国内出海项目 TargetPilot 为例

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉