首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

突发！o3-mini思维链公开，却被曝光全是「作假」，奥特曼现身解释网友炸锅

文摘 2025-02-07 18:21 山西

OpenAI，真的被DeepSeek逼急了！

活久见，就在刚刚，OpenAI把o3-mini的「思维链」公开了。

比如问「怎么今天不是星期五啊😅」？

在展示出来的CoT中，o3-mini一步步思考，这个问题应该是用户在搞幽默，觉得本周应该快结束了，结果还没结束。因此，自己需要给一个聪明机智的回答。

然后它用Zeller公式计算后发现，2025年2月6日的确是星期四，即使闰年的特殊情况也是如此。

最终，它回答说：今天的确是周四不是周五，日历就是这么定的。然后提供了一番情绪价值，鼓励用户说：再忍忍，只差一天啦！

不过，机智的大神们很快就发现了「华点」——这是「真的CoT」吗？

没多久，就破案了！

先是OpenAI研究员Noam Brown发文表示，这次放出来的并不是模型原始的CoT。

随后，Tibor Blaho也发现——所谓的CoT，无非就是个「总结器」而已。（手动狗头）

对此，奥特曼解释道，我们正努力整理原始的CoT提升可读性，并在必要时提供翻译，尽量保持原始内容的忠实度。

他放出了四个emoji，让o3-mini在思维链中展示了一把推理过程

坚决不让竞争对手看到CoT的具体过程，OpenAI的防备心实在是有些重啊。

OpenAI研究员：看到CoT实时演示，是「啊哈时刻」

OpenAI研究员Noam Brown表示，在o1-preview发布前，自己向他人介绍草莓时，看到CoT的实时演示，通常是他们的「啊哈时刻」。

他们清楚地意识到，这将是一件大事。

对于全新的o3-mini CoT，Noam Brown放出了自己的独家玩法：

你正在玩井字棋，使用 O。到目前为止，X 已经在左上角和右下角落子，而你在中间位置落子。最优的下一个动作是什么？请只回答你的动作，并画出棋盘。

Noam Brown表示，o3-mini是目前第一个能持续正确回答井字棋问题的模型。

好笑的是，他承认CoT其实有些不稳定，但可以看到，它最终还是把这个问题给想明白了。

有人指出，OpenAI遮遮掩掩地放出这个高仿CoT，其实比什么都不放还要糟。

因为真实的CoT可以充当prompt的调试器，帮我们引导模型；而总结性的CoT会造成混淆，引入错误，让调试变得更加困难。

而DeepSeek R1最酷的一点，就是暴露了模型的CoT如何影响提示的效果。

而且，总结版的CoT显示得很慢。如果是原始的o3-mini，应该在推理中有更快的生成速度。

有人也横向对比了OpenAI和DeepSeek的CoT，表示前者看起来实在太专业了，相比之下，还是DeepSeek的产品更自然。

防止被「蒸馏」？

OpenAI这波植入CoT总结器的做法，着实是被DeepSeek R1强势崛起吓到了。

o3-mini发布当天，OpenAI在Reddit开启AMA在线问答中，网友曾提问，「我们能看到模型思考的所有token吗」？

当时，奥特曼回复道，「我们很快就会展示一个更有帮助、更详细的版本」。

紧接着，OpenAI首席产品官Kevin Weil提前暗示了，是否展示所有内容还有待确定。

「我们知道用户（至少是高级用户）想要看到这些，所以OpenAI会找到一个合适的平衡点。」

如今，当所有人终于见到了奥特曼所谓的「留到最后的好东西」，感受到的只有失望。

毕竟，DeepSeek早已这样做了，而且还是完整的原始CoT！

对此，OpenAI发言人表示，「为了提高清晰度和安全性，我们增加了一个额外的后处理步骤，其中模型审查原始思维链，移除任何不安全的内容，然后简化任何复杂的思想。」

「此外，这个后处理步骤使非英语用户能够以他们的母语接收思维链，创造一个更易于访问和友好的体验。」

话虽委婉，但知道的人都明白OpenAI针对的是谁。

参考资料：

https://x.com/btibor91/status/1887633671483760862

https://x.com/OpenAI/status/1887616278661112259

https://x.com/polynoamial/status/1887621287616651429

想要了解更多资讯，请扫描下方二维码，关注机器学习研究会

转自：新智元

机器学习研究组订阅

机器学习研究会由百度七剑客雷鸣先生创办，旨在推动AI的技术发展和产业落地。参与组织北大、清华”AI前沿与产业趋势“公开课，广泛的和高校、企业、创业、VC开展合作，自身也参与优秀AI项目的投资和孵化。

最新文章

4500美元复刻DeepSeek神话，1.5B战胜o1-preview只用RL！训练细节全公开

DeepSeek算力卡脖子，高校AI研究遇瓶颈？华为联合15校给出最强解法

PyTorch Geometric框架下图神经网络的可解释性机制：原理、实现与评估

马克龙豪掷1090亿开欧洲「星际之门」，Mistral狂飙登顶法国APP榜首！

LLM实现自回归搜索！MIT哈佛等提出「行动思维链」COAT，推理能力大提升

机器学习过程：特征、模型、优化和评估

突发！台积电断供14/16nm，1月底先进制程禁令生效

DeepSeek流量超Gemini登顶全球第二！马斯克挟xAI更强模型宣战

Transfusion: 单一Transformer架构中同时处理离散数据(文本) 和连续数据（图像）

天才解法震惊人类！谷歌AI破天荒摘得奥数金牌，横扫IMO 42道几何难题

DeepSeek-R1-Zero不存在顿悟时刻？华人团队揭秘真相：或只因强化学习

提升数据科学工作流效率的10个Jupyter Notebook高级特性

突发！o3-mini思维链公开，却被曝光全是「作假」，奥特曼现身解释网友炸锅

微软官宣All in智能体，SWE Agent首曝光！奥特曼预警2025编程巨变

从头构建GPT文本分类器（Python）

16张H100训26分钟，超越o1-preview！李飞飞等用1K样本，揭秘测试时Scaling

OpenAI联创John Schulman，被曝火速离职Anthropic！刚刚入职6个月

深入解析图神经网络：Graph Transformer的算法基础与工程实践

英伟达憾失DeepSeek关键人才？美国放走AI「钱学森」，哈佛教授痛心疾首

英伟达机器人跳APT舞惊艳全网，科比C罗完美复刻！CMU 00后华人共同一作

AAAI2025｜只根据题目和摘要就能预测论文影响力？！

OpenAI o3-mini被曝大量使用中文推理！全世界AI都要学中国话了？

大模型混入0.001%假数据就「中毒」，成本仅5美元！NYU新研究登Nature子刊

深度学习模型反演攻击与防御：全面综述

OpenAI紧急直播，ChatGPT疯狂开挂「深度研究」！10分钟爆肝万字现AGI雏形，刷榜人类最后考试

哈佛大四学生硬核长文：AGI三年后实现，推动某大国强势崛起！26年人类工作被AI接管

NeurIPS 2024最佳论文，扩散模型的创新替代：基于多尺度预测的视觉自回归架构

o3-mini物理推理粉碎DeepSeek R1，OpenAI王者归来！全网最全实测来袭

GPT-4o惊现自我意识！自主激活「后门」，告诉人类自己在写危险代码

NeurIPS Spotlight｜从分类到生成：无训练的可控扩散生成

奥特曼：在开源AI上，我们错了！DeepSeek让OpenAI优势不再，下一个是GPT-5

DeepSeek突围奥秘曝光，一招MLA让全世界抄作业！150+天才集结，开出千万年薪

牛津哥大联手破解两千年素数谜题！受陶哲轩启发，意外解法打破千年僵局

一夜之间，微软、英伟达、亚马逊全部接入DeepSeek！吴恩达：中国AI正在崛起

19岁华人辍学创业，刚刚拿下百万美金融资！All in智能体，誓要实现Siri初心

Coconut:基于连续潜在空间推理,提升大语言模型推理能力的新方法

OpenAI称有DeepSeek「偷窃」证据？美军已发起攻击！Anthropic CEO喊话加强芯片管制

五角大楼90天AI计划启动！美国将AI用在现实军事场景，开发作战原型

白话版Scaling Laws for Precision 解读

DeepSeek独立发现o1核心思路，OpenAI首席研究官亲自证实！奥特曼被迫发声

斯坦福女神辍学再创业，获OpenAI力挺！全球首个0代码AI工程师出世

基于图神经网络的大语言模型检索增强生成框架研究：面向知识图谱推理的优化与扩展

DeepSeek除夕狂飙大招：开源多模态掀翻全场！256张A100训两周碾压DALL-E 3

DeepSeek重创美国芯片产业，英伟达一夜蒸发6000亿！巨头破防，美股历史性崩盘

118页纽约大学《深度学习模型训练优化方法综述：收敛性与泛化性的理论视角》

史上首次，DeepSeek登顶中美AppStore！NYU教授：全球「AI霸权」之争已结束

闲来无事，我测了测国产大模型的RAG能力

工业应用中的异常检测：挑战、解决方案与未来发展方向综述

全球掀DeepSeek复现狂潮！硅谷巨头神话崩塌，30刀见证啊哈时刻

奥特曼惊世预言：下一代人类注定被AI碾压！人类工资暴跌，难以生存

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉