数学家陶哲轩谈o1推理模型突破传统AI局限，让我们有望打开未知领域的新大门

文摘 2024-10-13 07:30 上海

（关注公众号并设为🌟标，获取最新人工智能资讯和产品）

全文约3,000 字，阅读约需6分钟

陶哲轩（Terence Tao）加州大学洛杉矶分校的数学教授，被誉为现实版的超级智能。他有时被称为“数学界的莫扎特”，并被公认为当今世界最伟大的数学家。他凭借在数学领域的突破和证明，获得了诸多奖项，其中包括数学界的诺贝尔奖。目前，AI 的水平还远不及他。

但科技公司正努力缩小这个差距。最近吸引眼球的 AI 模型——包括大名鼎鼎的 ChatGPT——并非为处理数学推理而设计，它们的侧重点在语言上：当你提问时，它们不会理解并计算方程或证明，而是基于常见的词语顺序生成答案。举例来说，早期的 ChatGPT 无法进行加法或乘法，但因为它接触过大量的代数示例，所以可以解决 x + 2 = 4 这样的方程：“要解决方程 x + 2 = 4，从两边减去 2……” 但如今，OpenAI 正在推出一系列名为 o1 的“推理模型”，宣传其能够“像人类一样”解决问题，处理复杂的数学和科学任务。如果这些模型取得成功，它们或将彻底改变陶与其同行们过去所面对的缓慢而孤独的数学研究方式。

在看到陶哲轩在线上分享了他对 o1 系列的印象——他将其比作“表现平平，但不算完全无能”的研究生——之后，我想了解他对这项技术潜力的看法。在上周的一次 Zoom 通话中，他谈到了一种 AI 支持下的“工业级数学”，这是以前从未实现过的。他认为，至少在近期，AI 不会成为独立的创造性合作者，而更像是推动数学家提出假设和探索方法的催化剂。这种新型数学有望揭开未知领域的大门，但核心依然是人类，强调了人类与机器在能力上的不同，二者应被视为互补，而非竞争。

unset对话整理unsetunset

记者Matteo Wong：你第一次使用 ChatGPT 时的感受如何？

嘉宾陶哲轩：它一出来我就试用了。我给它出了一些复杂的数学问题，但它的回答很可笑。虽然语言通顺，用词也准确，但几乎没有什么深度。对于真正高级的数学问题，早期的 GPT 并没有什么令人印象深刻的表现。不过，它在一些有趣的小任务上表现还不错，比如你想用诗歌或儿童故事的方式解释某个数学概念，那它还是挺惊艳的。

Wong： OpenAI 说 o1 可以“推理”，但你却把它比作“中等水平，但不算完全无能”的研究生。

陶哲轩： 那句评价传播得很广，但实际上被误解了。我并不是说这个工具在所有研究生的学习环节上都表现得一样好。我更关心的是将这些工具用作研究助手。做研究有很多繁琐的步骤：你可能有了一个想法，但要展开计算，得自己动手去做所有工作。

Wong： 所以它是个平庸或不太称职的研究助手？

陶哲轩： 对，作为研究助手，它的表现就是这样的水平。但我确实能想象到未来你可以通过与 AI 对话来完成研究。比如你有了一个想法，AI 会根据这个想法进行推演，补充细节。

在其他领域已经出现了这种情况。AI 早在多年前就征服了国际象棋，但今天国际象棋依然非常活跃，因为即便是中等水平的棋手，也可以通过国际象棋引擎预测未来的 20 步。我可以想象类似的场景也会出现在数学领域：你有一个研究项目，想问“如果我尝试这种方法会怎么样？” 而无需自己花费数小时去验证，而是引导 GPT 为你做这些工作。o1 有点具备这种能力。我给它出了一个我知道答案的题目，试图引导它解答。起初我给了它一个提示，它忽视了提示，做了其他不对的事情。我解释了问题所在，它道歉说：“好吧，我会按照你的方式来做。”然后它合理地执行了我的指示，但随后又卡住了，我又得重新纠正它。模型从未找到最聪明的解决方法。它可以做所有常规的事情，但缺乏创造性。研究生和 AI 的一个关键区别是研究生会学习。当你告诉 AI 它的方法不对时，它会道歉，可能会暂时修正错误，但有时又会回到原来的思路。而如果你重新启动会话，AI 又会从头开始。我对研究生的耐心更大，因为即使他们暂时无法解决问题，他们依然有学习和进步的潜力。

Wong： OpenAI 说 o1 可以识别自己的错误，但你认为这和持续学习不同，而人类正是通过持续学习让错误变得有价值。

陶哲轩： 没错，人类有成长的过程。这些模型是静态的——我对 GPT-4 的反馈可能只占 GPT-5 训练数据的 0.00001%。但这和学生学习是不一样的。AI 和人类在学习和解决问题的方式上有很大的不同——我觉得应该将 AI 看作是完成任务的一种互补方式。很多任务由 AI 和人类分别做不同的部分，效果会更好。

Wong： 你之前提到过，计算机程序有可能改变数学，促进人类之间的合作。具体是怎么实现的？生成式 AI 有什么贡献吗？

陶哲轩： 严格说起来，这些工具不算 AI，但像证明助手这样的计算机工具非常有用，它们可以验证数学论证是否正确。这让数学的协作在大规模上成为可能。这是一个全新的突破。数学非常精细：如果证明中的某个步骤出错，整个论证就会崩塌。如果你有一个 100 人的合作项目，大家把证明分成 100 个部分，每个人负责其中一个部分。但如果他们没有很好的协调，最后各部分可能不匹配。因此在数学项目中，超过五个人合作是非常罕见的。

有了证明助手，你不需要完全信任合作伙伴，因为程序可以给出 100% 的验证。这就使得“工业化生产”式的大规模数学研究成为可能，这种模式目前还不存在。一个人只需要专注于某类特定结果的证明，就像现代供应链一样。问题是这些程序对格式要求很高。你必须用特定的编程语言来写证明——而不能直接用英文。AI 或许可以在这方面提供帮助，把人类的语言翻译成程序能理解的格式。大型语言模型几乎就是为这种语言翻译任务设计的。理想的情况是，你和聊天机器人对话，解释你的证明，机器人就能自动将其转换成证明系统的语言。

Wong： 所以聊天机器人不是提供知识或创意的来源，而是作为一种交互工具？

陶哲轩： 是的，它可以起到非常有用的“粘合剂”作用。

Wong： 那它可能帮助解决的是什么类型的问题？

陶哲轩： 传统的数学研究往往选择极其困难的问题，然后由一两个人闭门研究多年，不断尝试。你想用 AI 攻克的问题恰好是相反的。如果你直接让 AI 解决数学中最难的问题，我认为不会有很大的成功，而且这些问题已经有人类在努力解决了。我感兴趣的数学类型是那些现在还几乎不存在的领域。我几天前刚启动的一个项目，涉及到“普遍代数”领域，它研究的是某些数学命题或方程是否能够推导出其他命题的正确性。过去人们研究这类问题时，往往选择一两个方程进行深入探讨，就像手工艺人逐一制作玩具。现在有了工厂，我们可以一次批量生产成千上万个玩具。在我的项目中，有约 4000 个方程，任务是找到它们之间的联系。每个方程本身都相对简单，但它们之间有上百万种推论。在这些成千上万的方程中，大概有 10 个被充分研究过，它们像是 10 点星光，而其余的领域则是完全未知的。

在其他领域已经出现了类似的转变，比如遗传学。过去，如果你想为一个生物体进行基因组测序，这几乎是一个博士论文的规模。而现在有了基因测序机器，遗传学家可以为整个群体进行测序。通过这种方式，你可以进行不同形式的遗传学研究。与其让一个专家在人类擅长的狭窄领域进行深度研究，不如通过 AI 和众包的方式解决更广泛的问题，虽然可能研究深度较浅，但规模更大。这将是一种非常互补的方式来获取数学新发现。

Wong： 这让我想起了 Google DeepMind 的 AlphaFold，曾经我们需要逐个预测蛋白质的三维结构，而现在 AI 可以自动解决这个问题。

陶哲轩： 没错，但这并不意味着蛋白质科学就没用了。问题的焦点会发生转变。150 年前，数学家的主要任务是解决偏微分方程。现在有计算机程序可以自动完成这个工作。600 年前，数学家在为航海创建正弦和余弦表，而现在电脑几秒钟就可以完成这些工作。

我对重复人类已经擅长的事情并不感兴趣，因为这效率很低。我认为在前沿领域，总是需要人类与 AI 共同合作。它们的能力是互补的。AI 在处理海量数据并提炼出一个好的答案方面很擅长，而人类擅长从少数观察中做出富有创意的推测。

原文来源：https://www.theatlantic.com/technology/archive/2024/10/terence-tao-ai-interview/680153/

素材来源官方媒体/网络新闻

对了，喜欢就别忘了点赞、收藏、转发支持一下！期待在评论区听到你的观点和看法!

往期回顾

1、[演讲视频：2024年第65届国际奥数大会上，陶哲轩再次表示当前AI进展惊人，智能水平已与人类相当]

2、[在2024的AII-IN峰会，对话马斯克：他预言AI很快将带来空前社会繁荣，每个人都能获得梦寐以求的一切]

3、[对话OpenAI 董事主席Bret Taylor：AI带来的新商业模式，预测科技将影响我们的工作和社交方式]

我们旨在将先进科技与创新想法完美融合!

想要掌握人工智能，但不知从何开始？告诉我们你的需求，学习AI让你抓住这波浪潮

unsetunset告别昂贵服务和缺人烦恼,再见漫长交付周期unsetunset

unsetunset无限创意,快速生成专业级产品unsetunset

unsetunset感受 AI 带来的全新工作体验！unsetunset

欢迎各大品牌方、媒体、企业和个人等

请联系负责人微信：Milo-1101

--END--

http://mp.weixin.qq.com/s?__biz=Mzg5NTc4ODkzOA==&mid=2247493607&idx=2&sn=4a1ecd2b67c60b5e0bc1207ffe9dcb2a

AI深度研究员

AI时代刚刚到来，一切才刚开始，我们正当其时！

最新文章

联想科技大会上,杨元庆对话黄仁勋：不是所有AI芯片都能成功,关键在技术栈

对话Sam Altman：OpenAI新战略下，与主流路线不同的AI创业机会（附完整视频）

微软AI CEO穆斯塔法：AI将在 2025 年实现记忆并释放出新的创造力，将成为我们的“第二大脑”

未来智能学家Roey Tzezana：为什么我们突然间发现AI无处不在？一个通俗解读的角度

全球顶级对冲基金桥水视角:当前AI产品实用性有限的深层原因以及下一阶段突破路径

完整o1 模型即将发布！刚刚Sam Altman和团队答疑：今年不会有GPT-5，但多个AGI项目正在路上

比尔盖茨最新采访：技术正在改变一切，AI将带领人类走得更远（附视频）

FTT大会上，创新工场李开复发言：我坚信公司只有两种命运—全面拥抱AI或破产出局，没有第三条路！

深度思考|别只顾着堆AI了,这个转型方向或许更值得企业关注

马斯克表示：AI增长曲线每年10倍跃升，预计5年内AI将比所有人类加起来还要聪明（附视频）

CNN对话软银CEO孙正义：超级AI不仅会在2035年到来，还将具备万倍于人类的智能

Cuebric AI CEO亲述：曾被原公司AI系统取代失业，如今创办AI公司重新定义职业路线（附视频）

AI引发失业潮：为什么经济学家说这次'没有先例可循'？

专访Waymo CEO: 融资56亿美金后，第六代AI无人驾驶出租车将实现全场景商业化能力

世界经济论坛上，伯克利Stuart Russell教授的观点：AI时代你需要掌握的实用技能

哥伦比亚大学杨立昆演讲：大模型只是AI发展阶段性成果，但下一步AI革命制胜关键不会依赖于此（附视频）

电力改变物理世界，AI将改变认知世界-对话美国前财长萨默斯：AI自我进化能力将重塑人类社会

真正的助手：AI 将不再是专门工具，我们用指令让AI像熟练员工一样运用各类软件完成工作

微软CEO纳德拉演讲：AI革命引发汇丰和麦肯锡等大企业抢占商业先机,人类将步入无处不在的AI代理世界

OpenAI首席产品官Kevin Weil分享公司最新AI产品路线图，并透露其在AI行业中保持领先策略

硅谷风投大佬Marc Andreessen：AI不止于自动化,它是一台具备艺术创作能力的新型计算机

当AI开始思考：MIT教授、《人工智能时代》作者胡滕洛赫尔前瞻性演讲，探讨AI发展趋势及其对未来的革命性影响

泰晤士报专访新晋化学奖得主Hassabis：10年内AI将成为我们私人代理，定制旅行计划和预订机票酒店

在密歇根大学访谈，Sam Altman谈AI增长曲线的关键拐点,以及草莓模型o1与GPT-5的潜在关联

AI播客NotebookLM更新了：人人都可以利用AI快速做樊登读书，成为知识付费达人

斯坦福AI研讨会：吴恩达教授分享通过AI简化编程，让每个行业的个人都能轻松上手并提升工作效率（视频）

美国第一智库布鲁金斯学会AI调研：调查1000+行业后，当前AI发展远超人类认知呼吁企业和个人必须尽快掌握AI技术

Meta首席AI科学家杨立昆演讲：当前处于AI什么阶段，以及我们距离实现真正通用AI还有多远？

上周，马斯克极限60小时内展示AI时代与太空未来，百句经典语重现他传奇历程

（视频）英伟达黄仁勋访谈：从日常研究到战略规划，AI正改变CEO们的工作方式与思维模式

彭博社专访Runway CEO：现场讲解AI视频技术，并手把手教学如何用AI秒生精美视频

创意营销模式：7个超高质量AI广告,你觉得哪个做的最好?

Anthropic CEO 万字长文：我认为AGI最早会在 2026 年出现，机器可以像人类一样协助办公

数学家陶哲轩谈o1推理模型突破传统AI局限，让我们有望打开未知领域的新大门

“WE, ROBOT”发布会上，马斯克视频演讲：基于 AI 技术特斯拉无人驾驶出租车即将改变世界

对话AI代理CEOJake Heller: Casetext如何在AI热潮中脱颖而出,以6.5亿美元的高价被收购

近期奖金最大的AI视频创作大赛，百万奖金等你来拿！！！

对话2024化学奖得主谷歌Demis Hassabis：利用AI设计蛋白质，人工智能被证明是未来各领域的关键技术

哈佛大学AI报告会上，前美国财长萨默斯对话肯尼迪学院教授：AI将成为各行各业的必备工具,使用频率只增不减

诺奖现场采访2024物理学得主Hinton：当前AI革命堪比工业革命，且将在智力上全面超越人类

BBC专题报道：AI让普通人创造好莱坞级别作品,独立AI创作者借此打造数十亿美元个人IP

在OpenAI开发者大会，CEO Sam Altman谈AGI时间表，同时展望AGI时代我们的生活变化

沃顿商学院AI研讨会：AI对全球经济格局、企业战略和就业市场的多维度影响

专访OpenAI投资的1X公司CEO：AI如何接管人类不喜欢的日常任务，让人类专注于更有价值的事业

在软银世界2024大会，CEO孙正义演讲：他相信通用人工智能将在两三年内实现

吴恩达教授访谈：利用AI技术突破学习障碍，将你的创意无缝转化为功能完备的APP

OpenAI官方AI指南: 5位职业作家的实战经验,帮你提高与AI沟通效率

AI分析案例：各行各业的打工人如何巧妙运用人工智能来提高工作效率

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉