数学家陶哲轩谈o1推理模型突破传统AI局限,让我们有望打开未知领域的新大门

文摘   2024-10-13 07:30   上海  

(关注公众号并设为🌟标,获取最新人工智能资讯和产品)

全文约3,000 字,阅读约需6分钟

陶哲轩(Terence Tao)加州大学洛杉矶分校的数学教授,被誉为现实版的超级智能。他有时被称为“数学界的莫扎特”,并被公认为当今世界最伟大的数学家。他凭借在数学领域的突破和证明,获得了诸多奖项,其中包括数学界的诺贝尔奖。目前,AI 的水平还远不及他。

但科技公司正努力缩小这个差距。最近吸引眼球的 AI 模型——包括大名鼎鼎的 ChatGPT——并非为处理数学推理而设计,它们的侧重点在语言上:当你提问时,它们不会理解并计算方程或证明,而是基于常见的词语顺序生成答案。举例来说,早期的 ChatGPT 无法进行加法或乘法,但因为它接触过大量的代数示例,所以可以解决 x + 2 = 4 这样的方程:“要解决方程 x + 2 = 4,从两边减去 2……” 但如今,OpenAI 正在推出一系列名为 o1 的“推理模型”,宣传其能够“像人类一样”解决问题,处理复杂的数学和科学任务。如果这些模型取得成功,它们或将彻底改变陶与其同行们过去所面对的缓慢而孤独的数学研究方式。

在看到陶哲轩在线上分享了他对 o1 系列的印象——他将其比作“表现平平,但不算完全无能”的研究生——之后,我想了解他对这项技术潜力的看法。在上周的一次 Zoom 通话中,他谈到了一种 AI 支持下的“工业级数学”,这是以前从未实现过的。他认为,至少在近期,AI 不会成为独立的创造性合作者,而更像是推动数学家提出假设和探索方法的催化剂。这种新型数学有望揭开未知领域的大门,但核心依然是人类,强调了人类与机器在能力上的不同,二者应被视为互补,而非竞争。

unset对话整理unsetunset

记者Matteo Wong:你第一次使用 ChatGPT 时的感受如何?

嘉宾陶哲轩:它一出来我就试用了。我给它出了一些复杂的数学问题,但它的回答很可笑。虽然语言通顺,用词也准确,但几乎没有什么深度。对于真正高级的数学问题,早期的 GPT 并没有什么令人印象深刻的表现。不过,它在一些有趣的小任务上表现还不错,比如你想用诗歌或儿童故事的方式解释某个数学概念,那它还是挺惊艳的。


Wong: OpenAI 说 o1 可以“推理”,但你却把它比作“中等水平,但不算完全无能”的研究生。

陶哲轩: 那句评价传播得很广,但实际上被误解了。我并不是说这个工具在所有研究生的学习环节上都表现得一样好。我更关心的是将这些工具用作研究助手。做研究有很多繁琐的步骤:你可能有了一个想法,但要展开计算,得自己动手去做所有工作。

Wong: 所以它是个平庸或不太称职的研究助手?

陶哲轩: 对,作为研究助手,它的表现就是这样的水平。但我确实能想象到未来你可以通过与 AI 对话来完成研究。比如你有了一个想法,AI 会根据这个想法进行推演,补充细节。

在其他领域已经出现了这种情况。AI 早在多年前就征服了国际象棋,但今天国际象棋依然非常活跃,因为即便是中等水平的棋手,也可以通过国际象棋引擎预测未来的 20 步。我可以想象类似的场景也会出现在数学领域:你有一个研究项目,想问“如果我尝试这种方法会怎么样?” 而无需自己花费数小时去验证,而是引导 GPT 为你做这些工作。o1 有点具备这种能力。我给它出了一个我知道答案的题目,试图引导它解答。起初我给了它一个提示,它忽视了提示,做了其他不对的事情。我解释了问题所在,它道歉说:“好吧,我会按照你的方式来做。”然后它合理地执行了我的指示,但随后又卡住了,我又得重新纠正它。模型从未找到最聪明的解决方法。它可以做所有常规的事情,但缺乏创造性。研究生和 AI 的一个关键区别是研究生会学习。当你告诉 AI 它的方法不对时,它会道歉,可能会暂时修正错误,但有时又会回到原来的思路。而如果你重新启动会话,AI 又会从头开始。我对研究生的耐心更大,因为即使他们暂时无法解决问题,他们依然有学习和进步的潜力。


Wong: OpenAI 说 o1 可以识别自己的错误,但你认为这和持续学习不同,而人类正是通过持续学习让错误变得有价值。

陶哲轩: 没错,人类有成长的过程。这些模型是静态的——我对 GPT-4 的反馈可能只占 GPT-5 训练数据的 0.00001%。但这和学生学习是不一样的。AI 和人类在学习和解决问题的方式上有很大的不同——我觉得应该将 AI 看作是完成任务的一种互补方式。很多任务由 AI 和人类分别做不同的部分,效果会更好。

Wong: 你之前提到过,计算机程序有可能改变数学,促进人类之间的合作。具体是怎么实现的?生成式 AI 有什么贡献吗?

陶哲轩: 严格说起来,这些工具不算 AI,但像证明助手这样的计算机工具非常有用,它们可以验证数学论证是否正确。这让数学的协作在大规模上成为可能。这是一个全新的突破。数学非常精细:如果证明中的某个步骤出错,整个论证就会崩塌。如果你有一个 100 人的合作项目,大家把证明分成 100 个部分,每个人负责其中一个部分。但如果他们没有很好的协调,最后各部分可能不匹配。因此在数学项目中,超过五个人合作是非常罕见的。

有了证明助手,你不需要完全信任合作伙伴,因为程序可以给出 100% 的验证。这就使得“工业化生产”式的大规模数学研究成为可能,这种模式目前还不存在。一个人只需要专注于某类特定结果的证明,就像现代供应链一样。问题是这些程序对格式要求很高。你必须用特定的编程语言来写证明——而不能直接用英文。AI 或许可以在这方面提供帮助,把人类的语言翻译成程序能理解的格式。大型语言模型几乎就是为这种语言翻译任务设计的。理想的情况是,你和聊天机器人对话,解释你的证明,机器人就能自动将其转换成证明系统的语言。


Wong: 所以聊天机器人不是提供知识或创意的来源,而是作为一种交互工具?

陶哲轩: 是的,它可以起到非常有用的“粘合剂”作用。

Wong: 那它可能帮助解决的是什么类型的问题?

陶哲轩: 传统的数学研究往往选择极其困难的问题,然后由一两个人闭门研究多年,不断尝试。你想用 AI 攻克的问题恰好是相反的。如果你直接让 AI 解决数学中最难的问题,我认为不会有很大的成功,而且这些问题已经有人类在努力解决了。我感兴趣的数学类型是那些现在还几乎不存在的领域。我几天前刚启动的一个项目,涉及到“普遍代数”领域,它研究的是某些数学命题或方程是否能够推导出其他命题的正确性。过去人们研究这类问题时,往往选择一两个方程进行深入探讨,就像手工艺人逐一制作玩具。现在有了工厂,我们可以一次批量生产成千上万个玩具。在我的项目中,有约 4000 个方程,任务是找到它们之间的联系。每个方程本身都相对简单,但它们之间有上百万种推论。在这些成千上万的方程中,大概有 10 个被充分研究过,它们像是 10 点星光,而其余的领域则是完全未知的。

在其他领域已经出现了类似的转变,比如遗传学。过去,如果你想为一个生物体进行基因组测序,这几乎是一个博士论文的规模。而现在有了基因测序机器,遗传学家可以为整个群体进行测序。通过这种方式,你可以进行不同形式的遗传学研究。与其让一个专家在人类擅长的狭窄领域进行深度研究,不如通过 AI 和众包的方式解决更广泛的问题,虽然可能研究深度较浅,但规模更大。这将是一种非常互补的方式来获取数学新发现。


Wong: 这让我想起了 Google DeepMind 的 AlphaFold,曾经我们需要逐个预测蛋白质的三维结构,而现在 AI 可以自动解决这个问题。

陶哲轩: 没错,但这并不意味着蛋白质科学就没用了。问题的焦点会发生转变。150 年前,数学家的主要任务是解决偏微分方程。现在有计算机程序可以自动完成这个工作。600 年前,数学家在为航海创建正弦和余弦表,而现在电脑几秒钟就可以完成这些工作。

我对重复人类已经擅长的事情并不感兴趣,因为这效率很低。我认为在前沿领域,总是需要人类与 AI 共同合作。它们的能力是互补的。AI 在处理海量数据并提炼出一个好的答案方面很擅长,而人类擅长从少数观察中做出富有创意的推测。


原文来源:https://www.theatlantic.com/technology/archive/2024/10/terence-tao-ai-interview/680153/

素材来源官方媒体/网络新闻

对了,喜欢就别忘了点赞、收藏、转发支持一下!期待在评论区听到你的观点和看法!

往期回顾

1、[演讲视频:2024年第65届国际奥数大会上,陶哲轩再次表示当前AI进展惊人,智能水平已与人类相当]

2、[在2024的AII-IN峰会,对话马斯克:他预言AI很快将带来空前社会繁荣,每个人都能获得梦寐以求的一切]

3、[对话OpenAI 董事主席Bret Taylor:AI带来的新商业模式,预测科技将影响我们的工作和社交方式]


我们旨在将先进科技与创新想法完美融合!

想要掌握人工智能,但不知从何开始?告诉我们你的需求,学习AI让你抓住这波浪潮

unsetunset告别昂贵服务和缺人烦恼,再见漫长交付周期unsetunset

unsetunset无限创意,快速生成专业级产品unsetunset

unsetunset感受 AI 带来的全新工作体验!unsetunset

欢迎各大品牌方、媒体、企业和个人等

请联系负责人微信:Milo-1101

--END--

AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
 最新文章