再见GPT,你好o1

百科   2024-11-12 17:57   中国香港  

最近AI圈有点热闹。

万圣节那天,OpenAI的掌门人Sam Altman在Reddit上说了句耐人寻味的话:"我们正在优先发布o1及其后续产品。"

根据The Information的最新报道,这个看似普通的回答背后,其实暗示着AI领域一个重要的转变。

GPT遇到了"成长的烦恼"

说起GPT的近况,有点像遇到了成长期的烦恼。

从GPT-3到GPT-4,那真是突飞猛进,让所有人都惊叹不已。但到了最新的Orion模型,The Information报道说性能提升却不那么明显了。

这种放缓让业界开始反思:传统的AI扩展方式,也就是单纯依靠更多数据和算力的方法,是否真的可持续?

O1:源自Q*/Strawberry的新方向

面对GPT的"成长烦恼",OpenAI找到了新方向:推理模型。

这个方向来自去年备受关注的Q*/Strawberry突破,展现出了三个令人期待的特点:

  1. 性能会随思考时间增加而提升
  2. 采用对数线性计算扩展
  3. 能更好地处理复杂推理任务

研究人员Shawn的观点很有意思:"你能在模型中塞入的知识是有限的,迟早要转向推理或持续学习。"

现状和挑战

研究员Alessandro Corona给出了一个比较客观的评价:"在足够的上下文下,o1-preview在处理复杂多工具任务时表现出色。

但它有时也会犯傻,而且和所有大语言模型一样,在需要更多上下文时往往效率不高。"

确实,o1现在还面临着一些实际问题:

  • 价格是普通模型的6倍,限制了使用范围
  • 推理过程需要更多时间
  • 某些任务的表现还不够稳定

AI的新可能

虽然现在说GPT会被取代还为时尚早,但o1的出现可能预示着AI发展的新方向。研究人员认为,这种基于推理的方法可能会带来几个改变:

  • 从预训练性能提升转向运行时推理能力的增强
  • 从封闭的知识储备转向开放的推理系统
  • 从简单的任务处理到更复杂的问题解决

未来展望

正如一位研究员所说:"也许GPT只是训练轮。真正的竞赛不是关于更大的模型,而是更智能的架构。"

虽然现在O1还在起步阶段,但它可能代表着AI发展的一个新方向。

当然,数据中心的重要性并未减弱。主要AI开发商仍在持续投资,因为:

  • 即使是微小的预训练模型改进也能带来竞争优势
  • 更好的基础模型能产生更好的推理结果
  • 推理模型的运行和优化同样需要强大的计算能力

这场AI的新变革正在悄悄展开,而我们可能正在见证一个重要的转折点。

至于未来会怎样,让我们拭目以待。

DeepSci
专注于 AI 产业资讯、产品评测、实用教程分享
 最新文章