最近AI圈有点热闹。
万圣节那天,OpenAI的掌门人Sam Altman在Reddit上说了句耐人寻味的话:"我们正在优先发布o1及其后续产品。"
根据The Information的最新报道,这个看似普通的回答背后,其实暗示着AI领域一个重要的转变。
GPT遇到了"成长的烦恼"
说起GPT的近况,有点像遇到了成长期的烦恼。
从GPT-3到GPT-4,那真是突飞猛进,让所有人都惊叹不已。但到了最新的Orion模型,The Information报道说性能提升却不那么明显了。
这种放缓让业界开始反思:传统的AI扩展方式,也就是单纯依靠更多数据和算力的方法,是否真的可持续?
O1:源自Q*/Strawberry的新方向
面对GPT的"成长烦恼",OpenAI找到了新方向:推理模型。
这个方向来自去年备受关注的Q*/Strawberry突破,展现出了三个令人期待的特点:
性能会随思考时间增加而提升 采用对数线性计算扩展 能更好地处理复杂推理任务
研究人员Shawn的观点很有意思:"你能在模型中塞入的知识是有限的,迟早要转向推理或持续学习。"
现状和挑战
研究员Alessandro Corona给出了一个比较客观的评价:"在足够的上下文下,o1-preview在处理复杂多工具任务时表现出色。
但它有时也会犯傻,而且和所有大语言模型一样,在需要更多上下文时往往效率不高。"
确实,o1现在还面临着一些实际问题:
价格是普通模型的6倍,限制了使用范围 推理过程需要更多时间 某些任务的表现还不够稳定
AI的新可能
虽然现在说GPT会被取代还为时尚早,但o1的出现可能预示着AI发展的新方向。研究人员认为,这种基于推理的方法可能会带来几个改变:
从预训练性能提升转向运行时推理能力的增强 从封闭的知识储备转向开放的推理系统 从简单的任务处理到更复杂的问题解决
未来展望
正如一位研究员所说:"也许GPT只是训练轮。真正的竞赛不是关于更大的模型,而是更智能的架构。"
虽然现在O1还在起步阶段,但它可能代表着AI发展的一个新方向。
当然,数据中心的重要性并未减弱。主要AI开发商仍在持续投资,因为:
即使是微小的预训练模型改进也能带来竞争优势 更好的基础模型能产生更好的推理结果 推理模型的运行和优化同样需要强大的计算能力
这场AI的新变革正在悄悄展开,而我们可能正在见证一个重要的转折点。
至于未来会怎样,让我们拭目以待。