确认了!o3-mini几周内发布,奥特曼表示AGI只需872兆瓦计算功率

学术   2025-01-19 16:22   广东  

辑:Panda


昨天,我们报道了一个行业猜想,说是 OpenAI 和 Anthropic 等前沿大模型公司可能已经训练出了下一代大模型,但由于它们的使用成本过高,所以短时间内根本不会被放出来。但是,为了响应用户期待,OpenAI 和 Anthropic 等公司会不断放出一些基于下一代大模型蒸馏得到的较小模型。更多分析请参阅文章《GPT-5、 Opus 3.5 为何迟迟不发?新猜想:已诞生,被蒸馏成小模型来卖》。


有意思的是,就在这篇文章发布后不久,OpenAI CEO 山姆・奥特曼就在 𝕏 上宣布将在「周内」发布 o3-mini,并且这一次会同时发布 API 与网页端。从名字也能看出来,o3-mini 应该就是某个大模型的蒸馏版,这似乎也映证了上面的猜想。



另据 OpenAI 研究科学家 Hongyu Ren 透露,他们会同时发布 o3-mini 的 high、medium、low 三个版本


当然,严格来说,这并不算是一个新闻。早在上个月 21 日,OpenAI 十二天连发的最后一天,奥特曼就提到过计划在一月底左右推出 o3-mini,并在不久后推出完整的 o3 模型。更多详情可访问《刚刚,OpenAI 放出最后大惊喜 o3,高计算模式每任务花费数千美元》。

这条推文之后,奥特曼又积极地回答了许多网友的提问,为我们揭示了更多细节。

首先,奥特曼证实 o3-mini 的性能表现会逊于 o1-pro,但速度会更快


这一点着实让不少网友失望,因为从这个描述看,o3-mini 可能也就比 o1-mini 强一点。


但其实,OpenAI 此前就已经公布过相关基准数据了,所以这一点倒并不让人惊讶。比如在 Codeforces 编程基准上,o3-mini (low) 性能不及 o1,high 版本会好一些,但整体都更具成本效益,这使其非常适合用来编程


OpenAI 的 Dylan Hunn 也强调了 o3-mini 在编程速度上的优势。


或许是为了安抚大家的情绪,奥特曼又抬出了 o3,表示这个版本会比 o1-pro 聪明得多,更别提 o3-pro 了。同时,他也表示 o3-pro 的定价不会是一个月 2000 美元起,200 美元的 Pro 订阅者应该就能获得一定的使用额度


至于 o3-mini 的使用额度,奥特曼只是说「真的高」,从上下文看应该会比 o1 系列的高一些。


奥特曼也表示 o3-mini 会向 ChatGPT Plus 订阅者提供,并不限于 200 美元月供的 Pro 用户。


另外,奥特曼也谈到了 GPT 系列与 o 系列模型品牌融合的问题。看起来,这个融合行动就将在今年发生!


AGI 需要 872 兆瓦的计算功率

除了与 o3-mini 相关的问题,奥特曼也解答了一个与 AGI 相关的提问。当然,他的答复已经不是第一次出现了:AGI 可以实现,并且需要 872 兆瓦的计算功率。作为参考,美国目前最大的核电站 Alvin W. Vogtle 发电站的装机容量为 4536 兆瓦,理想情况下也顶多仅能供养 5 个这样的 AGI。不过话也说回来,872 兆瓦这个数据着实精确得让人惊讶。


那我们目前实际上已经到哪一步了呢?根据 situational-awareness.ai 的估算,目前 AI 的功率应该差不多就在这个水平。


看起来,OpenAI 确实很有可能已经开发出了下一代模型,甚至有可能达到了 AGI 等级 —— 当然,这得取决于 OpenAI 对 AGI 的具体定义。事实上,已经有人根据所谓的内部消息在暗示这一点了。


对此,你有什么看法呢?

参考链接
https://x.com/sama/with_replies
https://en.wikipedia.org/wiki/List_of_largest_power_stations_in_the_United_States
https://situational-awareness.ai/racing-to-the-trillion-dollar-cluster/
来源:澎湃科技

往期回顾


🔥【精选报告】清华大学2024年AIGC发展研究报告3.0版(附下载,181页)

🔥【精选报告】重磅:2024年全球AIGC产业全景报告(附下载,58页)

🔥【精选报告】斯坦福李飞飞最新巨著《AI agent综述》Agent AI开启多模态交互新纪元(附下载,中英版)

🔥【精选报告】生成式AI如何重塑未来,吴恩达等AI领袖的独家观点不容错过!(附下载,160页)

🔥【精选报告】重磅:2024年全球人工智能全景现状最新报告(212页,中英文版,附下载)

🔥【精选报告】华为&清华大学--2024年AI终端白皮书:AI与人协作、服务于人(附下载)

🔥【精选报告】清华大学-大模型工具学习(附下载)

🔥【精选报告】海外权威报告:生成式人工智能(114页,附下载)

🔥【精选报告】腾讯研究院:向AI而行, 共筑新质生产力--行业大模型调研报告(85页,附下载)

🔥【精选报告】国际先进人工智能安全科学报告中期报告(132页,附下载)

🔥【精选报告】2024大模型应用实践报告--爱分析(35页,附下载)

🔥【精选报告】AIGC实践案例集锦:对话先行者,洞见新未来(附下载)




水木人工智能学堂
水木人工智能学堂专注分享和普及AI知识,由清华大学、天津大学、深圳大学等AI团队创建,内容涵盖机器学习、深度学习、图像分析、语音及语义分析、AI求职及职业规划、行业报告等,汇集云知声、奥比中光、极视角等AI专家分享干货,欢迎关注。
 最新文章