OpenAI 今天发布了一个重磅消息:推出了全新的小型推理模型 o3-mini,这是他们在推理系列中最新且最具成本效益的模型。更令人兴奋的是,这个模型现在对所有用户开放免费使用!
也是 ChatGPT 首次向免费用户提供推理模型,明显是在向 DeepSeek R1等开源模型发起挑战,卷起来了!
有网友也说了,既然 DeepSeek 已经提供了免费的高端的 AI 技术,为什么还要付费升级 ChatGPT?
还有网友已经有了 DeepSeek,而且它完全免费...
主要亮点
免费使用:这是 OpenAI 首次向免费用户开放推理模型,用户可以在消息编辑器中选择"Reason"选项来使用。
今天小编打开看了下,确实已经有了!ChatGPT 的用户们可以体验上了!
性能强大:
在数学、编程和科学领域表现出色 与 OpenAI o1 相当的性能 响应速度比 o1-mini 快 24% 错误率降低 39%
开发者友好:
支持函数调用(Function Calling) 支持结构化输出 支持开发者消息 支持流式输出
灵活的推理选项:
提供低、中、高三种推理强度选项 可以根据具体需求在速度和准确性之间做出权衡
免费版与付费版区别
免费用户:
可以使用基础版 o3-mini 通过消息编辑器中的"Reason"选项访问 付费用户(Plus、Team 和 Pro):
消息限制从每天 50 条提升到 150 条 可以使用 o3-mini-high(更高智能版本) Pro 用户可以无限制使用两个版本
技术性能
在多个关键领域的表现令人印象深刻:
数学竞赛:在 AIME 2024 测试中,高强度推理模式下达到 83.6% 的准确率
博士级科学问题:在 GPQA Diamond 测试中达到 77.0% 的准确率
编程竞赛:在 Codeforces 上达到 2073 的 Elo 分
软件工程:在 SWE-bench Verified 测试中达到 48.9% 的准确率
速度提升
平均响应时间仅为 7.7 秒 比 o1-mini 快 24%(o1-mini 平均响应时间为 10.16 秒) 首个 token 生成时间比 o1-mini 快 2500ms
结语
如果不是 DeepSeek 的 R1 模型,OpenAI 可能不会这么快推出 o3-mini 模型,也可能不会这么快向免费用户开放推理模型。有竞争,才有进步。对于开发者和普通用户来说,这无疑是一个好消息,意味着他们可以免费使用到更强大的 AI 能力。
让我们拭目以待,看看这场 AI 模型的 "军备竞赛" 会给我们带来什么样的惊喜!
欢迎关注 “AI智见录”,我们专注于 AI 内容探索,将持续为您分享更多精彩 AI 内容。
期文章推荐
扫描以下二维码加小编微信,备注 “ai”,一起交流 AI 技术!