重磅!OpenAI 发布免费推理模型 o3-mini,正面对标 DeepSeek,AI 领域再掀波澜

职场   2025-02-01 07:59   河南  

OpenAI 今天发布了一个重磅消息:推出了全新的小型推理模型 o3-mini,这是他们在推理系列中最新且最具成本效益的模型。更令人兴奋的是,这个模型现在对所有用户开放免费使用!

也是 ChatGPT 首次向免费用户提供推理模型,明显是在向 DeepSeek R1等开源模型发起挑战,卷起来了!

有网友也说了,既然 DeepSeek 已经提供了免费的高端的 AI 技术,为什么还要付费升级 ChatGPT?

还有网友已经有了 DeepSeek,而且它完全免费...

主要亮点

  1. 免费使用:这是 OpenAI 首次向免费用户开放推理模型,用户可以在消息编辑器中选择"Reason"选项来使用。

今天小编打开看了下,确实已经有了!ChatGPT 的用户们可以体验上了!

  1. 性能强大

  • 在数学、编程和科学领域表现出色
  • 与 OpenAI o1 相当的性能
  • 响应速度比 o1-mini 快 24%
  • 错误率降低 39%
  • 开发者友好

    • 支持函数调用(Function Calling)
    • 支持结构化输出
    • 支持开发者消息
    • 支持流式输出
  • 灵活的推理选项

    • 提供低、中、高三种推理强度选项
    • 可以根据具体需求在速度和准确性之间做出权衡

    免费版与付费版区别

    • 免费用户

      • 可以使用基础版 o3-mini
      • 通过消息编辑器中的"Reason"选项访问
    • 付费用户(Plus、Team 和 Pro):

      • 消息限制从每天 50 条提升到 150 条
      • 可以使用 o3-mini-high(更高智能版本)
      • Pro 用户可以无限制使用两个版本

    技术性能

    在多个关键领域的表现令人印象深刻:

    • 数学竞赛:在 AIME 2024 测试中,高强度推理模式下达到 83.6% 的准确率
    • 博士级科学问题:在 GPQA Diamond 测试中达到 77.0% 的准确率
    • 编程竞赛:在 Codeforces 上达到 2073 的 Elo 分
    • 软件工程:在 SWE-bench Verified 测试中达到 48.9% 的准确率

    速度提升

    • 平均响应时间仅为 7.7 秒
    • 比 o1-mini 快 24%(o1-mini 平均响应时间为 10.16 秒)
    • 首个 token 生成时间比 o1-mini 快 2500ms

    结语

    如果不是 DeepSeek 的 R1 模型,OpenAI 可能不会这么快推出 o3-mini 模型,也可能不会这么快向免费用户开放推理模型。有竞争,才有进步。对于开发者和普通用户来说,这无疑是一个好消息,意味着他们可以免费使用到更强大的 AI 能力。

    让我们拭目以待,看看这场 AI 模型的 "军备竞赛" 会给我们带来什么样的惊喜!

    欢迎关注 “AI智见录”,我们专注于 AI 内容探索,将持续为您分享更多精彩 AI 内容

    期文章推荐

    1. 重磅升级!Cursor 0.45:AI 更懂代码、DeepSeek 双模型加持

    2. V0 的弟弟 “V2” 来了!

    3. 直冲 Cursor!字节发布全新 AI IDE Trae,Claude-3.5 无限量免费用!

    4. Qwen Chat 发布全新 Web UI!体验超棒!

    5. Roo Cline 3.0 重磅发布:人手一个架构师时代到来!

    6. Gemini 2.0 Flash + Cline 打造最强 0 元购组合!

    7. Cline 3.1 最新发布:体验感拉升一个新高度!

    8. 太火爆!Browser-Use WebUI 已被纳入 browser-use 麾下!

    9. Windsurf:唯一让 Cursor 瑟瑟发抖的最强对手!

    10. 一起来聊聊 Cursor、Copilot、Windsurf、V0...

    - 线 -

    扫描以下二维码加小编微信,备注 “ai”,一起交流 AI 技术!

    AI智见录
    洞见AI前沿,分享技术与实践,助力智慧未来
     最新文章