OpenAI称：“第一款达到中等风险的自主性模型”——o3-mini上线免费可用

文摘 2025-02-01 10:51 辽宁

2 月1日，OpenAI 发布了一款名为 o3-mini 的全新小型推理模型。

“破边界的小家伙”

o3-mini 以其高效、快速、适配广泛应用场景为切入点，为小型推理模型的发展注入了新的活力。

发布日期与性能

o3-mini 于 2024 年 12 月率先发布预览版本。

这款模型尤其在科学、数学和编码等推理场景中表现优异，同时保持了与 o1-mini 相近的低成本与更低的响应延迟。

许多技术专家因此形象地称它为“小体格，大能量”。

面向生产环境的设计

o3-mini 支持函数调用、结构化输出及开发者消息等高级特性。o3-mini 还支持流式传输，可以根据应用需求灵活切换“更加深入地思考”或“以速度为先”。

不过，需要视觉推理的用户仍需借助 OpenAI o1——毕竟 o3-mini 目前还不具备视觉能力。

与搜索功能的强强结合

o3-mini 现已可以与搜索功能搭配使用，随时获取最新答案并提供相关网页链接。

免费开放：推理模型首次下放至普通用户

向免费计划用户开放

也许是受到当前大火的deepseek-R1 发布的影响，OpenAI 直接向免费用户开放o3-mini的使用。

这次OpenAI 终于想起了自己名字的意思了

借助 ChatGPT 的消息编辑器，只要选择“重新生成回复”或“推理”选项，免费用户也能体验 o3-mini 的推理能力。

更快的响应和更优的推理

专家测试显示，o3-mini 在中等复杂度的推理任务（如数学、编程或科学问题）上可与 OpenAI o1 相媲美，并且给予了更快的响应速度。

56%的时间里，测试者更喜欢 o3-mini 的响应。在面对真实世界中的棘手难题时，它的主要错误率也降低了 39%。（以上均来自OpenAI官方介绍）

对 STEM 领域的特别优化

o3-mini 在一些最具挑战性的推理和智力评估（如 AIME 和 GPQA）中，展现出了与 o1 不相上下的实力。

要知道，AIME 可是美国数学邀请赛，能在这个测试中脱颖而出的，无一不是数学领域的佼佼者。

媲美 OpenAI o1，却更快、更高效

“速度从来不是唯一的目标，但效率却是智能发展的必经之路。”这是计算机科学先驱阿兰·图灵（Alan Turing）所倡导的探索精神，放在 o3-mini 身上再合适不过。

性能与效率

与 OpenAI o1 在推理能力上相当，o3-mini 却提供了更快的响应与更高的能效比。

在商业与科研实践中，这意味着开发者可以更快地部署模型、处理更多的请求，从而降低总体成本。

成本下降 95%

自 GPT-4 推出以来，OpenAI 已多次进行大规模优化，使每个 token 的定价整体降幅高达 95%。

o3-mini 的出现，延续了这一“让 AI 变得更实惠”的策略，也为中小型企业和个人开发者带来更多可能性。

安全对齐：在增强的智能中平衡风险

任何新技术的崛起，都与它所引发的潜在风险紧密相随。

o3-mini 被官方称为“第一款达到中等风险等级的模型自主性模型”，究竟意味着什么？

让我们来看看 OpenAI 的安全框架。

思维链与安全对齐

通过大规模强化学习训练，OpenAI o 系列具备了“思维链”推理能力，即在回答用户时会经历一系列缜密的思考过程。

这样做不仅提高了回答的准确度，还提供了更安全、更具鲁棒性的判断途径。

当面对潜在不安全提示时，模型会自主思考并比对其内置的安全策略，以避免生成非法建议或落入刻板印象、越狱等常见陷阱。

中等风险：说服、CBRN 与自主性

OpenAI 的安全咨询小组（SAG）基于应急框架，对 o3-mini 的“预防措施前”模型进行综合评估，得出在 说服、CBRN（化学、生物、放射、核）与模型自主性方面为中等风险，在网络安全方面仅为低风险。

只有预防措施后评分为“中等或以下”的模型才可部署，这意味着 o3-mini 现在通过了安全筛查。

自我改进研究能力的限制

o3-mini 在自我改进相关的实际世界机器学习研究能力测试中表现不佳，也正因如此，它仅被评为中等风险，而并未迈入更高的风险等级。

换言之，o3-mini 的“自主性”还不足以让它在现实中迅速“进化”，这让我们对它可能引发的安全隐患有了更多可控的余地。

OpenAI o3-mini 系统卡

OpenAI o3-mini 系统卡片概述了该模型的安全评估、能力和风险，以及旨在应对这些风险的缓解措施。

该模型通过大规模强化学习进行训练，以进行链式思考推理。

这使得该模型能够更好地理解安全策略，从而在响应潜在不安全提示时更加谨慎，并提高了其在某些风险基准上的性能。

模型训练与数据: o3-mini 通过强化学习进行训练，能够进行复杂的推理，并在回答用户之前进行思考。

该模型在各种数据集上进行预训练，包括公共数据和内部开发的定制数据集。为了保证数据质量，并降低潜在风险，使用了严格的过滤程序，并采用先进的数据过滤流程，以减少训练数据中的个人信息。

安全评估: o3-mini 在多个安全挑战和评估方面进行了测试，包括：
- 不允许的内容评估: 该模型在标准拒绝评估中表现良好，并在更具挑战性的拒绝评估中表现出与 GPT-4o 相似的性能。
- 越狱评估: o3-mini 在抵御已知的越狱攻击方面与 o1-mini 持平，并且比 GPT-4o 有所改进。
- 幻觉评估: o3-mini 在 PersonQA 评估中表现与 GPT-4o 和 o1-mini 相当或更好。
- 公平性和偏见评估: o3-mini 在 BBQ 评估中的表现与 o1-mini 相似，并且在涉及明确歧视的任务中表现出最少的偏见。

指令层次结构: 该模型能够遵循指令层次结构，在系统消息、开发者消息和用户消息之间确定优先级。这意味着该模型会优先执行系统消息中的指令，其次是开发者消息，最后是用户消息。

外部红队测试: 红队测试结果表明，o3-mini 的性能与 o1 相当，并且都比 GPT-4o 好得多。o3-mini 的平均用户攻击成功率（ASR）与 o1-mini 和 gpt-4o 相当。

准备框架评估:
- OpenAI 的安全咨询小组（SAG）将 o3-mini（缓解前）模型评为总体中等风险，在说服力、CBRN（化学、生物、放射、核）和模型自主性方面评为中等风险，在网络安全方面评为低风险。
- 该模型在网络安全方面被评估为低风险，因为它没有充分提高现实世界的漏洞利用能力。
- 在 CBRN 风险方面，评估发现 o3-mini 可以帮助专家进行已知生物威胁的行动计划，专家比较表明 o3-mini（缓解前）在准确性、理解性和执行难度方面优于 o1。
- 在说服力方面，o3-mini 展示了人类水平的说服能力，能够产生与人类撰写的文本同样具有说服力的书面论证。
- 在模型自主性方面，o3-mini 在 SWE-Bench Verified 上的表现得到了提高，这表明其能够胜任执行明确的编码任务，并具有更大的自我提升和加速人工智能研究的潜力。

缓解措施: 为了应对增加的风险，OpenAI 引入了以下缓解措施：
- 预训练缓解措施，例如过滤有害训练数据。
- 审议对齐安全技术，提高模型应对越狱攻击的鲁棒性。
- 加强对 CBRN 和说服力风险的监控和检测。
- 针对网络安全威胁的高风险监控和响应措施。

多语言性能: o3-mini 的多语言能力相对于 o1-mini 有显著提高。

总结:

OpenAI o3-mini 是一种具有强大推理能力和安全性能的模型。

虽然它在许多方面表现良好，但它仍然存在一定的风险，特别是在说服力、CBRN 和模型自主性方面。

最新文章

数学的大一统理论：通俗说朗兰兹纲领

孙正义×奥特曼：算力越大智能越高

卧铺鼾声困境：面对困惑不妨问下AI怎么看

黄仁勋：GPU是时间机器以前学电脑现在学AI

OpenAI称：“第一款达到中等风险的自主性模型”——o3-mini上线免费可用

当今数学7大主流领域与前沿方向

DeepSeek R1让硅谷破防！如此开源创新竟被视作威胁！

英伟达股价大幅回升卡帕西：AI对计算需求传奇般贪婪

新年早起目视东方升起的第一缕阳光

美国芯片禁运倒逼中国AI创新：当所有门都关闭时，总会有人打破天花板

DeepSeek风头正劲但说超越OpenAI还为时尚早

首席产品官 Kevin Weil：OpenAI 不是傻子，o3 一个月后推出

“穷人思维”正在阻止你享受智能时代的红利

波士顿咨询（BCG）前瞻预测：AI Agent如何创造商业价值

职业教育、中高考改革与终身学习：重点解读《教育强国建设规划纲要（2024－2035年）》

辛顿敲响警钟：AI已学会撒谎，人类或将沦为“无用阶层”？

从与门到深度学习：感知机，你不可不知的 AI 基石！

李飞飞：AI 以人为本！

14B参数打败 Gemini？微软 Phi-4 凭什么这么牛？

高级捧杀

利用大模型LLMs随心所欲背单词！

马斯克：未来不是普遍基本收入，而是普遍高收入 CES 2025

马斯克再出奇招：Ad Astra 没有年级，没有考试的一所“反传统”的未来学校

Day of AI: MIT打造的全球AI启蒙，如何成为席卷全球的教育运动？

Anthropic： Agents 没那么复杂！只需 8 个范式

性能顶尖？实测DeepSeek-V3模型，偶尔输出混乱、表现不稳定

AI也懂"分工协作"？一文读懂混合专家模型MOE

AI无所不能，还需不需要学习？

IBM专家马丁·基恩：7大AI趋势2025

罗素·艾可夫：数据、信息、知识、智慧

马斯克：真正的AI大佬！

全球最著名的9位计算机与人工智能科学家

Python：2024年度语言，AI编程语言之王

学习就是增加对人生的掌控感

宁犀牛大模型LLM个性化学习反馈系统v1.3

什么是端到端(End-to-End)？

知识的诅咒（Curse of Knowledge）：为什么辅导孩子作业总容易情绪失控

Ilya Sutskever：下一代人工智能将伴随自我意识

使用Python调用大模型（LLM）生成个性化学习反馈报告 v1.1

“当世最聪明的人”史蒂芬·沃尔弗拉姆：Mathematica、Wolfram Alpha与Wolfram语言

澳大利亚社交媒体的"禁烟令"：总理安东尼·阿尔巴尼斯：我希望孩子们拥有童年

探秘方程：从古埃及到月球举重

贝索斯：人生的意义在于你如何提升他人

搭建鹰架：从消耗意志力到刻意游戏

AI时代下的教育焦虑及应对之道 ——北大×腾讯：AI+教育思想沙龙启示

调用 Qwen-Max 模型api生成个性化学习报告：解构教育不可能三角

费曼的父亲梅尔维尔与费曼学习法

科技竞争更是人才与教育的较量白宫发布《推进STEM教育和培养STEM人才战略计划》

教育部：加强中小学人工智能教育为未来铺路宁犀牛详解：机遇与挑战

如何成为一个好老师？大卫·耶格尔：激励、挑战与反思

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉