点击上方蓝字关注更多及时AI资讯
OpenAI 于9月12日发布了一个名为 o1 的新系列人工智能模型,该模型的特点是在回答问题之前会进行更深入的思考,类似于人类的思考解决问题的过程,这也意味着其在科学、编码和数学领域的复杂任务上表现出色,可以解决比以前的模型更难的问题。
o1系列擅长准确生成和调试复杂代码,属于需要推理但不需要广泛的世界知识的应用程序的强大且经济高效的模型。o1模型家族目前以两种形式推出:o1-preview 和 o1-mini,其中,ChatGPT Plus的付费用户已经可以开始体验o1-preview和o1-mini模型,而o1-mini模型预计不久后也将向所有免费用户开放。
o1-preview是一个注重深度推理处理的版本,为AI在科学研究、软件开发、数学计算等领域的应用提供了新的可能。
o1-mini作为较小的模型,是一种更快、更便宜的推理模型,在编码方面特别有效,拥有优化的推理能力、快速响应和低成本效益。
o1 。为了为开发人员提供更高效的解决方案,我们还发布了 OpenAI o1-mini,,o1-mini 比 o1-preview 便宜 80%,这使其成为
适合谁用
OpenAI说“如果您正在解决科学、编码、数学和类似领域的复杂问题,这些增强的推理能力可能特别有用。例如,医疗保健研究人员可以使用 o1 来注释细胞测序数据,物理学家可以使用 o1 生成量子光学所需的复杂数学公式,所有领域的开发人员可以使用 o1 来构建和执行多步骤工作流程”
模型效果
o1模型在多个基准测试中展现了其卓越的性能,o1-preview 在多个基准测试中的表现超过了其前身 GPT-4o。例如在国际数学奥林匹克的资格考试中,o1模型的正确率高达83%,而之前的GPT-4o模型正确率仅为13%。在编程竞赛平台Codeforces的比赛中,o1模型的表现超过了89%的参赛者。此外,OpenAI 还声称,o1 在物理、化学和生物学的特定任务上的表现与博士生相当。
作为早期模型,它尚不具备 ChatGPT 的许多有用功能,例如浏览网页以获取信息以及上传文件和图像。对于许多常见情况,GPT-4o 在短期内将更加强大,例如它在世界知识方面的表现并不出色,而且它也不能浏览网页或处理文件和图像。
训练过程
o1模型的训练背后与前代模型有根本的不同,OpenAI 将 o1 的进步归因于一种新的强化学习(RL)训练方法,该方法教会模型在回应之前花费更多时间“思考”问题,类似于“让我们一步一步思考”的链式思维提示可以改善其他大型语言模型(LLM)的输出。o1 使用这样一种全新的优化算法和专门为其量身定制的新训练数据集。新的过程允许 o1 尝试不同的策略并“认识到”自己的错误,通过强化学习技术进行训练,通过奖励和惩罚来教会系统独立解决问题,并使用“思维链”来处理查询,类似于人类逐步处理问题的方式。
使用权限及价格
就用户权限而言,从从 9 月 12 日起,ChatGPT Plus用户和团队用户将能够使用o1-preview和o1-mini模型,但每周发送消息次数限制为 o1 预览版 30 条消息和 o1 - mini 50 条消息。
企业版与教育版用户则需等到下周(9 月 12 日当周之后)才能获得使用权限。
符合 api 使用等级 5 的开发人员已经可以开始使用 api 中的两种模型进行原型设计,速率限制为 20rpm。
OpenAI还计划未来向所有ChatGPT的免费用户提供o1-mini的使用,具体时间表尚未公布。
在价格方面,通过API访问o1模型的成本相对较高:o1-preview模型的收费为每100万个输入令牌15美元,每100万个输出令牌60美元,相较于GPT-4o模型的价格,o1模型的使用成本是其三倍。o1 - mini 每百万输入 3 美元,每百万输出 12 美元,价格比 o1-preview 低 80%。
(作为对比,GPT - 4O 每百万输入 5 美元,每百万输出 15 美元;GPT - 4O - mini 每百万输入 0.15 美元,每百万输出 0.6 美元)
参考资料
https://openai.com/o1/
https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/
我们一起学AI