【AI学习】OpenAI o1-preview 简介（原文+中文翻译）

文摘 2024-09-14 00:01 新加坡

▌锅头导读

2024年9月12日，Open AI发布一系列新的 AI 模型——OpenAI o1。该模型旨在像人一样花更多时间思考，然后再做出响应，目的是为了解决科学、编码、数学等领域的复杂问题。

本文是锅头了解OpenAI o1模型的笔记记录，从原文学习，尽可能让自己不被社会舆论传播和浮夸解说误导或带偏，也供有“求真”需求的同学学习参考。

▌OpenAI o1-preview 简介原文+中文翻译

Introducing OpenAI o1-preview

OpenAI o1-preview 简介

A new series of reasoning models for solving hard problems. Available starting 9.12

用于解决难题的一系列新的推理模型，从 9.12 开始可用。

We've developed a new series of AI models designed to spend more time thinking before they respond. They can reason through complex tasks and solve harder problems than previous models in science, coding, and math.

Today, we are releasing the first of this series in ChatGPT and our API. This is a preview and we expect regular updates and improvements. Alongside this release, we’re also including evaluations for the next update, currently in development.

我们开发了一系列新的 AI 模型，旨在花更多时间思考，然后再做出响应。他们可以推理复杂的任务并解决比以前的科学、编码和数学模型更难的问题。

今天，我们在 ChatGPT 和我们的 API 中发布了该系列的第一个。这是一个预览，我们期待定期更新和改进。除了此版本外，我们还包括对下一个更新的评估，目前正在开发中。

How it works

运作方式

We trained these models to spend more time thinking through problems before they respond, much like a person would. Through training, they learn to refine their thinking process, try different strategies, and recognize their mistakes.

In our tests, the next model update performs similarly to PhD students on challenging benchmark tasks in physics, chemistry, and biology. We also found that it excels in math and coding. In a qualifying exam for the International Mathematics Olympiad (IMO), GPT-4o correctly solved only 13% of problems, while the reasoning model scored 83%. Their coding abilities were evaluated in contests and reached the 89th percentile in Codeforces competitions. You can read more about this in our technical research post.

As an early model, it doesn't yet have many of the features that make ChatGPT useful, like browsing the web for information and uploading files and images. For many common cases GPT-4o will be more capable in the near term.

But for complex reasoning tasks this is a significant advancement and represents a new level of AI capability. Given this, we are resetting the counter back to 1 and naming this series OpenAI o1.

我们训练这些模型在问题做出响应之前花更多时间思考问题，就像一个人一样。通过培训，他们学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。

在我们的测试中，下一次模型更新的性能类似于博士生在物理、化学和生物学中具有挑战性的基准任务。我们还发现它在数学和编码方面表现出色。在国际数学奥林匹克竞赛（IMO）的资格考试中，GPT-4o 仅正确解决了 13% 的问题，而推理模型得分为 83%。他们的编码能力在比赛中得到了评估，并在 Codeforces 比赛中达到了第 89 个百分位。您可以在我们的技术研究帖子中阅读更多相关信息。

作为早期模型，它还不具备使 ChatGPT 有用的许多功能，例如浏览网页以获取信息以及上传文件和图像。对于许多常见情况，GPT-4o 在短期内会更有能力。

但对于复杂的推理任务来说，这是一个重大进步，代表了 AI 能力的新水平。鉴于此，我们将计数器重置回 1 并将此系列命名为 OpenAI o1。

Safety

安全

As part of developing these new models, we have come up with a new safety training approach that harnesses their reasoning capabilities to make them adhere to safety and alignment guidelines. By being able to reason about our safety rules in context, it can apply them more effectively.

One way we measure safety is by testing how well our model continues to follow its safety rules if a user tries to bypass them (known as "jailbreaking"). On one of our hardest jailbreaking tests, GPT-4o scored 22 (on a scale of 0-100) while our o1-preview model scored 84. You can read more about this in the system card and our research post.

To match the new capabilities of these models, we’ve bolstered our safety work, internal governance, and federal government collaboration. This includes rigorous testing and evaluations using our Preparedness Framework(opens in a new window), best-in-class red teaming, and board-level review processes, including by our Safety & Security Committee.To advance our commitment to AI safety, we recently formalized agreements with the U.S. and U.K. AI Safety Institutes. We've begun operationalizing these agreements, including granting the institutes early access to a research version of this model. This was an important first step in our partnership, helping to establish a process for research, evaluation, and testing of future models prior to and following their public release.

作为开发这些新模型的一部分，我们提出了一种新的安全培训方法，该方法利用他们的推理能力使他们遵守安全和对齐准则。通过能够在上下文中推理我们的安全规则，它可以更有效地应用它们。

我们衡量安全性的一种方法是，在用户试图绕过安全规则（称为“越狱”）时，我们的模型继续遵守其安全规则的程度。在我们最难的越狱测试之一中，GPT-4o 得分为 22（0-100 分），而我们的 o1-preview 模型得分为 84。您可以在系统卡和我们的研究帖子中阅读更多相关信息。

为了匹配这些模型的新功能，我们加强了安全工作、内部治理和联邦政府合作。这包括使用我们的准备框架（在新窗口中打开），一流的红队，以及董事会级别的审查流程，包括我们的安全与保障委员会。为了推进我们对 AI 安全的承诺，我们最近与美国和英国 AI 安全研究所正式达成协议。我们已经开始实施这些协议，包括允许这些机构提前获得该模型的研究版本。这是我们合作中重要的第一步，有助于建立未来模型公开发布之前和之后的研究、评估和测试流程。

Whom it’s for

适用对象

These enhanced reasoning capabilities may be particularly useful if you’re tackling complex problems in science, coding, math, and similar fields. For example, o1 can be used by healthcare researchers to annotate cell sequencing data, by physicists to generate complicated mathematical formulas needed for quantum optics, and by developers in all fields to build and execute multi-step workflows.

如果您正在处理科学、编码、数学和类似领域的复杂问题，这些增强的推理功能可能特别有用。例如，医疗保健研究人员可以使用它来注释细胞测序数据，物理学家可以使用它来生成量子光学所需的复杂数学公式，所有领域的开发人员都可以使用它来构建和执行多步骤工作流程。

OpenAI o1-mini

The o1 series excels at accurately generating and debugging complex code. To offer a more efficient solution for developers, we’re also releasing OpenAI o1-mini, a faster, cheaper reasoning model that is particularly effective at coding. As a smaller model, o1-mini is 80% cheaper than o1-preview, making it a powerful, cost-effective model for applications that require reasoning but not broad world knowledge.

o1 系列擅长准确生成和调试复杂代码。为了向开发人员提供更高效的解决方案，我们还发布了 OpenAI o1-mini，这是一种更快、更便宜的推理模型，在编码方面特别有效。作为较小的模型，o1-mini 比 o1-preview 便宜 80%，使其成为一个功能强大、经济高效的模型，适用于需要推理但不需要广泛世界知识的应用程序。

How to use OpenAI o1

如何使用 OpenAI o1

ChatGPT Plus and Team users will be able to access o1 models in ChatGPT starting today. Both o1-preview and o1-mini can be selected manually in the model picker, and at launch, weekly rate limits will be 30 messages for o1-preview and 50 for o1-mini. We are working to increase those rates and enable ChatGPT to automatically choose the right model for a given prompt.

从今天开始，ChatGPT Plus 和 Team 用户将能够访问 ChatGPT 中的 o1 模型。o1-preview 和 o1-mini 都可以在模型选取器中手动选择，在启动时，o1-preview 的每周速率限制为 30 条消息，o1-mini 的每周速率限制为 50 条消息。我们正在努力提高这些比率，并使 ChatGPT 能够自动为给定的提示选择正确的模型。

ChatGPT Enterprise and Edu users will get access to both models beginning next week. Developers who qualify for API usage tier 5(opens in a new window) can start prototyping with both models in the API today with a rate limit of 20 RPM. We’re working to increase these limits after additional testing. The API for these models currently doesn't include function calling, streaming, support for system messages, and other features. To get started, check out the API documentation(opens in a new window).

We also are planning to bring o1-mini access to all ChatGPT Free users.

从下周开始，ChatGPT Enterprise 和 Edu 用户将可以访问这两种模型。符合 API 使用层级 5（在新窗口中打开）现在可以在 API 中使用这两种模型开始原型设计，速率限制为 20 RPM。我们正在努力在进行额外测试后提高这些限制。这些模型的 API 目前不包括函数调用、流式处理、对系统消息的支持和其他功能。要开始使用，请查看API 文档（在新窗口中打开）.

我们还计划为所有 ChatGPT Free 用户提供 o1-mini 访问权限。

What’s next

下一步

This is an early preview of these reasoning models in ChatGPT and the API. In addition to model updates, we expect to add browsing, file and image uploading, and other features to make them more useful to everyone.

We also plan to continue developing and releasing models in our GPT series, in addition to the new OpenAI o1 series.

这是 ChatGPT 和 API 中这些推理模型的早期预览。除了模型更新之外，我们还希望添加浏览、文件和图像上传以及其他功能，使其对每个人都更有用。

除了新的 OpenAI o1 系列之外，我们还计划继续开发和发布 GPT 系列中的模型。

▌内容来源

[1] Introducing OpenAI o1 原文链接：openai.com/o1/

http://mp.weixin.qq.com/s?__biz=MzkwMzQ0MDIzMg==&mid=2247490542&idx=2&sn=9bb7b6415d432863f8934d0747cef592

跟锅头一起学AI

持续学习AI知识和使用技巧，思考如何用AI高效学习办公

最新文章

【AI学习】如何用AI工具做中秋节日祝福海报？（附效果和保姆级教程）

【每日AI提示词】如何生成鲜花服饰模特人物图？附FLUX.1、可灵、即梦等7个国内外AI生成效果

【AI学习】如何用AI工具（即梦）创作十二星座虚幻流光星云图？（附效果和保姆级教程）

【AI学习】一文带你了解OpenAI o1（附学习思维导图）

【AI学习】OpenAI o1-preview 简介（原文+中文翻译）

【AI学习】学习使用 LLM 进行推理（原文+中文翻译）

【AI学习】OpenAI o1-mini简介（原文+中文翻译）

【AI学习】OpenAI o1 贡献（原文+中文翻译）

【AI学习】Vidu参考生成视频功能如何使用？一致性效果如何？（附保姆级教程）

【AI学习】如何用即梦AI+剪映创作十二生肖植物景观变身效果视频合集？（附效果和保姆级教程）

【AI学习】如何用AI工具（即梦）创作十二生肖绿植景观效果图？（附效果和保姆级教程）

【AI学习】如何用AI工具（即梦）创作“中秋快乐”等自定义文字月饼实物摄影图？（附效果和保姆级教程）

【AI学习】如何用AI工具豆包+即梦创作水果掉入水里瞬间摄影图片和视频片段？（附效果和保姆级教程）

【每日AI提示词】如何生成电影级巨物入侵图？附FLUX.1、可灵、即梦等7个国内外AI生成效果

【每日AI提示词】如何生成微缩景观人物图？附Flux.1、即梦等7个国内外AI生成效果

【AI学习】如何用AI工具腾讯元宝+即梦+可灵+剪映创作角色一致性高的视频叙事故事《熊猫锅头体验宇航员的一天》（附保姆级教程）

【AI学习】如何用AI工具腾讯元宝+即梦创作一致性高的图片叙事故事《熊猫锅头体验宇航员的一天》？（附效果和保姆级教程）

【AI学习】一文带你了解AI生图生视频模型即梦AI，包括实测效果、功能特点、研发团队、使用方法等

【AI学习】海螺AI最近悄悄上线的【创作视频】功能如何使用？视频效果好不好？

【AI学习】一文带你了解AI生图模型Midjourney，包括实测效果、功能特点、研发团队、使用方法等

【每日AI提示词】如何生成水果卡通脸部漫画？附FLUX.1、可灵、即梦等7个国内外AI生成效果

【每日AI提示词】如何生成漂亮的四叶草翡翠饰品图？附Flux.1、即梦等7个国内外AI生成效果

【每日AI提示词】如何生成3D剪纸风格邀请卡片？附MJ、通义万相等7个国内外AI生成效果

【每日AI提示词】如何生成柔和色彩的蓝鸟插画？附MJ、秒画等7个国内外AI生成效果

【每日AI提示词】如何生成精致的霓虹水晶苹果图？附MJ、Flux.1、即梦等8个国内外AI生成效果

【AI学习】如何用AI快速创作“武侠风+幽默感文字图片”？（附效果和保姆级教程）

【每日AI提示词】如何生成极简水墨武侠人物背影图？附即梦、MJ等7个国内外AI生成效果

【AI学习】一文带你了解AI生图模型FLUX.1，包括实测效果、功能特点、研发团队、使用方法等

【每日AI提示词】如何生成黑神话悟空式的猴子时尚街拍图？附MJ、Flux.1、即梦等8个国内外AI生成效果

【AI学习】黑森林实验室官宣成立并发布FLUX.1模型套件介绍原文+中文翻译

【每日AI提示词】如何生成水彩艺术双重曝光图片？附MJ、可灵等7个国内外AI生成效果

【AI实测】实测图生视频首尾帧功能做汽车行驶视频哪家强? 可灵、即梦、Luma参赛，请你当评委

【AI学习】如何用AI工具让汽车海报动起来，变成汽车短片视频?（附效果和保姆级教程）

【AI学习】如何用AI工具快速创作充满创意的现实汽车海报图集?（附效果和保姆级教程）

【AI学习】如何用AI工具快速创作充满创意的汽车海报图集？（附效果和保姆级教程）

【AI学习】如何用AI工具做现实中不可能的两个人拥抱的视频？（附效果和保姆级教程）

【AI学习】如何用AI工具做幻术视频—红薯变猪，土豆变狗？（附效果和保姆级教程）

【AI学习】如何用AI工具（Kimi）花1分钟创作情绪满满的小红书风格标题和文案？（附效果和保姆级教程）

【AI学习】如何用AI工具Kimi+即梦+可灵+剪映创作角色一致性高的视频叙事故事《熊猫锅头化身庄稼人的一天》（附保姆级教程）

【AI学习】如何用AI工具创作一致性高的图片叙事故事《熊猫锅头化身庄稼人的一天》？（附效果和保姆级教程）

【AI学习】一文带你了解6个亲测可用的免版权图片素材网站（附许可使用说明）

【AI学习】如何用AI工具（Kimi）1分钟生成符合预期的会议纪要？（附提示词和效果）

【AI学习】如何用AI工具Kimi快速生成更符合自己预期的工作周报？（附效果、提示词和调优过程）

【AI学习】如何用AI工具一键替换视频人物，AI从换脸到换人的效果如何？（附实测效果和保姆级教程）

【阶段总结】165天，148篇原创，10000粉丝，4个400+社群，1200份手册，783元广告收益，锅头3000字经验与思考

【AI学习】如何用AI工具创建卡通人物形象，生成角色一致性高、多种表情动作的组图（附效果+价值百元实用教程）

【AI创作】“关关难过我关关过”治愈系文字+角色一致性高的组图（附提示词）

【AI学习】如何用AI工具一次写完1个月的朋友圈文案，建立真诚专业的人设形象？（附提示词+实操教程）

【AI学习】一文带你了解LibLib AI图像生成平台的功能、收费情况、使用方法

【AI学习】如何写文生图提示词让AI文生图效果更符合预期？（附学习脑图）

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉