OpenAI重磅推出o1模型：从“秒答”到“深思熟虑”！

文摘 2024-09-13 15:19 云南

凌晨 1 点，OpenAI 悄悄上线了o1模型。

相比过去的 GPT 系列，o1模型不仅具备超强的推理能力，还可以像人类一样仔细思考。

你没听错！AI 不再是那种"秒答"的小助手，而是升级成一个会“深思熟虑”的大脑。

o1 模型到底有多强？

大家都知道 GPT-4 强大，但o1模型直接超越了 GPT 系列，以更强的推理能力登场。

之前 OpenAI 推出的 GPT 模型已经很能干了，比如帮我们写文章、编程、回答各种问题。而这次，o1让 AI 变得更聪明，尤其在处理复杂问题时简直堪称神器。

根据 OpenAI 的测试，o1模型在一些高难度的数学和科学问题上达到了令人难以置信的准确度。在 2024 年的美国数学邀请赛（AIME）中，o1模型的正确率高达 83%，直接进入了美国前 500 名数学高手的行列。而GPT-4o 的正确率仅为 13%，差距简直巨大！

另外，o1在编程比赛中的表现也相当亮眼，尤其是在 Codeforces 上，它的Elo 评分达到了 1807，高于 93% 的竞争对手，这简直是 AI 编程能力的又一次飞跃。要知道，GPT-4o 在这方面的 Elo 评分只有 808，对比之下，o1 不仅速度快，准确率也高得惊人。

o1 模型的“深思熟虑”

一直以来，AI 模型的发展都受到推理能力的局限，但 OpenAI 的 o1 模型似乎彻底打破了这个瓶颈。它不再像以往的模型那样只靠海量数据进行“死记硬背”，而是引入了强化学习机制。用通俗的话说，o1 会在给出答案之前“思考”。它会在响应问题之前形成一个“思维链”，这让它在复杂问题上表现得像个真正的思考者。

这就好比你问一个人难题，他不会马上回答，而是先沉思片刻，整理思路再做出回复。而 o1 的思维链和推理能力，在OpenAI的测试中表现出色，甚至超过了很多博士级别的专家。

这可是一个真正的飞跃！这也让OpenAI CEO 奥特曼在发布会上直言：“虽然 o1 还有缺陷，但第一次使用它时，你一定会被它震撼到。”

更贵、更慢，但更聪明的 o1

虽然o1模型的能力非常强大，但它也有一些明显的不足。

首先，它的推理速度比较慢。

与 GPT 系列不同，o1需要花费10 到 20 秒来生成答案。这意味着，如果你想让o1来回答一些简单的问题，它可能会显得“有点笨拙”，因为它需要花更多时间去“思考”。

其次，o1 的使用成本也非常高。

据 OpenAI 透露，在 API 中，o1-preview每 100 万个 token 的输入费用为 15 美元，输出费用高达 60 美元，比 GPT-4o 高出3到4倍。这对于一些小型企业或个人开发者来说，可能会带来不小的经济负担。

虽然速度慢、价格高，但o1的推理能力确实让它在应对复杂问题时无可替代。如果你是编程、科学研究、数学推理等领域的从业者，o1将会是你最强的帮手。

o1-mini价格友好的选择

为了让更多用户能够体验到o1的强大，OpenAI 还发布了o1-mini版本。相比o1-preview，o1-mini的推理能力稍微弱一点，但它更加高效、价格也更加亲民。

这个版本专门为STEM（科学、技术、工程、数学）领域进行了优化，尤其在编程任务中表现不俗。

o1-mini在数学竞赛中的表现也很出色，得分与o1-preview相差不大，但它的使用成本更低。如果你是一个开发者，想要体验o1的强大推理能力，那么o1-mini可能是一个不错的选择。

o1将如何改变未来？

目前，ChatGPT Plus 和 Team 用户已经可以通过 ChatGPT 使用o1-preview和o1-mini。不过，每位用户每周只能发送 30 条o1-preview消息，或 50 条o1-mini消息。

对于企业和教育用户，OpenAI 计划下周开放这两个模型的使用权限。如果你是开发者，还可以通过 API 使用o1进行应用开发。不过，API 的使用速率有限，每分钟只能发 20 次请求。

未来，OpenAI 还计划为o1增加更多功能，比如网络浏览、文件和图片上传等。随着这些功能的逐步推出，o1的应用场景将会更加广泛，不仅在科学、编程、教育等领域有巨大的潜力，甚至可能在更多日常生活中得到应用。

http://mp.weixin.qq.com/s?__biz=MzkzNjIzNjk1Mg==&mid=2247489794&idx=1&sn=8e4c100c6dbfad50916beb2865ef155a

小微模型

一起探索AGI世界，解锁AI实用技能，伴您步入智能生活！

最新文章

阿里国际重磅推出Ovis：免费开源，多模态能力再升级

MiniMax视频模型超越期待，效果媲美可灵与即梦！

OpenAI重磅推出o1模型：从“秒答”到“深思熟虑”！

Pixtral 12B 发布！Mistral AI 进军多模态领域，120 亿参数震撼上线！

LivePortrait：一键制作动态肖像视频，趣味视频轻松搞定！

轻松上手！零一万物Yi-Coder开源，支持52种编程语言，程序员福音来了！

OpenAI重磅消息：GPT Next即将问世，人工智能迎来大变革！

文小言横空出世！超拟真人互动，百度这次真的“上道”了！

“黑科技反击战”：中科院女工程师张欣怡开源AI模型助力全球抗击Deepfake犯罪

微软发布AutoGen Studio：无需写代码也能搞定多代理系统！

AI独角兽Runway删库，这次是真的Run Away了！

韩国Deep Fake事件：当AI技术成为犯罪的工具

Zyphra推出Zamba2-mini：以高效性能重新定义设备端AI的小语言模型

英伟达推出NIM Agent Blueprints服务，加速企业AI应用开发

AI下棋机器人，家庭教育的神助攻还是新潮流？

用AI也能写小说？田渊栋用科幻解读未来

高仿真、情感互动，数字华夏的“夏澜”机器人有点牛！

麦当劳的AI美少女薯条秀：科技与快餐的奇妙邂逅

大圣归来：《黑神话：悟空》凭啥这么火？

马斯克的未来之梦：人类或将实现数字永生

SkyReels：开启 AI 短剧创作新时代

如何快速上手 Midjourney AI：保姆级操作指南

谷歌 Pixel 9 手机系列，AI功能超出预期

SB 1047：加州出台人工智能管理法案 —防范AI灾难还是引发硅谷危机？

销售人员 70% 的时间都花在非销售任务上，AI 可以提供帮助

微软与Palantir强强联合：推进美国国防和情报领域AI

欧洲高校利用AI预测和诊断“阿尔茨海默病”

AI时代，哲学至关重要

OpenAI支持结构化输出和macOS 桌面应用

AI芯片初创公司 Groq 获 6.4 亿美元融资，估值28亿，挑战 Nvidia

微软深度整合Azure AI与GitHub：大幅简化AI应用开发流程

Google推出的Gemma 2 2B模型可以在手机、笔记本电脑和台式机等边缘设备上运行

Grok 的新数据收集设置激怒了 X 用户，可能违反欧盟隐私法规

GPT-4o语音模式灰度测试，同时Long Output支持64K超长输出

NLP 核心技能：注意力机制和Transformer架构全面剖析

市值260亿美元的Canva，收购Leonardo.ai，增强生成式AI的能力

AI的双刃剑：全球治理刻不容缓

大模型价格战，背后的逻辑

OpenAI 推出AI搜索 SearchGPT：挑战谷歌搜索霸主地位

City不City，拥有类人脑的新AI机器人震惊世界！

Meta开源：Llama3.1 405B模型发布

Mem0：增强LLM的记忆功能，实现跨应用的个性化AI体验

OpenAI 发布 GPT-4o Mini：成本优势明显，性能优于 GPT-3.5 Turbo

Agent获客新时代，你的企业上车了吗？

人机共生：大模型时代的工作与生活

传统AI与生成式AI的深度对比

OpenAI的Q计划：“Strawberry"新模型，可自主浏览互联网并自主推理

AI技术与企业数据的深度融合，开辟商业增长新蓝海

未来出行：无人驾驶能否取代网约车司机？

AI Agent：大模型演进的下一站

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉