ChatGPT O1 Pro 来了，有点想冲动消费了

文摘 2024-12-10 00:00 四川

我平时一直使用 20 USD/月的 ChatGPT Plus 订阅，确实帮我解决了不少学习和生活上的难题。

在我自己工作领域里，我时常会遇到一些让我苦苦思索却得不到答案的难题。在 ChatGPT 诞生之前，对于这些难题，我经常很难找到合适的人去寻求帮助。感谢 ChatGPT，如今我相当于请到一位几乎无所不知，有问必答的专家，而且他对于我刨根究底式的追问，也永不会厌烦。

即便有时他的回答不是那么准确，但也能给我以启发。

最近 OpenAI 发布了ChatGPT 最新的 mode：O1 Pro，Subscription 费用比起之前的 Plus 订阅，翻了十倍，达到了 200 USD/月。

OpenAI 官网和 Altman 的 X 上，都声称 ChatGPT O1 Pro，能够使用更多的算力，为最难的问题，提供最佳的答案。

什么问题算得上是 hardest questions? 相信每个人心中都有不同的定义标准。

目前已经有不少网友体验了 Pro 模型的强大功能并给出了评测报告。

其中一份报告的链接如下：

https://www.reddit.com/r/OpenAI/comments/1h8j8gl/25_experiments_in_o1_pro_mode_what_worked_what/

这位网友在 24 小时内测试了 25 项任务，内容包含商业、一般推理、逻辑、数学、编程、科学和写作等各个领域。评测的目的是衡量 O1 Pro 模式在回答这些问题时响应的质量、准确性和可用性。

每项任务的响应，如果满足用户需求，则将结果标记为“满意”；如果不满足，则标记为“不满意”。评估是主观的，但以准确性、完整性、逻辑一致性和遵守用户指令等标准为指导。

评测结果如下：

任务总数：25
满意的回答数量：21 (84%)
不满意的回答数量：4 (16%)

评测结果表明：

ChatGPT O1 Pro 推理、写作、逻辑、数学和科学任务中的表现都非常令人满意，在分析推理、解决问题、精确计算、科学解释和多功能写作任务方面表现出了极强的能力，表明该模式能够很好地实现需要清晰逻辑、既定知识和清晰表达的需求。

依赖推理、解释和概念理解是该模式的强项。
在让 O1 Pro 根据输入材料，制定业务计划（Business Plan）的测试中，回答也相当令人满意，这表明模型对企业高层战略和一般业务概念的理解非常准确，可以用来辅助进行日常商业计划和战略建议的制定。
美中不足的是，在专业和技术性更强的财务建模领域里，模型的表现不令人满意。
在编程领域的测试里，简单或概念性的编程任务，对于 ChatGPT O1 Pro 来说是小菜一碟。而在面对复杂度更高的编码需求，比如 PDF 文件的操作，不同编程语言之间根据语义进行转换时，O1 Pro 还无法胜任。

这位评测者的结论：

o1 Pro 模式在依赖事实知识、逻辑推理和结构化解释的领域中表现出强大而稳定的性能。它非常擅长创建连贯的业务策略、解决数学和科学问题、提供逻辑推理解决方案以及生成高质量的书面内容。
在面对精度密集型任务，比如精细化财务建模和复杂的编码解决方案，O1 Pro 模式还需要使用者，具备更多特定领域的微调技能或提供更多的技术细节，才能有效完成任务。

有网友在 X 上给 Altman 建议，考虑到 O1 Pro 高达 200 美元/月的订阅费用，应该为所有 Plus 用户提供一周的试用期。如果 Plus 用户用了确实觉得满意，可以升级到 O1 Pro.

Altman 很快做了回答：这是个好主意！并声称有可能会在明年做出这方面的尝试。

评测中一道微积分的问题：O1 Pro 总共花费了 4分 54秒思考，并得出了正确答案：3

可是我用 Plus 账号的 O1 模式，回答同一个问题，只需要 59 秒。看来 O1 Pro 又出现了过度推理的问题。

那么，我还是等明年可能发布的 O1 Pro 体验版吧？

汪子熙

企业管理软件领域开发专家

最新文章

用初中数学知识证明 1 + 1 = 3

SAP S/4HANA 五种扩展方式介绍

微信群被封了

什么是 SAP ABAP XCO?

从 ABAP 一个相对冷门的关键字 BASE 说起，聊聊 ABAP 和 JavaScript 的语言风格差异

强烈建议尽快搞个软考证！（重大利好）

为何 ChatGPT 等大语言模型，回答 SAP 开发相关问题时，经常一本正经的胡说八道？

解答网友疑问：聊聊 SAP MRP 中追溯需求的技术实现

ChatGPT O1 Pro 来了，有点想冲动消费了

月薪 45-60k 急招！真心建议大家冲一冲行业相关新兴领域，工资高前景好，缺口极大！

JavaScript 消费 ABAP Remote Enabled Function Module

如果不用 OData，Web 应用如何消费 ABAP 系统的 BAPI 等业务逻辑？

赢麻了！软考重大政策，利好所有程序员！

SAP HANA 系统视图的作用概述

SAP ABAP 代码全文(Full Text)搜索的技术实现原理

在 SAPGUI 里用 ABAP 编写和运行俄罗斯方块

什么是 SAP 项目实施中的 Brown Field 和 Green Field 场景

SAP ABAP 里的隐藏数据类型：%_c_pointer

如何查看 SAP ABAP Kernel Module 的源代码

中国又一行业新兴岗位在崛起！这才是咨询人未来5年最好的就业方向！

在 SAPGUI 里同 ChatGPT 进行聊天

基因检测与 AI 时代的未来展望

将 SAP 官网帮助文档的文字内容，自动转换成图表，便于理解

ABAP 系统和 Google Cloud 的集成：ABAP SDK

使用 ABAP Messaging Channel 实现多用户会话间的消息发布和订阅

在 ABAP 里如何打印非 ASCII 字符

ABAP 的演进与未来展望：企业管理软件王者的历程分析

使用 ChatGPT Canvas 辅助 ABAP 开发

为什么 ABAP 会认为 0 等于 '0.4'

重磅！！已封神，极品软考资源，禁止大肆传播！

ABAP Daemons 和 ABAP 后台作业的区别

CSDN 账号已经恢复，后续可能会把专栏内容整理成纸质书出版

使用 SAP ABAP Webdynpro 实现 ABAP Push Channel 的 Web Socket 客户端

什么是 SAP ABAP 系统的工作进程(Work Process)

月薪已超6w！真心建议大家冲一冲行业相关新兴领域，这才是未来5年最好的就业方向

使用 ABAP 实现 Web Socket 编程 - 服务器端部分的实现

什么是 Chain-of-Thought (CoT) Prompting

每日学习一个单词 (2) astronaut

ABAP 系统里的透明表(Transparent Table)，如何理解透明的含义？

使用 ABAP 实现 TCP Socket 编程 (2) - 服务器端部分的实现

使用 ABAP 实现 TCP Socket 编程 (1) - 客户端部分的实现

使用 SAP BTP Document Information Extraction 服务，处理老师发到家长群里的成绩单

我的学习笔记(7) - 什么是时间成本

每日学习一个单词 (1) gradually

授人以鱼不如授人以渔：9.11 和 9.9 哪个数字更大？

二甲基丙醛明明有四个碳原子，为什么叫丙醛？

聊聊 ABAP 里的 System Function Call - C 语言函数调用

应届生年薪炒到61.8w！真心建议大家冲冲这个新兴领域

被子被太阳暴晒之后，闻上去有一股香香的味道，背后的科学原理是什么？

保姆级教程：如何将 ABAP 系统的数据，嵌入到 PDF 并显示在浏览器窗口中

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉