博士版GPT来了！代号“草莓”的GPT-o1更适合编程和逻辑推理~

学术 2024-10-30 15:43 上海

前不久， OpenAI 对外发布新一代生成模型 GPT-o1（就是之前代号“草莓”的那个）。

该模型在作出回答之前，会像人类一样，花更多时间思考问题，而不是脱口而出，想到哪儿写到哪儿。通过训练，它们学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。

Hiplot官网以最快速度成功对接了新模型的API接口，为国内的广大科研用户提供升级版的学术版GPT-o1 preview和o1-mini。

最大亮点就是：

该系列模型在物理、化学、生物学等任务上的表现与博士生相似，在数学和编码方面的表现尤为出色。

因Hiplot与OpenAI保持更新上的联动，模型也越来越多。现我们特将所有模型合并在同一工具内，通过选项进行模型的切换。

Hiplot（网址：https://hiplot.com.cn）

云工具-绘图工具中一键到达

是不是已经被OpenAI 大模型纷繁不一的名称搞得昏头转向了，ChatGPT3.5、4.0、4.0 Turbo和4o？

没关系，因为大模型的名字，今天起再次「从 1 开始」了。

o1 上线之后， ChatGPT 在回答问题前会进行仔细思考，而不是立即脱口而出。ChatGPT 已经从仅使用系统 1（快速、自动、直观、易出错），进化到了可使用系统 2 思维（缓慢、深思熟虑、有意识、可靠），它可以在响应用户之前产生一个很长的内部思维链。

对于复杂推理，这是一个重大进步，代表了人工智能的新水平。鉴于此，OpenAI 将计数器重置为 1，并将该系列模型命名为 OpenAI o1。

模型亮点

o1 是一个系列模型，包括了 o1、o1-preview和o1-mini，目前真正的o1还没有面市，我们可以接触到的，只有o1-preview（预览版）和o1-mini。

该公司在博客中给出了 preview 和 mini 版的不同定义：

「为了给开发者提供更高效的解决方案，我们也发布了 OpenAI o1-mini，这是一个尤其擅长编程、更快、更便宜的推理模型。」整体来看，o1-mini 的成本比 o1-preview 低 80%。

由于 o1 等大型语言模型是在大量文本数据集上预训练，虽然具有广泛世界知识，但对于实际应用来说，可能成本高昂且速度慢。

相比之下，o1-mini 是一个较小的模型，在预训练期间针对 STEM 推理进行了优化。在使用与 o1 相同的高计算强化学习 (RL) pipeline 进行训练后， o1-mini 在许多有用的推理任务上实现了相媲美的性能，同时成本效率显著提高。

*“STEM 推理”是指在科学（Science）、技术（Technology）、工程（Engineering）和数学（Mathematics）四个领域。

在速度层面，OpenAI 比较了 GPT-4o、o1-mini 和 o1-preview 对一个单词推理问题的回答。结果显示，GPT-4o 回答不正确，而 o1-mini 和 o1-preview 均回答正确，并且 o1-mini 得出答案的速度快了大约 3-5 倍。

在简单的 Prompt 下，用户可能不会注意到太大的差异，但如果问一些棘手的数学或者代码问题，区别就开始明显了。

（1）在数学竞赛上：GPT-4o的准确率为13.4%，o1 预览版的准确率为56.7%， o1正式版，准确率为83.3%。

（2）在代码竞赛上：GPT-4o的准确率为11.0%，o1 预览版的准确率为62%，o1正式版，准确率为89%。

（3）在博士级科学问题上：GPT-4o的准确率为56.1%，人类专家水平的准确率为69.7%， o1的准确率达到了惊人的78%。

与人类在回答难题之前会长时间思考类似，o1 在尝试解决问题时会使用思维链。通过强化学习，o1 学会磨练其思维链并改进其使用的策略。o1 学会了识别和纠正错误，并可以将棘手的步骤分解为更简单的步骤。o1 还学会了在当前方法不起作用时尝试不同的方法。这个过程极大地提高了模型的推理能力。

Q&A

1：OpenAI o1的收费情况如何？

Re：OpenAI官网上ChatGPT Plus 和 Team（个人付费版与团队版）用户，可手动选取使用 o1-preview 或 o1-mini。目前，每位用户每周仅能给 o1-preview 发送 30 条消息，给 o1-mini 发送 50 条消息。

Hiplot 学术版GPT-o1（preview和mini）通过付费方式获取OpenAI的API接口，为国内的科研工作者提供访问服务。

2：之前给GPT4.0、4.0turbo、4o预充的充值金可以和o1共用吗？

Re：可共用，无需额外再对o1进行另外充值。Hiplot上3.5版是月会员无限量使用；4.0系列（包括4.0/4.0turbo/4o）以及o1系列都是通过在Hiplot云市场中购买20元/次的充值金进行预充值，然后根据使用的“流量”，按量扣费。（Tips:Hiplot月会员购买充值金有折扣）

3：o1的API接口有哪些限制？

Re：OpenAI 表示对这两个模型的 API 调用并不包含浏览网页获取信息以及上传文件和图片、函数调用、流式传输（streaming）、系统支持消息等功能。同样，OpenAI 表示正在努力提升这些限制。

4：Hiplot学术版GPT-o1使用过程中的注意事项

Re：O1-preview及O1-mini当前为预览版，模型本身速度较慢，且连接不太稳定。建议不要重复太多次提问，尽量保证在三问三答以内就清空重新开始，问题保持精简。提问后请耐心等待（因为它要思考，要思考，要思考），不要关闭或刷新网页。若已扣费却未收到答案，可联系客服找回。

5：会员不限量使用的“原3.5版”有哪些更新？

Re：新增4o-mini模型，相比旧版3.5turbo，知识库版本更新、更加智能，同样是29元/月不限量使用。

6：更多使用技巧和详细说明，请前往工具旁边的【使用指南】区查看。

更多版本的ChatGPT使用方法见下方：

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

学术版GPT-4o来啦，费用下降60%！

更多功能的使用，一起去Hiplot官网探索吧~

网址：https://hiplot.com.cn

http://mp.weixin.qq.com/s?__biz=MzU3MDczNjY5Ng==&mid=2247517088&idx=2&sn=e4046c2581d0b9413e47d7c97f2f8d9a

科研猫

小平台，大功能。本公众号旨在传播生物医学科研技能和生物信息学基础知识及应用技巧，助您在大数据时代精准挖掘科研数据，让您轻轻松松学知识，顺顺利利发文章。

最新文章

800人！上海市2024年度“科技创新行动计划”【启明星】项目拟立项公示

“中国青年科技奖”拟表彰名单公布

真正适合做学术的“真学术”GPT来了！堪比博士生，更适合编程、逻辑推理~

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

1.62亿，812个面上项目！上海市2024年度“科技创新行动计划”自然科学基金项目出炉

清华排名第七，2025QS亚洲大学排名出炉！

真正适合做学术的“真学术”GPT来了！堪比博士生，更适合编程、逻辑推理~

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

大选获胜！曾多次登上Nature、Science的特朗普，未来对科研界有什么影响

【问卷】为了更好的Hiplot，为了更好的服务

真正适合做学术的“真学术”GPT来了！堪比博士生，更适合编程、逻辑推理~

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

马英九邀请！7所大学，即将访台！

速预约 | 伯豪生物单细胞云流程实操培训带你冲刺科研赛场

真正适合做学术的“真学术”GPT来了！堪比博士生，更适合编程、逻辑推理~

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

病毒学家石正丽加入广州国家试验室，在《自然》发表重磅研究

【问卷】为了更好的Hiplot，为了更好的服务

真正适合做学术的“真学术”GPT来了！堪比博士生，更适合编程、逻辑推理~

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

国务院: 博士毕业不再要求学位论文！

官方通报：姜萍事件迎来真相！

真正适合做学术的“真学术”GPT来了！堪比博士生，更适合编程、逻辑推理~

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

当着「协和院长」的面，饶毅开喷协和：乌烟瘴气、任人唯亲！

官宣：2025年，不分文理科！

真正适合做学术的“真学术”GPT来了！堪比博士生，更适合编程、逻辑推理~

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

基金委发文：目前约17%资助率过低，危害大，应提升至30~35%，增大青年、面上项目经费

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

中国公立医院2024年预算收入Top100，第1名遥遥领先

饶毅：祝贺eLife中国投稿量大降50%，成功远离中国垃圾文章~

博士版GPT来了！代号“草莓”的GPT-o1更适合编程和逻辑推理~

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

重磅！2025年院士增选【储备候选人】超全名录

博士版GPT来了！代号“草莓”的GPT-o1更适合编程和逻辑推理~

学术版GPT-4o来啦，费用下降60%！

ChatGPT学术专用版使用教程，一键润色纠错+中英互译+批量翻译PDF

北京协和医学院，换帅！

南非：特定条件允许可遗传的人类基因组编辑

学术版GPT-4o来啦，费用下降60%！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉