博士版GPT来了!代号“草莓”的GPT-o1更适合编程和逻辑推理~

学术   2024-10-30 15:43   上海  

前不久, OpenAI 对外发布新一代生成模型 GPT-o1(就是之前代号“草莓”的那个)。


该模型在作出回答之前,会像人类一样,花更多时间思考问题,而不是脱口而出,想到哪儿写到哪儿。通过训练,它们学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。


Hiplot官网以最快速度成功对接了新模型的API接口,为国内的广大科研用户提供升级版的学术版GPT-o1 previewo1-mini


最大亮点就是:

该系列模型在物理、化学、生物学等任务上的表现与博士生相似,在数学和编码方面的表现尤为出色。


因Hiplot与OpenAI保持更新上的联动,模型也越来越多。现我们特将所有模型合并在同一工具内,通过选项进行模型的切换。




Hiplot(网址:https://hiplot.com.cn)

云工具-绘图工具中一键到达


是不是已经被OpenAI 大模型纷繁不一的名称搞得昏头转向了,ChatGPT3.5、4.0、4.0 Turbo和4o?

没关系,因为大模型的名字,今天起再次「从 1 开始」了。

o1 上线之后, ChatGPT 在回答问题前会进行仔细思考,而不是立即脱口而出。ChatGPT 已经从仅使用系统 1(快速、自动、直观、易出错),进化到了可使用系统 2 思维(缓慢、深思熟虑、有意识、可靠),它可以在响应用户之前产生一个很长的内部思维链。

对于复杂推理,这是一个重大进步,代表了人工智能的新水平。鉴于此,OpenAI 将计数器重置为 1,并将该系列模型命名为 OpenAI o1。

模型亮点

o1 是一个系列模型,包括了 o1、o1-preview和o1-mini,目前真正的o1还没有面市,我们可以接触到的,只有o1-preview(预览版)和o1-mini。

该公司在博客中给出了 preview 和 mini 版的不同定义:

「为了给开发者提供更高效的解决方案,我们也发布了 OpenAI o1-mini,这是一个尤其擅长编程、更快、更便宜的推理模型。」整体来看,o1-mini 的成本比 o1-preview 低 80%。

由于 o1 等大型语言模型是在大量文本数据集上预训练,虽然具有广泛世界知识,但对于实际应用来说,可能成本高昂且速度慢

相比之下,o1-mini 是一个较小的模型,在预训练期间针对 STEM 推理进行了优化。在使用与 o1 相同的高计算强化学习 (RL) pipeline 进行训练后, o1-mini 在许多有用的推理任务上实现了相媲美的性能,同时成本效率显著提高。

*“STEM 推理”是指在科学(Science)、技术(Technology)、工程(Engineering)和数学(Mathematics)四个领域。

在速度层面,OpenAI 比较了 GPT-4o、o1-mini 和 o1-preview 对一个单词推理问题的回答。结果显示,GPT-4o 回答不正确,而 o1-mini 和 o1-preview 均回答正确,并且 o1-mini 得出答案的速度快了大约 3-5 倍。

在简单的 Prompt 下,用户可能不会注意到太大的差异,但如果问一些棘手的数学或者代码问题,区别就开始明显了。

(1)在数学竞赛上:GPT-4o的准确率为13.4%,o1 预览版的准确率为56.7%, o1正式版,准确率为83.3%。
(2)在代码竞赛上:GPT-4o的准确率为11.0%,o1 预览版的准确率为62%,o1正式版,准确率为89%。
(3)在博士级科学问题上:GPT-4o的准确率为56.1%,人类专家水平的准确率为69.7%, o1的准确率达到了惊人的78%。


与人类在回答难题之前会长时间思考类似,o1 在尝试解决问题时会使用思维链。通过强化学习,o1 学会磨练其思维链并改进其使用的策略。o1 学会了识别和纠正错误,并可以将棘手的步骤分解为更简单的步骤。o1 还学会了在当前方法不起作用时尝试不同的方法。这个过程极大地提高了模型的推理能力。


Q&A

1:OpenAI o1的收费情况如何?
Re:OpenAI官网上ChatGPT Plus 和 Team(个人付费版与团队版)用户,可手动选取使用 o1-preview 或 o1-mini。目前,每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。

Hiplot 学术版GPT-o1(preview和mini)通过付费方式获取OpenAI的API接口,为国内的科研工作者提供访问服务。


2:之前给GPT4.0、4.0turbo、4o预充的充值金可以和o1共用吗?
Re:可共用,无需额外再对o1进行另外充值。Hiplot上3.5版是月会员无限量使用;4.0系列(包括4.0/4.0turbo/4o)以及o1系列都是通过在Hiplot云市场中购买20元/次的充值金进行预充值,然后根据使用的“流量”,按量扣费。(Tips:Hiplot月会员购买充值金有折扣)


3:o1的API接口有哪些限制?
Re:OpenAI 表示对这两个模型的 API 调用并不包含浏览网页获取信息以及上传文件和图片、函数调用、流式传输(streaming)、系统支持消息等功能。同样,OpenAI 表示正在努力提升这些限制。

4:Hiplot学术版GPT-o1使用过程中的注意事项
Re:O1-preview及O1-mini当前为预览版,模型本身速度较慢,且连接不太稳定。建议不要重复太多次提问,尽量保证在三问三答以内就清空重新开始,问题保持精简。提问后请耐心等待(因为它要思考,要思考,要思考),不要关闭或刷新网页。若已扣费却未收到答案,可联系客服找回。

5:会员不限量使用的“原3.5版”有哪些更新?
Re:新增4o-mini模型,相比旧版3.5turbo,知识库版本更新、更加智能,同样是29元/月不限量使用。

6:更多使用技巧和详细说明,请前往工具旁边的【使用指南】区查看。


更多版本的ChatGPT使用方法见下方:

ChatGPT学术专用版使用教程,一键润色纠错+中英互译+批量翻译PDF

学术版GPT-4o来啦,费用下降60%!

更多功能的使用,一起去Hiplot官网探索吧~
网址:https://hiplot.com.cn

科研猫
小平台,大功能。本公众号旨在传播生物医学科研技能和生物信息学基础知识及应用技巧,助您在大数据时代精准挖掘科研数据,让您轻轻松松学知识,顺顺利利发文章。
 最新文章