刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限

学术   2024-09-13 12:27   浙江  

今天凌晨1点,OpenAI终于正式发布了传说中的“草莓”模型——o1。大语言模型还能向上突破,OpenAI 再次证明了自己的实力。



北京时间 9 月 13 日午夜,OpenAI 正式公开一系列全新 AI 大模型,旨在专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题,OpenAI 发布最强模型 o1 !打破 AI 瓶颈开启新时代


这次ChatGPT发布包括两个版本:

o1-preview,这是一个深度思考优化模型,

o1-mini,主要面向开发者的更具成本效益的模型。

除了名字不一样,功能、推理、性能等方面与之前泄漏的内容基本一致,o1的推理模式很特殊,在回答用户问题之前会进入拟人化思考模式,将问题分解成更小的步骤逐一解决,生成一个较长的内部思维链,回答的内容也更加准确。


o1主要技术特点介绍

拟人化的推理模式是o1的主打功能之一,与传统模型不同,它在回答问题之前会进行深入的思考,生成一个较长的内部思维链。这种思维链的产生使得 o1 能够更好地理解问题的本质,分析问题的各个方面,从而给出更准确和合理的答案。

使用学习到的评分函数重新排序 1000 个样本时,解决率更是高达 93%。这样的成绩使 o1 在该考试中的得分能够跻身美国前 500 名学生的行列,超过了美国数学奥林匹克的入选分数线。

在 PhD - Level Science Questions(GPQA Diamond)的测试中,o1 也展现出了优异的性能,超过了人类专家的表现。为了进行这项测试,研究人员招募了具有博士学位的专家来回答 GPQA - diamond 问题,结果发现 o1 的表现更为准确

评估

为了突出相对于 GPT-4o 的推理性能改进,OpenAI 在一系列不同的人类考试和机器学习基准测试中测试了 o1 模型。实验结果表明,在绝大多数推理任务中,o1 的表现明显优于 GPT-4o。


o1 在具有挑战性的推理基准上比 GPT-4o 有了很大的改进。


o1 在广泛的基准测试上比 GPT-4o 有所改进,包括 54/57 MMLU 子类别,图示出了 7 个以供说明。



在速度层面,OpenAI 比较了 GPT-4o、o1-mini 和 o1-preview 对一个单词推理问题的回答。结果显示,GPT-4o 回答不正确,而 o1-mini 和 o1-preview 均回答正确,并且 o1-mini 得出答案的速度快了大约 3-5 倍。


o1系列分包含三款模型,OpenAI o1、OpenAI o1-preview和OpenAI o1-mini。这两款模型从今天开始对用户开放使用:

OpenAI o1:高级推理模型,暂不对外开放。


OpenAI o1-preview:这个版本更注重深度推理处理,每周可以使用30次。


OpenAI o1-mini:这个版本更高效、划算,适用于编码任务,每周可以使用50次。

如何使用 OpenAI o1?


ChatGPT Plus 和 Team(个人付费版与团队版)用户马上就可以在该公司的聊天机器人产品 ChatGPT 中开始使用 o1 模型了。你可以手动选取使用 o1-preview 或 o1-mini。不过,用户的使用量有限。



目前,每位用户每周仅能给 o1-preview 发送 30 条消息,给 o1-mini 发送 50 条消息。


是的,很少!不过 OpenAI 表示正在努力提升用户的可使用次数,并让 ChatGPT 能自动针对给定提示词选择使用合适的模型。



附:国内ChatGPT使用地址


✅️国内直连ChatGPT(非套壳)

✅️已支持ChatGPT GPT-4 | GPT-4o | o1-preview | o1-mini

✅️官方限制次数,我们系统集成了200多个官方Plus号支持自由切换账号,

✅️我们系统优势:支持自由切换账号、不限次数使用

目前的功能:支持GPTs、语音实时聊天功能、联网功能、上传文件、数据分析、AI画图、上传图片自动识别功能等 。这些功能都是3.5不能具备的 !有GPT-4o模型,就连刚上线的“草莓”模型——o1。也支持!

ChatGPT 4o 国内直接用!

ChatGPT 4o 国内直接用!

客户好评

客户购买后的好评:稳定,便宜,好用,续费,正版官方号,4.0不限次数,有售后 。


购买这个账号有售后,可以承诺大家如果是套壳不是官方号,可以全额退款,另外系统稳定,不用担心中途封号或者用不了,老客户续费率基本可以达到99%以上

购买这个账号,一直有售后,不用担心中途封号或者用不了
或者直接微信付款后,加我微信:skill1688,备注:98元购买GPT-40 Plus
我会立马通过微信好友请求 。98/月,包年有多送(多买多送)活动:包半年多送1个月,包年多送3个月。

扫码可以直接购买

Linux中文社区
号主来自世界500强,主要分享Linux干货、数据库等,一起学习成长!
 最新文章