Openai o1系列模型:博士级理科水平,但阉割严重像半成品,且太贵

创业   2024-09-13 08:52   广东  

作者子川 

来源AI先锋官


在毫无预兆的情况下,Open ai最新大模型它来了!!!
今天凌晨,Open ai宣布最新模型OpenAI 发布了 o1 系列模型,包括 o1-preview 和 o1-mini。
不过更强的o1正式版模型并未发布。
此次发布的o1 系列模型就是之前内部代码为“草莓”模型。
目前,o1模型已经逐步向所有ChatGPT Plus和 Team用户开放!
赶紧去看一下自家的ChaTGPT是否已经成功上车。
下面就带大家全面了解此次发布的o1模型。
此次o1模型在推理能力方面表现尤为突出。相关评估如下图所示:
还未发布的o1正式版在国际数学奥林匹克竞赛(IMO)的资格考试中得分83%,o1 预览版,是56.7%,对比之下GPT-4o仅正确解决了13%的问题。
这个成绩相当于进入全国前 500 名学生的水平,甚至超过了美国数学奥林匹克的入围标准
在竞争性编程问题 (Codeforces) 中。GPT4o准确率仅为11.0%,而o1 预览版为62%,o1正式版,更是达到了89%。
而在博士级科学问题 (GPQA Diamond),GPT4o的准确率是56.1%,人类专家水平是69.7%,而o1达到了78%。
同时o1模型在机器学习基准测试中、理化生等考试中、化物生的博士级科学问题上显著超越GPT-4o。
也是有史以来,第一次取得如此成绩的模型。
面对这么强的模型,奥特曼做出了相应的调整。
o1预览版每周30条,o1-mini每周50条。
没错,你没看错,一周只能发30条信息。。。
对于 API 用户,o1预览版每百万输入15美元,每百万输出60美元。
价格太恐怖了!!!
o1-mini则会便宜一些,每百万输入3美元,每百万输出12美元。
如果你的等级在 Tire5 (支付金额>1000 美金),已经可以通过接口进行调用o1系列模型啦。
此前就有了解到,o1模型将会被阉割。但没想不到阉割的如此严重。
小编会感觉o1模型只是一个半成品,就被奥特曼急匆匆的推出台前。
o1-preview模型支持长达128k 上下文,最大32k的输出。而o1-mini支持128k的上下文以及最大64k的输出。
当然,此次o1模型的最大特点就是思考时长,和之前测试者透露的相同,目前o1花费在思考上的时间是几秒到十几秒。
不过,关于o1模型具体的表现还有待发酵。
这么贵的草莓会更好吃吗?
此次推出的o1系列模型是否会将其他模型远远甩出身后?
我们拭目以待!!!



 .END.
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。

往期文章回顾





AI先锋官
AIGC大模型及应用精选与评测
 最新文章