Openai o1系列模型:博士级理科水平,但阉割严重像半成品,且太贵
创业
2024-09-13 08:52
广东
作者|子川
来源|AI先锋官
在毫无预兆的情况下,Open ai最新大模型它来了!!!今天凌晨,Open ai宣布最新模型OpenAI 发布了 o1 系列模型,包括 o1-preview 和 o1-mini。此次发布的o1 系列模型就是之前内部代码为“草莓”模型。目前,o1模型已经逐步向所有ChatGPT Plus和 Team用户开放!赶紧去看一下自家的ChaTGPT是否已经成功上车。此次o1模型在推理能力方面表现尤为突出。相关评估如下图所示:还未发布的o1正式版在国际数学奥林匹克竞赛(IMO)的资格考试中得分83%,o1 预览版,是56.7%,对比之下GPT-4o仅正确解决了13%的问题。这个成绩相当于进入全国前 500 名学生的水平,甚至超过了美国数学奥林匹克的入围标准在竞争性编程问题 (Codeforces) 中。GPT4o准确率仅为11.0%,而o1 预览版为62%,o1正式版,更是达到了89%。而在博士级科学问题 (GPQA Diamond),GPT4o的准确率是56.1%,人类专家水平是69.7%,而o1达到了78%。同时o1模型在机器学习基准测试中、理化生等考试中、化物生的博士级科学问题上显著超越GPT-4o。对于 API 用户,o1预览版每百万输入15美元,每百万输出60美元。o1-mini则会便宜一些,每百万输入3美元,每百万输出12美元。如果你的等级在 Tire5 (支付金额>1000 美金),已经可以通过接口进行调用o1系列模型啦。此前就有了解到,o1模型将会被阉割。但没想不到阉割的如此严重。小编会感觉o1模型只是一个半成品,就被奥特曼急匆匆的推出台前。o1-preview模型支持长达128k 上下文,最大32k的输出。而o1-mini支持128k的上下文以及最大64k的输出。当然,此次o1模型的最大特点就是思考时长,和之前测试者透露的相同,目前o1花费在思考上的时间是几秒到十几秒。此次推出的o1系列模型是否会将其他模型远远甩出身后?
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。