OpenAI蹿稀式更新，200刀一个月的完整版o1你心动了吗

科技 2024-12-06 08:03 四川

提前过年了。

OpenAI昨天在X上发推文，说从12月5日开始，要进行为期十二天的发布会，美国西部时间每天上午十点，每天挤一点点牙膏。

这个配置非常像美国流行的圣诞倒数日历，每天开一个小奖，有一个小惊喜，直到节日来临。

“12天，12场直播，一堆新玩意儿，有大有小”｜还说不是圣诞礼盒！

OpenAI CEO萨姆·奥尔特曼（Sam Altman）前几天也在《纽约时报》DealBook峰会上给活动预热。“我们准备了很多新的、很棒的东西，”奥尔特曼说，“在接下来的12个工作日里，我们每天都会发布一个新功能，或者进行一次演示。”

据媒体透露的信息，这12天的发表内容包括之前大火的文本转视频AI Sora的升级版，和ChatGPT的agent版（也就是能处理特定任务的“披皮”ChatGPT），和推理模型o1的完全体。

在此之前，OpenAI好像很久都没有大动作了，距离Sora的第一次亮相已经过去了294天，距离ChatGPT语音版发布已经过去了205天，o1前瞻版的发布也已经是九月的事了。

第一天的内容有这些

今天凌晨，我们围观了12天发布会的第一炮。这个发布会很短，不到二十分钟就结束了。

发布会气氛很轻松随意，像家庭聚会，参与者除了奥尔特曼本人，还包括科学家 Hyung Won Chung（左二），他是o1模型的核心作者，在MIT取得了能源方向的博士学位，目前是OpenAI的研究科学家。右二和右一分别是Max Schwarzer和o1最引人注目的改进“思维链”的提出者Jason Wei。

这场发布会上主要更新的内容有两个：放出o1完全体，推出每月200美元的ChatGPT Pro。ChatGPT Pro可以无限制访问o1完全体。

o1完全体

OpenAI在9月发布了o1前瞻版，跟之前的大模型不一样的是，o1牺牲了速度，展示了思维链，能做更复杂的深度思考。在过去的三个月里，我们一直没有见到o1的完整形态，前瞻版也只能供付费用户使用。现在完全版终于来了。

Max Schwarzer表示，比起前瞻版，o1完整版速度更快，正确率更高，更加智能，不会对每个问题都想老半天。

他说：“我们对这个模型进行了一系列非常详细的人工评估，我们发现，它犯重大错误的次数比o1预览版减少了约34%，同时充分思考的速度却提高了约 50%。 ”

在发布会上他们现场演示了三个例子。

Schwarzer是历史爱好者，他问了o1和o1前瞻版同一个问题，让它们列出公元二世纪的罗马皇帝，讲一下他们的在位年代和功绩。这个问题不难，但是GPT-4o经常给出错误答案。

左侧是o1，右侧是o1前瞻版｜OpenAI

在现场的演示中，两个模型都给出了正确答案，但是o1只用了14秒就给出了答案，o1前瞻版用了33秒。

“同样的问题我离线测试了几次，发现o1平均比o1预览版快60%。”Schwarzer说。

第二个例子是Hyung Won Chung演示的多模态功能。

作为热力学博士，Hyung Won Chung手绘了一张在太空里建数据中心的示意图，在这个设计里，数据中心靠巨大的太阳能板获取能量，然后靠散热板冷却GPU。

Hyung Won Chung给o1出的题是，这个数据中心功率是一千兆瓦，要让数据中心正常运转，冷却板的最小面积是多少？

o1发现这个问题里没有说明冷却的温度是多少，它按照常识把温度设定为室温，然后迅速算出了冷却板的面积是242万平方米。

第三个例子是Jason Wei演示的，他让o1找到符合描述的蛋白质。之前的o1前瞻版没法回答这个问题。

Wei给了o1六个标准，每一个标准都需要调用特定领域的化学知识，可能有很多蛋白质符合这些，所以o1需要评估所有候选项，然后对照六个标准一条一条进行检验。

最终o1在53秒后给出了正确答案，还展示了思维过程。

这三个例子分别展示了o1速度上的提升、强大的多模态功能，和深度思考能力的提高。

实测解几何题能力大大提高

我们第一时间用o1完全版做了测试。

先问了一个初中物理题，以下三组中，哪个提起重物所需的力最小？

o1几乎秒给答案，还把思考路径写了出来，详细到能做习题辅导。

第二个是逻辑推理题，需要按照规律填出缺失的数字，令人联想到一些考公题。

这道题o1想了1分41秒，也给出了正确答案，思考过程如下：

在直播的最后，奥尔特曼说，ChatGPT Pro后续还会推出更多功能，比如网页浏览，文件上传，函数调用等，明天的直播内容主要是面对开发者的一些更新。

作者：翻翻、Steed

封面图来源：OpenAI

本文来自果壳，未经授权不得转载.

如有需要请联系sns@guokr.com

果壳

科学和技术，是我们和这个世界对话所用的语言。

最新文章

保质期半年的“预制饭”，加了多少防腐剂？

看《清明上河图》不算啥，进去转一圈你试过吗？

2024年，动力外骨骼第一次现身巴黎奥运会和户外山野

掺了棉花的冰块竟然砸不碎？丘吉尔也干了！

终于找到了不化妆素颜也漂亮的方法！（普通人适用版）

为什么劝你不要买几千块的洗地机？（不只是因为贵

见到带编号的蝴蝶，赶紧发上网！

别再争那条裙子是蓝黑还是白金了，这个摄像头能一眼看穿

奶茶店都在推的小绿水，“猪饲料榨成汁卖20多一杯”

一个秘密：你刚做过清洁的家可能正在被病毒占领......

躺在荷叶里，为什么会睡得这么舒服？

假期别去博物馆，更别带孩子去，因为……

如何识别AI伪造的人像？看眼睛！

坐飞机当然要靠窗啦！你说啥？这架飞机是全透明的？？

中国最认真表演的一批人，不在娱乐圈

当家里的老人突然变得不讲理，说出很多难听的话，你要考虑他是不是患上了抑郁症

黄金一路飙升，但为什么我劝你先别买黄金首饰……

少不了的过年仪式感，就靠这件中国风年衣了！

圣诞节，男/女朋友再找你要PS5，你就把这篇转给他……

冬天不能每天洗澡真不是人脏，而是因为……

如何让“公园20分钟”快乐翻倍？来看鸟吧！

我停掉了一直在学的新概念英语，太庆幸了！

北京顶级富豪也消费降级了？我去北京SKP“卧底”了三个月

办公室高票选出的秋冬上班好搭子！有它放心晚起半小时！

年轻人不爱穿秋衣裤？胡说！早就被这条拿捏了！

日本离奇悬案：被困蹲便器下的人

9个月狂杀16人，凶手竟将受害者尸体高价出售……

如果确诊，刚出生1个月的女儿生存期可能只剩9个月了

为什么那些讨厌穿内衣的女孩儿，又纷纷穿上了内衣？

吃撑后的 24 小时，身体居然发生了这样的变化……

大成筛子的毛孔，一查竟然和它有关……

4只蚂蚁+1杯牛奶=1杯酸奶？

有了娃才懂！有些东西真不能省，越省越像养了“吞金兽”

一男子长出三个丁丁，但他活了一辈子都没发现

百度造了一个筐，你想让AI干啥，都能往里装

图生图新魔法来了！Google新工具Whisk实测

是我土狗了，这些东西居然现在才知道！

复古风回潮！法国女人都爱穿的“毛呢格纹裙”秋冬氛围感拉满，从圣诞时髦到新年！

原产于中国的螳螂，正在美国进行平等的杀戮

这个小众品牌又出新款，用完连1000块的香水都弃了……

售价两百万的画作，作者竟然不存在？

今年冰糖葫芦是要考研吗？！一米糖葫芦、奶皮子糖葫芦、无花果糖葫芦……

手机又吃菌子了！体操运动，是AI视频最残酷的图灵测试

别光顾着洗头洗脸，这个地方才是最脏的！

下个月就回家过年了，吃吃喝喝喝都准备好了吗？

车厘子又又又“腰斩”了？怎么没斩到我这？！

冷鲜肉下的垫纸是什么？能长期放在冰箱里吗？

除了水产市场，哪里钓鱼成功率最高？

为什么医学院的校徽上，多有一条蛇？

7类取暖电器全测评！“吃电大户”竟然是节能王？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉