首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

OpenAI首次将多模态能力与新型推理范式相结合

科技 2024-12-11 17:01 北京

苏霍伊甲子光年

o1正式版+ChatGPT Pro，奥尔特曼在“挤牙膏”。

作者｜苏霍伊

编辑｜王博

OpenAI的每次动作都备受瞩目。

昨日其CEO山姆·奥尔特曼（Sam Altman）高调宣布要给大家“整个活”：OpenAI将开启一个为期12天的马拉松式直播活动，内容会包括新品发布和功能更新等，还有一些 “ 圣诞礼物 ”。

OpenAI的活动预告

于是，全世界的科技媒体都沸腾了，即使有时差也挡不住追“科技春晚”的决心。

北京时间12月6日凌晨两点，“12 Days of OpenAI, Day 1”的直播开始，当「甲子光年」通宵达旦拆解这份“大礼”，最后却像剥洋葱般发现，奥尔特曼你“没有心”啊！

轰轰烈烈的预告后，第一天的直播只有14分钟，更像是过往一场大的发布活动直播中抽出来的一节切片，尽管OpenAI发布了更新的模型和产品，也有亮点，但其诚意稍显不足。

业内认为这更像是一场华丽的营销策略，有人调侃：“OpenAI教你如何霸占12天科技新闻头条。”

梳理下来，这次OpenAI主要讲了两件事：

1.推出o1正式版，这是首次将多模态能力与新型推理范式相结合的版本。相比于 o1 preview，它更加智能，响应速度显著提升。目前o1模型已全面上线，API 功能也将在不久后推出。

2.发布了全新专业版套餐——ChatGPT Pro，订阅费用为每月200美元，用户可无限访问OpenAI的模型，包括语音功能。此外，Pro套餐还引入了o1 Pro模式，在数学、科学和编码等挑战性机器学习基准测试中表现更好。

1.o1正式版引入多模态

o1模型的正式版将取代之前的o1-preview版本。

奥尔特曼介绍，o1模型在美国数学邀请赛（AIME 2024）中的准确率达到了83.3%，大幅超越o1-preview的 56.7%和早期的GPT-4o模型的13.4%。

在编程方面，o1模型在CodeForces竞赛中得分为89.0%，而o1-preview为62.0%，GPT-4o仅为11.0%，可以看出o1模型能像熟练程序员一样处理复杂编码任务。

在GPQA Diamond博士级科学问题测试中，这些题目基本是“地狱级”难度，o1甚至超过了人类专家，准确率为78.3%，而人类专家的得分为69.7%。但o1的表现不如o1 preview，这可能是模型性能基于问题类型或可能使用的训练数据有所变化导致的。

新模型在处理速度上也有所改进。与之前版本相比，对简单问题的反应时间减少了。奥尔特曼在演示中提到，新版o1在处理复杂问题时的错误率降低了34%，能根据问题的难易程度调整处理时间。

同时，o1引入了多模态功能，能够处理不同类型的输入和输出。新增了结构化输出和开发者消息功能，增强了模型的交互性和实用性。

在发布会上，o1模型的负责人现场绘制了一个草图，展示了一个用于收集太阳能供应太空数据中心使用的系统。由于太空无法使用水冷系统，所以散热需要依靠一块巨大的散热片。研究员随后询问o1模型，如果需要为这个数据中心提供1吉瓦的电力，需要多大面积的散热片才能保持GPU阵列正常工作。

o1模型对草图进行了准确的识别和理解，经过详尽的分析和计算，并得出结论：需要242万平方米的巨大散热片以满足散热需求。

2.每月200美元的ChatGPT Pro

之前传闻中的“收费较贵”版本，今天也来了。

ChatGPT Pro是一项每月费用为200美元的高级订阅计划，可以为用户提供其最先进模型和工具的无限访问权限。特别包括了对OpenAI o1及o1-mini、GPT-4o和Advanced Voice的全面访问，主要针对最为复杂的计算需求。

ChatGPT Pro的特色之一是引入了o1 pro模式，增加了计算资源投入，让模型在解答困难问题时进行更深入的思考和分析。这项服务主要面向需要进行高级数据分析和处理的科研人员、工程师以及其他专业人士，帮助他们提高工作效率并保持在人工智能技术最前沿。

根据外部专家的评测，o1 pro模式在处理复杂的数据科学、编程和案例分析问题时，能够提供比以往模型更为精确和全面的响应。在进行数学、科学和编程等领域的机器学习基准测试时，o1 pro模式的表现优于o1和o1-preview模型。

为了突出o1 pro模式的主要优势（提高可靠性），OpenAI使用更严格的评估设置：只有当模型在四次尝试中有四次能够正确回答问题（“4/4 可靠性”），才被认为解决了问题。

好像大家都要圣诞节之前“赶工”一样，Google Deepmind也于昨日放大招，发布了最新基础世界模型Genie 2；Anthrophic也可能会在圣诞前新发布新模型。

新一轮AI模型角斗似乎又要开始了。

接下来还有11天的“盲盒”待开，之前已有网友猜测可能会发布的Sora模型、Dall-e 4等，希望OpenAI能掏出更多、更硬的货出来。

（封面图和文中配图均来自OpenAI）

工信头条为《中国工业和信息化》（中国电子信息产业发展研究院主办）的公众号，一贯秉承“思想才是力量之源”的理念，坚持“探究转型之道，求解变革之理”的宗旨，致力服务于中国制造业，精心打造高端产经智库媒体。

最新文章

工信部：到2027年将发布并实施100项以上新材料标准

卡奥斯获全国工业互联网大赛“新”材料决赛一等奖

通信跨年思想会：论道AI“新三者”的变革与创新

AI在管理教育中的革命：工具还是主体？

新质生产力稳步发展——二〇二四年中国经济观察

五问+一图，读懂《标准提升引领原材料工业优化升级行动方案（2025—2027年）》

2024“鼎信杯”信息技术发展论坛报名正式开启！

基于AI技术的软件测试系统研究

35个！2024年国家先进制造业集群名单公布

卡奥斯主导全球首个企业数据资产评估国际标准立项通过

国家药监局信息中心、零数科技与赛迪网签署合作协议，共同探索药品监管可信数据空间建设！

《2024 年人工智能现状报告》213页，深度剖析

以高质量发展的实际成效全面推进强国建设民族复兴伟业——中央经济工作会议精神引发热烈反响

再迎风口！重新打量今天的西部！

2024前沿生物技术研究解读——企业呈现哪些值得关注的特征？

小米创下史上单季最强业绩背后：三大战役与四大竞争优势

赛迪观点：“中国产能过剩论”不成立

中国低空经济100家代表企业名单

智算云服务开启了云计算发展的新纪元——《2024H1中国智算云服务市场研究报告》正式发布

2024年中国经济奋楫向前

赛迪研究院联合新华网重磅发布《实体经济和数字经济深度融合发展报告（2024）——实数融合赋能新质生产力发展》

一辆新能源车究竟要用几千克PPS、尼龙

工业AI应用现在到底能不能落地？

系统布局，推进数字技术创新体系建设

5G规模化应用扬帆远航

全球数据隐私、数据安全与网络安全技术发展

OpenAI首次将多模态能力与新型推理范式相结合

当人工智能邂逅制造业：智慧之光点亮智造未来

把主动权握在自己手里——东北传统制造业关键技术攻关观察

数智时代的未来发展趋势

生成式人工智能应用发展报告2024

中共中央政治局召开会议分析研究2025年经济工作研究部署党风廉政建设和反腐败工作中共中央总书记习近平主持会议

借鉴法国做法，着力激发我国人工智能创新潜能

人形机器人行业深度报告：黎明破晓，AI归宿

工业经济“开足马力”冲刺全年“收官战”

C919，又有新消息！

低空经济，能飞多高？

赛迪发布：前三季度重点工业行业运行情况

王传福：比亚迪如何熬过第三个十年

我国首个商业航天发射场是怎样建成的？

“2024年十大流行语”发布！

商务部回应，四大协会声明：美国芯片产品不再可靠、不再安全，谨慎采购！

当AI遇上大数据：数字经济的双引擎暴走之旅

数字化绿色化协同转型发展报告（2024）

《美国政府关键和新兴技术国家标准战略：实施路线图》摘译

如何构建健康和谐的工业软件产业生态系统？

中国光伏产业发展路线图公布

我国专精特新“小巨人”企业达1.46万家：近九成属于制造业超八成分布在新兴产业

欢迎订阅 | 工信部机关刊《新型工业化》2025年度征订火热进行中！

祝贺！我国首个商业航天发射场首次发射任务告捷

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉