首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

打脸！美国OpenAI发布最新模型，李彦宏的十年预判现在就错了？

科技 2024-09-14 16:21 北京

太平洋的另一边又技术大爆发了。9月13日，OpenAI突然发布传说中“草莓”模型——OpenAI o1。

根据美国OpenAI的官方博客显示，OpenAI o1 在竞争性编程问题(Codeforces)中排名第 89 位，在美国数学奥林匹克 (AIME) 预选赛中跻身美国前 500 名学生之列，并在物理、生物和化学问题 (GPQA) 基准测试中超越人类博士级准确度。

这么看很多人可能无法理解这个最新模型能力究竟有多强，毕竟很多大模型厂商都习惯性吹牛。大家看下下面这个图就比较清楚了，这是GPT4o（前一天OpenAI的最强模型）、OpenAI o1预览版和OpenAI o1正式版，在数学、代码和博士级科学问题的准确率数据对比。

很容易就可以得出一个结论，那就是碾压——OpenAI再一次自己碾压了自己。有人说过，能够超越OpenAI的只有OpenAI自己。现在看，此言不虚。OpenAI o1正式版的能力，可以说差不多是GPT4o的八、九倍。

所以，大家看到这次命名的区别了吗？很多人还在期待ChatGPT5，结果，按照OpenAI 在发布文档中说法，他们认为新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1。

所以，开启了下一代大模型的 Orion（猎户座）系列。

按照此前的规律来看，打败OpenAI o1的大模型，很可能就是OpenAI o2。这同时意味着，GPT系列走到4很可能就已经绝版了，或许不会有GPT-5了。

OpenAI o1在技术上实现了如此重大的突破，核心是什么呢？答案指向了思维链。根据官方说法，与以往模型最大的不同就是，OpenAI o1拥有进化的推理能力，会在回答前进行缜密思考，生成一个长长的内部思维链。

什么是思维链？就是模型在生成回答之前，会经历一系列复杂的内部逻辑推理过程，从而构建起一个类似于人类思考路径的链条。说简单点，就是大模型会像人类一样思考你提出的问题。

现在很多其他大模型基本就是处于高阶版本的信息检索阶段，而有了思维链就能够将多个步骤的思考串联起来，每个环节都基于前一步骤的信息进行深化和拓展，最终形成一个连贯且合理的答案。

不知道大家是否还记得，从去年开始很多人说AI带来的新的职业工种就是，提示词工程师（prompt engineer）。当年，李彦宏曾经预测说，十年以后，全世界有50%工作会是提示词工程，不会写提示词(prompt)的人会被淘汰。

提示词工程师，就是通过写一堆大模型能听得懂的提示词，指引大模型生成自己想要的作品。然而，具备思维链的大模型横空出世，大模型本身就擅长理解和响应简短、清晰的指令，而不再需要大量的指导。所以，提示词工程师就没了存在的必要性了。

事实上，就在很多人觉得提示词工程师是AI时代的职业方向的时候，也有很多的大佬认为提示词工程师这个职业本就不该存在。OpenAI的CEO山姆奥特曼曾表示，提示工程是生成式AI的一个临时阶段。

哈佛商学院著名杂志《哈佛商业评论》刊文称“AI prompt engineering isn't future（提示工程不是未来）”，并认为prompt engineering是一种短暂的现象，随着AI模型的进步，它将变得多余。

实际上，早在去年的时候OpenAI就推出了图像生成工具DALL-E的最新版本DALL·E3。在使用DALL·E3生成图像时，用户无需再自己苦思冥想设计复杂的prompt。只需要向ChatGPT表达一个想法，它就能自动为DALL·E3生成一个量身定制、细致入微的prompt。

提示词工程师为什么如此短命？一个原因在于，门槛其实不高，而且提示词的使用也很容易复制和模仿。

但是根本原因是，AI的本意是智能化操作，让手动操作变成机器智能。怎么一个大模型出来了，还得让人类去学习怎么去操作这个大模型呢？这不是本末倒置了吗？所以，随着大模型的进化，一定是能够听得懂人类的自然语言。这就是技术进化的方向。

不过，话说回来，在创新驱动的领域，高质量的prompt仍然至关重要。正如Stable Diffusion的技术产品总监郑屹州曾说的，提示技术应该作为一项技能，而不该成为一个岗位。

虽然说现在也不适合下判断说李彦宏的十年预测错了，但是从技术发展方向来看似乎并不支持李彦宏老师的预判。

-全文完-

写干货，说人话，欢迎关注

http://mp.weixin.qq.com/s?__biz=Mzg5Njc3MDAwMQ==&mid=2247484326&idx=1&sn=4d8ef0ffd54c82bb62bce98e82ea7ee5

数字进化岛

洞察科技产业，透视全球真相。

最新文章

百度Q3净利润增长17%超预期，为啥美股港股双双下跌？

强烈建议麦琳和李行亮锁死，谁也别出来祸害别人

胖东来和钟睒睒，请你们大胆说下去

AI让人类去死，是产生了自我意识？别太天真了

不要被钟睒睒给骗了

何同学早就该翻车了

华为云双11强调价值战：华为云是打不起价格战吗？

惊！腾讯混元大模型技术负责人刘威离职，离职潮席卷“大厂”？

OpenAI o1模型炸场两个月后，Kimi对标发布国产最强新模型

刚刚！腾讯低调推出AI搜索产品ima，最大的亮点不是能搜公众号

奉劝百度，不要企图用非共识言论惊爆市场

李开复对AI为何频频指点江山？

美国OpenAI慢了！国产大模型正在海外大杀四方

突发！Kimi创始人被多家前投资方申请仲裁，国产大模型不被资本看好了？

特朗普上台，中美AI走进大爆发前夜

全网老公崩溃？八个瑞士卷怎么分？我问了问国产AI TOP10：这个AI一个都不给老婆分

“男老师造假，毁了女学生，姜萍也是受害者”

中美大模型如何追赶？李开复：缩小中美大模型差距其实很难

禁令落地！刚刚，美国宣布2025年起限制对华AI投资，香港和澳门也不例外

雷军七天骂翻全网？那个让雷军不得不回应的AI配音，究竟是怎么做出来的？

开源世界天塌了！因为美国政府制裁，Linux 内核就“清洗”了11名俄罗斯开发者

美国AI像人一样用电脑，中国AI像人一样用手机：是划时代还是伪需求？

一个美国AI大模型，让14岁男孩决定去死

重大转折！融资千万的AI公司被OPPO收购，95后创始人携核心团队集体入职

最新！美国限制对中国AI投资的规定，将在一周内发布：想要杀死国产大模型？

京东这次翻车，和百度如出一辙

百度为啥不做Sora类的视频生成？李彦宏：10年、20年都可能难以商业化应用

李开复谈中美大模型差距：很多美国朋友都认为中国会远远落后

惊了！损失超千万美元？字节大模型整个GPU集群被实习生病毒攻击，两个月的训练结果都是错的

封死最后合规渠道！微软Azure OpenAI突然终止中国个人服务，国内套壳大模型无路可走？

太蠢了！四川2.15万亿拆迁项目竟然是用 AI 生成的

见证历史！国产大模型首次在公开榜单上超过GPT-4o

百度网盘安全漏洞！女用户隐私照片被泄露，陌生男子：比我还色

烧钱结束？多家国产大模型公司放弃预训练，技术转向不丢人！

一文读懂国庆后股市行情和操作指南

官方确定三只羊录音是 AI 合成，人们为啥不相信？

估值万亿、清除异己！美国最强AI公司成功集权，OpenAI CEO奥特曼成最大赢家

会说中文，讨好中国？预告4个月后，ChatGPT终于上线了语音功能

数字铁幕！美国禁止联网汽车使用中国研发软件，《纽约时报》都看不下去了

ChatGPT 之父罕见发长文说不要怕AI，为什么国内网友反而更害怕了？

当AI学会了自我批评

蚂蚁吞大象？高通被爆将收购英特尔，或成史上最大科技并购

Kimi创始人杨植麟说出行业真相：全球人类数据都已经被AI学完了……

百度AI，骑虎难下？

阿里云新加坡大火烧了30小时，20年后也不能恢复？

突发！阿里云盘 bug 能看别人隐私照片，甚至不知道事故发生了多久…

打脸！美国OpenAI发布最新模型，李彦宏的十年预判现在就错了？

还有15项异常！阿里云电池爆炸机房着火，为啥导致字节跳动服务严重中断？

再升级！美国要求先进AI公司报告模型训练情况：防止中国使用美国最先进技术

阿里云新加坡节点突发火灾，客户业务为什么没有自动迁移？

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉