首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

ChatGPT输惨了？智力堪比博士的草莓AI大模型强到可怕！

职场 2024-11-05 08:17 湖北

关注【秋叶 AI 知识星球】

回复关键词【6】

领取 50+精选 AI 神器！

作者：子珊

编辑：若凡

大家好，这里是秋叶编辑部，我是子珊~

前段时间，人工智能研究公司 OpenAI 继 ChatGPT 系列智能聊天程序后，

又发布了两款最近的大语言模型 o1-preview 和 o1-mini，

也就是此前备受关注的「草莓大模型」！

千呼万唤始出来，这个被 OpenAI 造势已久的绝密草莓终于「熟了」！

关于「草莓大模型」为什么没有延续 GPT 系列的命名方法，OpenAI 对此解释说：

「对于复杂的推理任务来说，这是一个重大的进步，代表了 AI 能力的一个新的水平。

因此，我们将计数器重置为 1，并将这个模型系列命名为 OpenAI o1。」

也就是说，o 系列与 GPT 系列是并列的，

OpenAI 公司对草莓大模型的重视程度可见一斑~

和之前的 GPT 大模型相比，o1 模型的推理能力有了显著提升，尤其是在数据分析、数学和编程方面。

不过，此次发布的 o1-preview 暂时只是一个预览版，功能还并不完善，

o1-mini 则是一个更小、更便宜的版本，能够适用的应用场景也相对局限。

但尽管如此，OpenAI 称，这仍是目前为止推理能力最好的模型！

（图源：OpenAI 官网）

根据 OpenAI 官方公布测试的数据：

o1 在编程竞赛题目（Codeforces）中排名达到第 89 百分位，

在美国数学奥林匹克竞赛（AIME）的资格赛中，位列全美前 500 名学生之列，

并在物理、生物和化学问题的基准测试（GPQA）中，首次超过了人类博士水平的准确率！

那么，o1 的推理能力真有官方说的那么厉害吗？

产品发布后，网友们迫不及待地对它开始了「测试」~

比如，通过输入案件的证人证词信息，请 o1 对凶手进行推理：

（图源：硅星人）

这种简单的推理题目，对 o1 来说自然不在话下，

在这次测试中，它仅用 6 秒就分析出了四位证人的证词真假与否。

新机词挖一此莫禾多此（真相只有一个）！

凶手就是杰克！

看来，草莓大模型在推理分析类任务的处理上的确很有实力！

但它也并非在所有方面都能碾压其他大模型，

比如，在文本生成这类文科向的任务上，GPT-4o 仍然保持优势。

这么来看，GPT 更像是一个文科学霸，而 o1 是位理科学霸~

但这位偏科的「理科学霸」在 9 月发布之后，没有如预期的那样收获满堂喝彩，

而是受到了大众犀利而谨慎的审视。

原来，为了获得更好的推理能力， o1 采用了一种名为「思维链」的方案~

即把一个复杂的问题拆解为若干子问题，

在作出回答响应之前，需要先在其内部进行一番复杂分析，再寻找出最合理的解决方案。

不同于 GPT 面对信息时的「脱口而出」，

这些多出来的环节，让 o1 模型的响应速度比其他模型慢了许多。

而对于已经习惯了「及时响应」的大部分用户来说，

这种突然慢下来的体验，固然显得不那么友好了。

但无论如何，「草莓」所代表的是一种完全不同于 GPT 背后运行逻辑的全新范式，

不再和传统人工智能一样，仅仅追求结果的正确，

而是侧重于关注 AI 推理过程中的每个具体步骤，遵循更加严密的逻辑和循序渐进的过程。

短短 2 年，AI 都更新迭代无数次，现如今的 AI 大模型也百花齐放，AI 技术日新月异，

在 AI 时代，作为 AI 的操控者，我们更要好好把握时机，掌握 AI 技能不仅会成为未来的趋势，更能成为我们人生升职跃迁的敲门砖！

别再犹豫了，现在加入《秋叶 AI 设计实战集训营》，让专业实战派导师带你早日上手 AI 设计，提升职场竞争力！

原价 99 元

今天 只需 3.3 元！

✅秋叶实战派导师教学

✅专业助教团随时答疑

🎁报名还送 AI 设计工具（无需下载直接用）

👇👇👇

报名后自动弹出班主任微信

务必扫码添加才能解锁课程+领取福利！

✍

🪐

点击卡片关注【秋叶 AI 知识星球】

回复关键词【6】

领取 50+精选 AI 神器！

↓↓↓

http://mp.weixin.qq.com/s?__biz=MjM5MDgxNjc0MA==&mid=2651607023&idx=3&sn=fcd09fda94b7b56cb384e42c822f0fde

11年来坚持分享Office干货教程，全网粉丝3500多万，出版图书100多本……和秋叶一起学，让学习变得简单有趣！免费PPT模板、PPT干货教程、PPT素材资源、PPT精品课程，还有AI工具、职场干货等你来挖~~~

最新文章

离开董明珠后，孟羽童在小红书年入400万，我彻底傻眼了……

被林更新疯狂吐槽的PPT长啥样？看完我被丑哭了

ChatGPT新功能！居然抄袭我们国产AI……

做PPT时经常出现的3个低效错误，我不允许还有人再犯！

李子柒回归，热搜炸了！她这张图里的细节，细思极恐……

PPT重点数据，不要再随便标红了！

太变态了！同事用了Excel录制宏，1秒搞定我大半天工作！

对不起，虞书欣！新剧爆火，但我全程的关注点都在……

领导骂我PPT做的丑，原来是因为我不会套模板！

上班偷偷用了这18个函数，一天的工作我半小时搞定！

PPT大段文字还在手动排版？学会这招，提速2倍！

太牛了！实习生的一份PPT，竟让杨天真、杜华抢着投资！职场中会PPT究竟有多吃香？

八个瑞士卷怎么分？看完AI的回复，我和老公离婚了

学会不吃亏：PPT里那些P图小技巧！

发了230万工资后，我背着老板干了这件事，差点被开除！

白色背景的PPT，怎么做才不单调？这个方法好用到哭！

发了230万工资后，我背着老板干了这件事，差点被开除！

做PPT千万别用“微软雅黑”！

这4个Excel文件批量操作技巧，我居然才知道，不要太好用！

黄圣依杨子打起来了？看完视频，我人笑麻了！

胡歌演讲现场突发意外，但他熬夜做的PPT被夸爆了！我却发现一个大问题……

学好这20个函数，你的Excel就很牛啦！

为什么今年双十一很多人都不买东西了？？？

为什么今年双十一很多人都不买东西了？？？

豆瓣8.2！又一国产神剧诞生？剧里这个细节把我看呆了……

别再用VLOOKUP了！这个函数，比它好用10倍！

人到中年，是不是都会一地鸡毛之后《再见爱人》？

花1小时给300页PPT换颜色，同事只用了1分钟，怎么搞定的？

内娱第一性感厨娘，宋丹丹捧不红的干女儿，在小红书靠做饭吸粉400万！

太酷了！我做了两页立体PPT，直接把领导看呆了！

哪位Excel高人琢磨出的这2个数据整理技巧，太好用了！

用AI做Excel表，一键自动生成，太爽了！

一套PPT赚17W！从小白到PPT大神，他把自己活成了一篇爽文！

把PPT时间轴“掰弯”后，居然这么高级？！

肯德基用AI海报被骂惨了，麦当劳：不会AI就别硬玩！

天才少女江萍，拿下奥数竞赛冠军！但她的PPT，却被网友骂惨了……

同事在报告中加入了滑珠图，瞬间让我的图表黯然失色！

ChatGPT输惨了？智力堪比博士的草莓AI大模型强到可怕！

在中国，真正月入1万的有多少？看到同事的收入，我沉默了

维密回归尺度太大？看完AI走秀，我觉得维密还是太保守了！

看到同事用数据透视表，我再也不敢说自己会Excel了！

豆瓣3.9，《花儿与少年》最新季口碑崩盘！这一幕给我留下了深深的阴影……

吐血推荐！4款免费AI视频神器，小白也能0元拍好莱坞大片！

微信又出AI新功能，85%的人不知道这3个隐藏神操作！

学会这3个超简单PS技巧，小白也能做出大神级海报！

《再见爱人4》杨子被骂上热搜！遇到这样的懂王领导，我用 3 招治服他！

下班后花10分钟学会PS，工作到底有多爽？

PPT里的“无效美化”vs“有效美化”

41岁的“普女”吴昕，在小红书杀疯了！

我用AI给特斯拉无人出租做了一组海报，马斯克：立刻马上，打钱！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉