AI新突破:“慢就是快”,OpenAI的o1模型懂思考了,我们该怎么办?

文摘   科技   2024-09-13 19:38   上海  

这一年多来,从只是听说,到去试用各种AI工具,我看到AI的爆发和巨变。而就在我们刚刚适应了GPT-4的节奏,OpenAI又给我们扔了一颗重磅炸弹。

AI大咖们从一大早就发了各种帖子和视频,那我就用通俗的话来解读下。

没有任何预告,没有任何铺垫,OpenAI的新模型o1就这么闪亮登场了。但是当我仔细阅读了OpenAI的发布公告和团队的采访内容,我还是觉得,这个团队里的很多张亚裔面孔,是帮忙OpenAI开发了多牛逼的新模型?

   01 重置计数器:一个新时代的开始

OpenAI是这么解释o1这个名字的:

对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1。

在采访中,o1团队进一步解释道:"我们正在推出一系列以新名称o1命名的新模型,这是为了强调当你使用o1时,你可能会感觉到与之前的模型,比如GPT-4,有所不同。"

各位,你们听出来了吗?这不是简单的版本更新,这是一个全新系列的开始!OpenAI认为,o1代表了AI能力的一个新高度,值得重新开始计数。

想想看,从GPT-3到GPT-4,我们见证了AI能力的飞跃。而现在,OpenAI告诉我们,o1比GPT-4的进步还要大。这意味着什么?**意味着我们可能真的站在了AGI的门槛上。

   02 数据会说话:o1的惊人表现

我知道,很多人可能会说,这不过是商业炒作而已。但是,朋友们,数据是不会骗人的。

在AIME 2024这个高水平的数学竞赛中,GPT-4的准确率是13.4%,而o1预览版达到了56.7%,正式版更是高达83.3%。

代码竞赛?GPT-4只有11.0%的准确率,o1预览版62%,正式版更是达到了89%。

最让我震惊的是,在测试博士级科学问题的GPQA Diamond基准上,o1达到了78%的准确率,“远超人类专家的69.7%”。

这是什么概念?这意味着,在某些高度专业的领域,o1已经超越了人类顶尖专家的水平。

   03 技术突破:慢思考的AI

o1的核心技术突破在于Self-play RL和推理能力。通过这些技术,o1学会了一种我们人类最引以为傲的能力:慢思考能力。

有听过,慢就是快嘛,事缓则圆嘛,这并非儒家绝学,而是AI智能开始具备的能力。

以前的AI模型,包括GPT-4,主要是在模仿我们的快思考。而o1,它学会了慢思考。所以,不是快问快答,你觉得AI厉害。它现在像个哲人一般,思考一会儿,才给答案。

o1团队在采访中解释道:"推理是将思考时间转化为更好结果的能力。如果你想解决一个复杂的谜题,或者你想写一个非常好的商业计划,你想写一部小说,你可能会想要思考一段时间。你思考得越多,结果就越好。"

它能够:

  1. 识别和纠正自己的错误

  2. 将复杂问题分解为简单步骤

  3. 在一种方法不行时尝试其他方法

  4. 对自己的结论进行质疑和反思


这不正是我们人类解决复杂问题的方式吗?

一位AI大咖用一个很绕脑的问题去测试o1,给大家看看,我觉得很有意思:

“农夫需要把狼、羊和白菜都带过河,但每次只能带一样物品,而且狼和羊不能单独相处,羊和白菜也不能单独相处,问农夫该如何过河。”

还有很多人又去验证了这个之前AI总是错的题目,这次o1总算答对了!

   04 使用建议:简单直接更有效

有意思的是,对于o1,OpenAI给出的使用建议与以往大不相同。他们建议:

  1. 保持提示简单直接

  2. 避免思路链提示

  3. 使用分隔符来提高清晰度

  4. 限制附加上下文

这意味着什么?意味着o1已经强大到不需要我们手把手教它怎么思考了。它自己就知道该怎么做。

o1团队补充道:"o1是一个推理模型,所以在回答问题之前会思考更多。当你使用0 1时,你可能会感觉到与之前的模型有所不同。"

现在的o1,思考时间最长也就一分钟左右。但是,想象一下,如果未来的AI可以像人类科学家一样,花上几天、几周,甚至几个月来思考一个问题,会发生什么?

也许,那时的AI真的能够证明数学定理,研发癌症药物,探索宇宙奥秘。而这一切,可能比我们想象的要来得更快。


o1团队在采访中透露,他们在训练过程中经历了一个"啊哈"时刻:"我们可以看到它开始质疑自己并进行非常有趣的反思。那是我感到哇,我们发现了一些不同的东西。这将是新的东西。"

   05 我们该何去何从?

我没有充值ChatGPT Plus,我想我目前也无需像其他AI大咖,去用姜萍的奥数题测试o1。但是面对如此强大的AI,我们这些普通人未来该怎么办?

老实说,我也不知道。但我知道,我们不能坐以待毙。就像我之前决定学习AI一样,我们需要不断学习,不断适应这个快速变化的世界。

也许,我们无法超越AI,但我们可以学会与AI共存,利用AI来提升自己的能力。毕竟,即使在AI时代,人类的创造力、同理心和判断力仍然是无可替代的。

各位80后、90后的朋友们,我们或许不是这个时代的弄潮儿,但我们绝对不是被淘汰的一代。


********

如果你觉得,我分享的内容是你也可以尝试的新机会Conny姐已经整理好了这几个月来我的大主题AI亲测体验知识合集】。

如果需要,扫下图或 +ConnykyAI 来联络我哦。Conny姐公众号粉丝已破10000+🥳 不间断更新AI新认知,记得关注我噢~

********

跟我一样80后的你,想了解更多“快速入门AI的信息”,跟Conny姐起学习AI,坚持复利,可以直接扫下图二维码参与【3天的AI破局体验营】

内容福利包括:

  • AI工具合集
  • 5堂AI大咖直播分享
  • 31节AI实操视频课
  • 15万字AI搞钱宝典(五大AI实操训练营课程文档)
  • 3天AI破局俱乐部社群体验卡(知识星球APP)

“我都可以,你又有什么不可能呢?”
#<AI入门亲测指南>精彩链接#

关于GPT 和 Kimi:

  1. GPT提示词的快速入门指南:4个基本法则2个实用技巧,帮你10倍提效!
  2. 解锁职场与自媒体新招:AI自动生成提示词,效率翻倍不是梦!领取KimiChat 12大官方秘籍,助力内容创作!
  3. 速查攻略!Kimi内置提示词究竟藏在哪里?别捉急,保姆级指南带你马上找!

关于Midjourney:

  1. 相当好用的Midjourney官配提词器,全中文操作,自动出英文提示词,点点鼠标就搞定!
  2. 我太牛逼了,Kimi+Midjourney 自学半个多月,就能出这么天仙般的图文小故事(上)
  3. (接上集爆文)我太牛逼了,自学Kimi +Midjourney 半个多月,就能出这么天仙般的图文小故事
  4. 李蠕蠕变装视频又爆了,粘土滤镜疯狂传播,变脸变装心理背后的亿万商机!
  5. 快速上手:用Midjourney打造专属家族化形象IP图的5个专业技巧!
  6. 仅需这行提示词,解锁你的专属Midjourney完整动画分镜,角色一致性从未如此简单!


关于AI视频:

  1. 支持国内公司的免费视频工具PixVerse:简单3步文生视频,图生视频,还能视频变脸!
  2. 广告大片导演的AI创作秘籍:Midjourney、Runway、剪映,一下午速成你的AI电影作品!
  3. 文生视频亲测:“中国风”哪家强?可灵AI、LumaAI,艺映AI,即梦Dreamina?
  4. 中国风美女视频,用奇域AI+可灵AI,审美太在线!


关于做公众号:

  1. 我是真牛逼了:<复盘>做AI公众号1个月,一篇文1000+关注,我干了什么?一切从BRTR开始!
  2. 做公众号增粉秘籍:一月涨粉2000+!Kimi+Midjourney,打造爆款原创图文!
  3. 做AI公众号4个月亲测体验:写100篇文,送你【10句忠告】,话很难听,但是事实!

80后的AIGC时代
📚 分享AI工具亲测体验,跟Conny姐一起学AI,快速自学入门,坚持复利。 🔍 AI副业定位,如何+专业经验 or 兴趣爱好🔗ConnykyAI 🎁 我都可以,你又有什么不可能呢?
 最新文章