这一年多来,从只是听说,到去试用各种AI工具,我看到AI的爆发和巨变。而就在我们刚刚适应了GPT-4的节奏,OpenAI又给我们扔了一颗重磅炸弹。
AI大咖们从一大早就发了各种帖子和视频,那我就用通俗的话来解读下。
没有任何预告,没有任何铺垫,OpenAI的新模型o1就这么闪亮登场了。但是当我仔细阅读了OpenAI的发布公告和团队的采访内容,我还是觉得,这个团队里的很多张亚裔面孔,是帮忙OpenAI开发了多牛逼的新模型?
01 重置计数器:一个新时代的开始
OpenAI是这么解释o1这个名字的:
对于复杂推理任务来说,这是一个重要的进展,代表了人工智能能力的新水平。鉴于此,我们将计数器重置为 1,并将这一系列命名为 OpenAI o1。
在采访中,o1团队进一步解释道:"我们正在推出一系列以新名称o1命名的新模型,这是为了强调当你使用o1时,你可能会感觉到与之前的模型,比如GPT-4,有所不同。"
各位,你们听出来了吗?这不是简单的版本更新,这是一个全新系列的开始!OpenAI认为,o1代表了AI能力的一个新高度,值得重新开始计数。
想想看,从GPT-3到GPT-4,我们见证了AI能力的飞跃。而现在,OpenAI告诉我们,o1比GPT-4的进步还要大。这意味着什么?**意味着我们可能真的站在了AGI的门槛上。
02 数据会说话:o1的惊人表现
我知道,很多人可能会说,这不过是商业炒作而已。但是,朋友们,数据是不会骗人的。
在AIME 2024这个高水平的数学竞赛中,GPT-4的准确率是13.4%,而o1预览版达到了56.7%,正式版更是高达83.3%。
代码竞赛?GPT-4只有11.0%的准确率,o1预览版62%,正式版更是达到了89%。
最让我震惊的是,在测试博士级科学问题的GPQA Diamond基准上,o1达到了78%的准确率,“远超人类专家的69.7%”。
这是什么概念?这意味着,在某些高度专业的领域,o1已经超越了人类顶尖专家的水平。
03 技术突破:慢思考的AI
o1的核心技术突破在于Self-play RL和推理能力。通过这些技术,o1学会了一种我们人类最引以为傲的能力:慢思考能力。
有听过,慢就是快嘛,事缓则圆嘛,这并非儒家绝学,而是AI智能开始具备的能力。
以前的AI模型,包括GPT-4,主要是在模仿我们的快思考。而o1,它学会了慢思考。所以,不是快问快答,你觉得AI厉害。它现在像个哲人一般,思考一会儿,才给答案。
o1团队在采访中解释道:"推理是将思考时间转化为更好结果的能力。如果你想解决一个复杂的谜题,或者你想写一个非常好的商业计划,你想写一部小说,你可能会想要思考一段时间。你思考得越多,结果就越好。"
它能够:
识别和纠正自己的错误
将复杂问题分解为简单步骤
在一种方法不行时尝试其他方法
对自己的结论进行质疑和反思
这不正是我们人类解决复杂问题的方式吗?
一位AI大咖用一个很绕脑的问题去测试o1,给大家看看,我觉得很有意思:
还有很多人又去验证了这个之前AI总是错的题目,这次o1总算答对了!
04 使用建议:简单直接更有效
有意思的是,对于o1,OpenAI给出的使用建议与以往大不相同。他们建议:
保持提示简单直接
避免思路链提示
使用分隔符来提高清晰度
限制附加上下文
这意味着什么?意味着o1已经强大到不需要我们手把手教它怎么思考了。它自己就知道该怎么做。
o1团队补充道:"o1是一个推理模型,所以在回答问题之前会思考更多。当你使用0 1时,你可能会感觉到与之前的模型有所不同。"
现在的o1,思考时间最长也就一分钟左右。但是,想象一下,如果未来的AI可以像人类科学家一样,花上几天、几周,甚至几个月来思考一个问题,会发生什么?
也许,那时的AI真的能够证明数学定理,研发癌症药物,探索宇宙奥秘。而这一切,可能比我们想象的要来得更快。
o1团队在采访中透露,他们在训练过程中经历了一个"啊哈"时刻:"我们可以看到它开始质疑自己并进行非常有趣的反思。那是我感到哇,我们发现了一些不同的东西。这将是新的东西。"
05 我们该何去何从?
我没有充值ChatGPT Plus,我想我目前也无需像其他AI大咖,去用姜萍的奥数题测试o1。但是面对如此强大的AI,我们这些普通人未来该怎么办?
老实说,我也不知道。但我知道,我们不能坐以待毙。就像我之前决定学习AI一样,我们需要不断学习,不断适应这个快速变化的世界。
也许,我们无法超越AI,但我们可以学会与AI共存,利用AI来提升自己的能力。毕竟,即使在AI时代,人类的创造力、同理心和判断力仍然是无可替代的。
各位80后、90后的朋友们,我们或许不是这个时代的弄潮儿,但我们绝对不是被淘汰的一代。
如果你觉得,我分享的内容是你也可以尝试的新机会,Conny姐已经整理好了这几个月来我的【十大主题AI亲测体验知识合集】。
如果需要,扫下图或 +ConnykyAI 来联络我哦。Conny姐公众号粉丝已破10000+🥳 不间断更新AI新认知,记得关注我噢~
********
内容福利包括:
AI工具合集 5堂AI大咖直播分享 31节AI实操视频课 15万字AI搞钱宝典(五大AI实操训练营课程文档) 3天AI破局俱乐部社群体验卡(知识星球APP)
关于GPT 和 Kimi:
GPT提示词的快速入门指南:4个基本法则2个实用技巧,帮你10倍提效! 解锁职场与自媒体新招:AI自动生成提示词,效率翻倍不是梦!领取KimiChat 12大官方秘籍,助力内容创作! 速查攻略!Kimi内置提示词究竟藏在哪里?别捉急,保姆级指南带你马上找!
关于Midjourney:
相当好用的Midjourney官配提词器,全中文操作,自动出英文提示词,点点鼠标就搞定! 我太牛逼了,Kimi+Midjourney 自学半个多月,就能出这么天仙般的图文小故事(上) (接上集爆文)我太牛逼了,自学Kimi +Midjourney 半个多月,就能出这么天仙般的图文小故事 李蠕蠕变装视频又爆了,粘土滤镜疯狂传播,变脸变装心理背后的亿万商机! 快速上手:用Midjourney打造专属家族化形象IP图的5个专业技巧! 仅需这行提示词,解锁你的专属Midjourney完整动画分镜,角色一致性从未如此简单!
关于AI视频:
支持国内公司的免费视频工具PixVerse:简单3步文生视频,图生视频,还能视频变脸! 广告大片导演的AI创作秘籍:Midjourney、Runway、剪映,一下午速成你的AI电影作品! 文生视频亲测:“中国风”哪家强?可灵AI、LumaAI,艺映AI,即梦Dreamina? 中国风美女视频,用奇域AI+可灵AI,审美太在线!
关于做公众号: