8月8号的时候,国外社交媒体上出现一个账号名为🍓🍓🍓,十分活跃并且与Sam Altman发的“草莓”图片频频互动,很明显是一次内部爆料的营销活动。🍓🍓🍓发的文章较为抽象,其中不乏对其他模型的点评、暗示🍓项目即是Q* 项目、透露8月13号OpenAI即将发布的新模型、GPT5/Next的训练进度、声称AGI进入Level 2,我们可以从中推测出OpenAI在经历人事地震之后的新的进展。
爆料信息和推测:
1. 8月8号在LMSYS Chatbot Arena(最流行的大模型人工评分平台)上出现了一个新的模型sus-column-r,该博主暗示该模型为OpenAI的Q* 或者Strawberry项目,经过我们测试后发现,该模型对于多步推理和分析的能力提升很大,符合之前对于Strawberry项目的预期,同时该模型在简单问题上会出现一些低级错误,结合爆料内容,可以推测Strawberry项目是对模型进行微调,提升模型的任务规划和推理能力,对模型的大小没有要求,sus-column-r应该是一个小规模参数的模型。
2. 该博主的Github仓库中透露一个模型名为gpt-4o-large-2024-08-13的模型,后面日期代表模型的发布日期,即8月13号。OpenAI的Chat模型还没有采用过Large后缀,鉴于4o的参数量是小于GPT4的,我们推测该Large模型参数大小不会低于GPT4。
3. 该博主发布了大量AI生成的包含草莓的图片,可能在暗示其文生图能力也会有所提升,有几率直接集成到其API中。
4. GPT 5/Next的进展:该博主称GPT 5/Next的红队测试和后期训练已经完成,其能力提升是代际的,草莓项目加上规模提升将在一夜之间解决世界问题,现在未发布的主要原因还是安全问题。
5. Sora:该博主也强调了Sora的推理是十分昂贵的,同时保证它的安全性极其困难,所以一直没有向公众开放。符合我们之前对DiT类型的视频生成模型推理成本的计算。AI模型系列报告:从世界模型看算力需求变化
总的来看,OpenAI这次很快推出新的模型和名声在外很久的Q* 项目以及透露了其下一代模型的进展与效果,主要还是为了对冲其人事大地震和竞争对手已经接近甚至超过自己的影响。这次营销也十分激进,虽然宣传效果很好,但是大大拉高了用户对其新模型的期待,属于“ALL IN”式营销,如果模型效果miss了,OpenAI将面临一系列严峻的挑战和负面影响。