在OpenAI正在直播的同时,谷歌正式发布了视频生成模型Veo 2。
这属于截胡了。
据官方称,这个新模型在理解现实世界物理、人类运动和表达的细微差别方面表现更出色,从而能够进一步提升视频整体的细节和逼真度。
Veo 2模型具有强大的视频生成能力,它能够生成分辨率最高达4K(4096 x 2160像素)、时长为2分钟的视频片段。与OpenAI的Sora模型相比,其分辨率是Sora模型的4倍,时长更是达到Sora模型的6倍。不过在谷歌的实验性视频创建工具VideoFX里,当前Veo 2模型的分辨率上限为720p,长度为8秒。
DeepMind产品副总裁Eli Collins表示,在接下来的数月中,他们会依据用户的反馈持续对模型进行迭代改进。
如果说中国的可灵、即梦已经基本超越了传说中的Sora,那么Veo 2就是对Sora碾压级的超越。
为什么谷歌能“后来居上”呢?
事实上,谷歌才是那个AI走在前列的,只是在方向性选择的时候,OpenAI大力出奇迹,选择了一条资本大佬们不太敢冒险的烧钱路径。
随着OpenAI把路线跑通,后续跟进的会节约大量的试错成本。
在AI领域,谷歌有两大优势。
一是数据集。作为全球最大的搜索引擎,谷歌积累了海量的数据,在视频方面,YouTube是最大的视频网站,给Veo 2提供了足够多的训练素材(可灵来自快手,即梦来自抖音,都是因为它们的素材充足);
二是算力。和OpenAI不同的是,谷歌自己设计算力卡,然后找台积电代工。一方面不必被黄皮衣扒一层皮(NVIDIA的算力卡是暴利),另一方面能根据自己的算法优化物理架构,从而形成最优。
从趋势来看,AI的门槛越来越低。
尤其是对于中国企业来说,在资本的加持下,跟随者战略往往能收到很好的效果。
但是,我认为AI的最终PK是在大厂之间。AI终将成为类似云计算的通道、底座类服务。像OpenAI这种收会员费的模式不可能持续,当你的月租费收到2000美金的时候,竞争对手搞起了全量免费,那将是降维式打击。