最顶级的AI视频模型,这次真的来了

财富   2024-12-19 09:00   山东  

在OpenAI正在直播的同时,谷歌正式发布了视频生成模型Veo 2

这属于截胡了。

据官方称,这个新模型在理解现实世界物理、人类运动和表达的细微差别方面表现更出色,从而能够进一步提升视频整体的细节和逼真度。

Veo 2模型具有强大的视频生成能力,它能够生成分辨率最高达4K(4096 x 2160像素)、时长为2分钟的视频片段。与OpenAI的Sora模型相比,其分辨率是Sora模型的4倍,时长更是达到Sora模型的6倍。不过在谷歌的实验性视频创建工具VideoFX里,当前Veo 2模型的分辨率上限为720p,长度为8秒。

DeepMind产品副总裁Eli Collins表示,在接下来的数月中,他们会依据用户的反馈持续对模型进行迭代改进。

如果说中国的可灵、即梦已经基本超越了传说中的Sora,那么Veo 2就是对Sora碾压级的超越。

为什么谷歌能“后来居上”呢?

事实上,谷歌才是那个AI走在前列的,只是在方向性选择的时候,OpenAI大力出奇迹,选择了一条资本大佬们不太敢冒险的烧钱路径。

随着OpenAI把路线跑通,后续跟进的会节约大量的试错成本。

在AI领域,谷歌有两大优势。

一是数据集。作为全球最大的搜索引擎,谷歌积累了海量的数据,在视频方面,YouTube是最大的视频网站,给Veo 2提供了足够多的训练素材(可灵来自快手,即梦来自抖音,都是因为它们的素材充足);

二是算力。和OpenAI不同的是,谷歌自己设计算力卡,然后找台积电代工。一方面不必被黄皮衣扒一层皮(NVIDIA的算力卡是暴利),另一方面能根据自己的算法优化物理架构,从而形成最优。

从趋势来看,AI的门槛越来越低。

尤其是对于中国企业来说,在资本的加持下,跟随者战略往往能收到很好的效果。

但是,我认为AI的最终PK是在大厂之间。AI终将成为类似云计算的通道、底座类服务。像OpenAI这种收会员费的模式不可能持续,当你的月租费收到2000美金的时候,竞争对手搞起了全量免费,那将是降维式打击。


路过银河AI
凝视深渊过久,深渊将回以凝视。天空的深渊,便是天渊。
 最新文章