百度为啥不做Sora类的视频生成?李彦宏:10年、20年都可能难以商业化应用

科技   2024-10-22 11:51   北京  

自2022年底,OpenAI发布ChatGPT引爆AI浪潮之后,2024年2月15日,OpenAI又推出了一个标志性产品——强大的文本转视频模型Sora。自那之后,很多国产大模型玩家就开始从文本生成大模型,开始向视频生成大模型进攻。

比如,字节、快手等互联网大厂已经推出了自己的视频生成大模型,尤其是快手可灵推出的时间最早,且功能比较强大。智谱AI、Minimax等大模型创企也推出了智谱清影、Video-01等新视频生成模型。

但是,百度至今却并未推出Sora类的视频生成模型。今年四月,《中国企业家杂志》曾经写过一篇文章叫做《李彦宏还缺个Sora》,文章中说,“现在,他需要一款像Sora、Kimi这样的爆款,再次证明百度在AI浪潮中引领者的地位。”

可惜李彦宏却并不这么认为。在2024年Q3总监会上,李彦宏说:“Sora这种视频生成的投入周期太长,10年、20年都可能拿不到业务收益。无论多么火爆,百度都不去做。”

百度为啥不做视频生成模型?仅仅是因为商业化一句话就解决了吗?我看未必。

第一,做视频生成模型,相当于从0到1重新创业。

很多人可能不太清楚,觉得文字生成和视频生成都是类似的大模型技术,只是数据不一样而已,认为只要替换数据,视频生成模型就做出来了。但是实际上并不是这样。

文字生成模型现在大家都在说多模态能力,其实现在基本都是限制在文字、图片和语音,也就是可以输入和输出文字、图片和语音,但是视频数据很难。所以现在做视频生成模式并不是在大语言模型基础上做的多模态,而是另起炉灶,用扩散模型、生成对抗网络等技术来搞的。

所以,视频生成模型,并不是大语言模型的多模态能力,不是简单的数据替换那么简单……

从0到1重新做一个大模型,那就意味着又是一笔巨量成本。大家都知道,做一个模型最大的成本就是训练和推理所需要的算力成本。据了解,Sora 模型的训练和推理所需的算力需求分别达到了GPT-4的4.5倍和近400倍。

Sora为啥在年初公布之后这么久了还没有开放给用户?就是因为成本太高了。OpenAI CTO Mira在最近的访谈中提到,视频生成的成本问题是 Sora 暂时还不能对公众开放的原因。

第二,视频生成的技术挑战太多,技术不成熟导致需求不高。

虽然说国内外很多大厂都在追视频生成模型,但是真正做出来的产品其能力确实还差点意思。很多人吹牛说什么电影人要被淘汰了,说某个视频生成模型是电影级别的,但是实际上呢?只能生成几秒钟,能有十几秒就已经非常不错了,谁家电影只有十几秒啊?

还有就是视频质量确实难以保证,就算是目前最为火爆的可灵,说实话也就是矬子里拔将军,全靠同行衬托,可灵只是在一众菜鸟玩家之中显得能打而已,但是,要说实战能力,和真人实际拍摄那还差着远呢。

毫不客气地说,所有视频生成模型都还有巨大的提升空间。

光我说不行肯定显得不客观,而最能证明现在的视频模型还不够好的证据就是用户不认可。据SimilarWeb统计,位居全球前列的AI视频生成企业Luma AI网站在9月的总访问量仅为1181万次,环比下跌38.49%;红极一时的Pika在9月总访问量仅110.8万次,环比下跌9.78%。

为啥现在的视频模型做得不够好?因为有很多技术挑战还没有解决。比如,在处理多元素的复杂场景时,视频生成的连贯性和细节控制往往难以达到预期。

第三,最重要的是不赚钱,成本赚不回来,更别提盈利了。

在之前的一篇文章中我回复过一个读者,我说,我们很多大厂以及 AI 六小虎还是非常看重成本控制和商业回报。你看,百度不下场视频模式,最重要的考虑就是商业化的问题,不赚钱所以不想做。

那快手和字节为啥要做视频模型?因为不仅仅要考虑商业化,还要考虑长期的技术壁垒问题,而且,这两家拥有国内最为丰富的视频用户数据,这就是最大的天时优势。既然占据了这个优势,那不放大优势那就很不合理。

对于快手和抖音来说,视频生成几乎是注定的方向。据硅星人报道,对可灵的大力投入,一个重要动力是为了服务于快手的内容生态——2023年,首次在快手发布短视频的创作者就有1.38亿。还有就是服务快手的电商生态。

但是反过来看百度,其实其最大的数据优势还是停留在文字领域,视频和图像数据的积累并不多,因为并没有相关方向的爆款产品和巨量用户。

从成本、盈利和需求三方面,我们能看到百度不做视频生成模型确实有其理由。不过,岛主还想说的一点是,大厂应该是最有“理想”的玩家,也就是说,大厂实际上承担着试错的历史责任。

即便从很多现实考虑不想做视频模型,但是视频生成的确是目前最有想象力的赛道之一,百度作为最早押注AI的大厂,理应更有热情和动力去奔向“星辰大海”。

当然了,我也并不想要道德“绑架”百度。作为一家商业公司,有自己的商业考虑非常正常。只不过百度缺席视频生成赛道,总会让人感觉国内的AI市场少了点什么。

毕竟,李彦宏是那个在巴黎讲述中国AI的那个男人。

数字进化岛
洞察科技产业,透视全球真相。
 最新文章