横空出世的快手可灵,能为媒体带来什么

文摘   科技   2024-07-20 14:47   江苏  

   


这是小新智媒的第266篇文章



01

火爆的照片动起来

来自初出茅庐的快手可灵


年初Sora的惊艳出世,使得2024一度被视为文生视频元年。令人意外的是,Sora并未趁热打铁,而是在虚晃一枪后便即消失无踪。带头大哥神隐之际,Runway,Pika等一众追随者虽一直在追赶进步,但并未出现重大突破,尤其在国内使用受限的情况下,更是成为了小众工具。眼看文生视频热度将散,变数再次发生。年中之际,一个初出茅庐的大模型以惊艳的效果和近乎为零的使用门槛,扛起了文生视频的大旗,甚至在诸多方面实现了对Sora的超越,更令人意外的是,此次缔造奇迹的是一支组建仅有数月的国内团队,来自快手科技公司。





6月起,以照片动起来和经典影视剧情突变为代表,诸多令人惊奇又充满魔性的视频和动图席卷了社交媒体。如蒙娜丽莎双手戴起墨镜,容嬷嬷喂紫薇吃美食,唐僧和女儿国王亲密互动等,清晰自然的视觉表现,让网友大呼忘记原版。与以往费时费力的视频编辑和操作繁琐的AI换脸不同,只需使用快影app或登录可灵网页,注册账号即可使用如此强大的视频生成功能,真正的零门槛零费用。只是简单体验的话,可灵提供了众多热门模版,上传照片即可DIY出自己的网红同款视频,上手极易,可玩性极强,完美契合爆款工具的条件。但如果仅把可灵当成个一招鲜的小工具,那就是买椟还珠了,可灵的能力远不止于让影视剧照里的人物低头吃面,深入运用的话,它具备的先进文生视频和图生视频能力,足以令熟悉和不熟悉AI领域的用户都感到震惊。

以下是由可灵生成的两个典型作品,《山海奇镜之劈波斩浪》和《假期的打开方式》,分别为奇幻和写实两种风格,可以实际感受一下可灵模型的强大。尤其是《假期的打开方式》这一作品,对普通用户来说,完全可以以假乱真,即使已提前知道该视频为AI生成,除了从喝啤酒这一场景能看出细微的穿模外,已很难区分同现实拍摄视频的区别。



02

可灵vs Sora

视频生成领域形势再变


在日前的2024世界人工智能大会上,快手高级副总裁盖坤透露,目前已有超过50万用户申请视频生成大模型可灵的内测资格,超过30万用户正在使用,视频生成数量达700万。这对发布仅有一个月的新模型来说,在无积累无造势的情况下,纯靠用户口碑取得这个远超Pika、Luma等竞品的成绩,足以证明可灵的优秀。目前媒体已有较多可灵和Sora,以及其它视频模型的直接对比。

与Sora对比,可灵最明显的优势显然是它是直接开放测试的产品级应用,而Sora目前为止仍是预发布、能看到的只有纯 Demo 合集。此外利用延长生成,目前可灵已支持生成最长 2 分钟的视频,也超过了Sora的60秒表现。实际效果的对比上,因Sora仅有Demo,评测多采用硬碰硬竞争的方式,即用可灵生成Sora的同一场景进行公平竞争。

参考视频:

1.8分钟多场景对比

2. 五大经典场景对比

3. 气球人对比



从多篇评测对比综合看来,目前在环境丰富度、场景适配性、提示词契合度上,Sora对比可灵仍有一定优势,但已无代差。物理世界真实性、场景连贯度上,最新版本的可灵已经实现了对Sora的反超。考虑到Sora的官方展示Demo必然经过OPENAI精心挑选,而可灵的作品仅为普通用户测试生成,可灵比之Sora的真实差距,可能会更小。另一个极为重要的指标资源消耗上,目前可灵生产速度尚属令人满意,日常使用可以接受的范畴,这在已发布的AI视频生成领域,已经是一枝独秀的表现。Sora则一直有速度较慢吃资源的传言,当然这一说法并未得到证实,还无法断言可灵在效率上的领先。保守来说,可灵目前在视频生成领域,全球范围内都处于较为领先的梯队,中国版Sora的称号是当之无愧的。





令人更加振奋的是,可灵的开发周期极短,快手相关板块负责人,甚至是在年初受到Sora的启示后,才确定技术方向并组建视频生成团队的。而国产大模型飞跃的一大步出自快手,则更加令人诧异,多数用户对快手的印象还停留在“家人们求关注”和“老铁点个赞”等俗套视频上,去年以来,AI的舞台上百度、阿里、腾讯、字节、月之暗面各显神通,快手几乎无人关注,多名业内人士,也对快手的突然崛起表示了惊奇。

可灵作为先驱者能走多远,充满不确定性,但它的崛起,最大的意义是把OPENAI拉下了神坛,证明了Sora的技术架构路线是可以被复现的,甚至能够利用庞大的数据优势后来居上。同时也展示了国内AI的实力和潜力超出预期,与国外的差距并非是巨大或是越拉越大,美国的技术封锁,并不能阻止国内各行各业被AI赋能改变的历史趋势。

 

03

我们离“剧本生成电影”还有多远


可灵的横空出世,固然令人振奋,但在“输入剧本,生成电影”的征程上,只算跨过了一段微不足道的距离。视频生成领域目前仍是猎奇和技术展示为主,实用性很低。在单个场景展示以外,目前也仅有部分公司和用户,尝试利用AI工具生产简单的短剧和MV作品。如上文提到过的可灵官方和民间团队合作出品的短剧《山海奇镜之劈波斩浪》,先是要使用Midjourney,多次生成并挑选高质量的图片,再利用可灵的图生视频调试生成并挑选视频素材,AI音频工具完成背景音乐,最后采取常规的剪辑软件进行剪辑制作。可灵只是诸多繁琐操作中的一环,即便是可灵具备文生视频功能,也因为前后连续性问题无法直接运用。而众多AI制作的MV作品,实现上更为复杂,先要运用ChatGPT或是文心、kimi等模型,制作文案和提示词,再综合运用多种文生图片和图生视频模型制作视频素材,配音则是又一种模型,最后再采取传统的剪映、Final Cut等合成成品。





目前来看,一个模型包打天下目前仍是不切实际的幻想,用“万国造”的大模型武器去实战,是很长一段时间内唯一可行的做法,在大模型应用上,我们仍将长期处于刀耕火种的原始阶段。


04

面对AIGC的新机遇

新闻媒体应如何把握


国产大模型在视频生成领域突然崛起,高质量的视频智能生成从国外的概念一步走向了国内的落地,为国内新闻媒体提供了崭新的机遇。最直接的是降本增效的红利,在短视频时代,即便是传统媒体,也都在视频的拍摄和剪辑制作上投入了巨大的人力财力,借助可灵等视频模型,媒体有望在增强视频质量,提升制作效率和节约资金成本上迈出实质性的步伐。更重要的是,借助模型强大的生成能力,模拟世界或许差之甚远,但媒体用以模拟新闻事件还是切实可行的,未来可灵等模型将进一步丰富新闻作品的形式,在提高传播度、吸引力和互动性上大有可为。此外,低投入高效率的视频生成,也为未来千人千面的个性化视频新闻制作和推送,提供了可能。





在仰望美国AI飞速发展的第一阶段,对国内传统媒体而言,使用国外模型不现实,国内模型又能力有限,观望成了不得不选的态度。而在国产模型崛起,从追随者到竞争者的第二阶段,传统媒体对AI的发展,已没有了观望的理由,加速引入AI生产工具,培养了解AI善用AI的媒体人才队伍,已成为必然的选择。但媒体也要清晰地认识到,AIGC从炫技到实用,仍是一个极为缓慢的过程,不能幻想短期内一个模型就能为视频制作带来翻天覆地的变化,媒体对AI的引入和运用,战略上要急迫,战术上却仍要保持足够的耐心。



小新智媒©出品
作者 | 孙光旭
编辑 | 李诗诗



        点击以下 关键字 查看往期精彩内容


当下最强人工智能GPT-4o,媒体人最看重这些新优势
从虚拟主播到数字记者,媒体数字人既要用得好还要管得住
真相之光与流量之影:主流媒体如何破除数字迷雾共建清朗网络空间





 点击“阅读原文”浏览今日「新华日报」

小新智媒
关注传媒、技术发展趋势