横空出世的快手可灵，能为媒体带来什么

文摘科技 2024-07-20 14:47 江苏

这是小新智媒的第266篇文章

火爆的照片动起来

来自初出茅庐的快手可灵

年初Sora的惊艳出世，使得2024一度被视为文生视频元年。令人意外的是，Sora并未趁热打铁，而是在虚晃一枪后便即消失无踪。带头大哥神隐之际，Runway，Pika等一众追随者虽一直在追赶进步，但并未出现重大突破，尤其在国内使用受限的情况下，更是成为了小众工具。眼看文生视频热度将散，变数再次发生。年中之际，一个初出茅庐的大模型以惊艳的效果和近乎为零的使用门槛，扛起了文生视频的大旗，甚至在诸多方面实现了对Sora的超越，更令人意外的是，此次缔造奇迹的是一支组建仅有数月的国内团队，来自快手科技公司。

6月起，以照片动起来和经典影视剧情突变为代表，诸多令人惊奇又充满魔性的视频和动图席卷了社交媒体。如蒙娜丽莎双手戴起墨镜，容嬷嬷喂紫薇吃美食，唐僧和女儿国王亲密互动等，清晰自然的视觉表现，让网友大呼忘记原版。与以往费时费力的视频编辑和操作繁琐的AI换脸不同，只需使用快影app或登录可灵网页，注册账号即可使用如此强大的视频生成功能，真正的零门槛零费用。只是简单体验的话，可灵提供了众多热门模版，上传照片即可DIY出自己的网红同款视频，上手极易，可玩性极强，完美契合爆款工具的条件。但如果仅把可灵当成个一招鲜的小工具，那就是买椟还珠了，可灵的能力远不止于让影视剧照里的人物低头吃面，深入运用的话，它具备的先进文生视频和图生视频能力，足以令熟悉和不熟悉AI领域的用户都感到震惊。

以下是由可灵生成的两个典型作品，《山海奇镜之劈波斩浪》和《假期的打开方式》，分别为奇幻和写实两种风格，可以实际感受一下可灵模型的强大。尤其是《假期的打开方式》这一作品，对普通用户来说，完全可以以假乱真，即使已提前知道该视频为AI生成，除了从喝啤酒这一场景能看出细微的穿模外，已很难区分同现实拍摄视频的区别。

可灵vs Sora

视频生成领域形势再变

在日前的2024世界人工智能大会上，快手高级副总裁盖坤透露，目前已有超过50万用户申请视频生成大模型可灵的内测资格，超过30万用户正在使用，视频生成数量达700万。这对发布仅有一个月的新模型来说，在无积累无造势的情况下，纯靠用户口碑取得这个远超Pika、Luma等竞品的成绩，足以证明可灵的优秀。目前媒体已有较多可灵和Sora，以及其它视频模型的直接对比。

与Sora对比，可灵最明显的优势显然是它是直接开放测试的产品级应用，而Sora目前为止仍是预发布、能看到的只有纯 Demo 合集。此外利用延长生成，目前可灵已支持生成最长 2 分钟的视频，也超过了Sora的60秒表现。实际效果的对比上，因Sora仅有Demo，评测多采用硬碰硬竞争的方式，即用可灵生成Sora的同一场景进行公平竞争。

参考视频：

1.8分钟多场景对比

2. 五大经典场景对比

3. 气球人对比

从多篇评测对比综合看来，目前在环境丰富度、场景适配性、提示词契合度上，Sora对比可灵仍有一定优势，但已无代差。物理世界真实性、场景连贯度上，最新版本的可灵已经实现了对Sora的反超。考虑到Sora的官方展示Demo必然经过OPENAI精心挑选，而可灵的作品仅为普通用户测试生成，可灵比之Sora的真实差距，可能会更小。另一个极为重要的指标资源消耗上，目前可灵生产速度尚属令人满意，日常使用可以接受的范畴，这在已发布的AI视频生成领域，已经是一枝独秀的表现。Sora则一直有速度较慢吃资源的传言，当然这一说法并未得到证实，还无法断言可灵在效率上的领先。保守来说，可灵目前在视频生成领域，全球范围内都处于较为领先的梯队，中国版Sora的称号是当之无愧的。

令人更加振奋的是，可灵的开发周期极短，快手相关板块负责人，甚至是在年初受到Sora的启示后，才确定技术方向并组建视频生成团队的。而国产大模型飞跃的一大步出自快手，则更加令人诧异，多数用户对快手的印象还停留在“家人们求关注”和“老铁点个赞”等俗套视频上，去年以来，AI的舞台上百度、阿里、腾讯、字节、月之暗面各显神通，快手几乎无人关注，多名业内人士，也对快手的突然崛起表示了惊奇。

可灵作为先驱者能走多远，充满不确定性，但它的崛起，最大的意义是把OPENAI拉下了神坛，证明了Sora的技术架构路线是可以被复现的，甚至能够利用庞大的数据优势后来居上。同时也展示了国内AI的实力和潜力超出预期，与国外的差距并非是巨大或是越拉越大，美国的技术封锁，并不能阻止国内各行各业被AI赋能改变的历史趋势。

我们离“剧本生成电影”还有多远

可灵的横空出世，固然令人振奋，但在“输入剧本，生成电影”的征程上，只算跨过了一段微不足道的距离。视频生成领域目前仍是猎奇和技术展示为主，实用性很低。在单个场景展示以外，目前也仅有部分公司和用户，尝试利用AI工具生产简单的短剧和MV作品。如上文提到过的可灵官方和民间团队合作出品的短剧《山海奇镜之劈波斩浪》，先是要使用Midjourney，多次生成并挑选高质量的图片，再利用可灵的图生视频调试生成并挑选视频素材，AI音频工具完成背景音乐，最后采取常规的剪辑软件进行剪辑制作。可灵只是诸多繁琐操作中的一环，即便是可灵具备文生视频功能，也因为前后连续性问题无法直接运用。而众多AI制作的MV作品，实现上更为复杂，先要运用ChatGPT或是文心、kimi等模型，制作文案和提示词，再综合运用多种文生图片和图生视频模型制作视频素材，配音则是又一种模型，最后再采取传统的剪映、Final Cut等合成成品。

目前来看，一个模型包打天下目前仍是不切实际的幻想，用“万国造”的大模型武器去实战，是很长一段时间内唯一可行的做法，在大模型应用上，我们仍将长期处于刀耕火种的原始阶段。

面对AIGC的新机遇

新闻媒体应如何把握

国产大模型在视频生成领域突然崛起，高质量的视频智能生成从国外的概念一步走向了国内的落地，为国内新闻媒体提供了崭新的机遇。最直接的是降本增效的红利，在短视频时代，即便是传统媒体，也都在视频的拍摄和剪辑制作上投入了巨大的人力财力，借助可灵等视频模型，媒体有望在增强视频质量，提升制作效率和节约资金成本上迈出实质性的步伐。更重要的是，借助模型强大的生成能力，模拟世界或许差之甚远，但媒体用以模拟新闻事件还是切实可行的，未来可灵等模型将进一步丰富新闻作品的形式，在提高传播度、吸引力和互动性上大有可为。此外，低投入高效率的视频生成，也为未来千人千面的个性化视频新闻制作和推送，提供了可能。

在仰望美国AI飞速发展的第一阶段，对国内传统媒体而言，使用国外模型不现实，国内模型又能力有限，观望成了不得不选的态度。而在国产模型崛起，从追随者到竞争者的第二阶段，传统媒体对AI的发展，已没有了观望的理由，加速引入AI生产工具，培养了解AI善用AI的媒体人才队伍，已成为必然的选择。但媒体也要清晰地认识到，AIGC从炫技到实用，仍是一个极为缓慢的过程，不能幻想短期内一个模型就能为视频制作带来翻天覆地的变化，媒体对AI的引入和运用，战略上要急迫，战术上却仍要保持足够的耐心。

小新智媒©出品

作者 | 孙光旭

编辑 | 李诗诗

点击以下关键字查看往期精彩内容

当下最强人工智能GPT-4o，媒体人最看重这些新优势

从虚拟主播到数字记者，媒体数字人既要用得好还要管得住

真相之光与流量之影：主流媒体如何破除数字迷雾共建清朗网络空间

点击“阅读原文”，浏览今日「新华日报」

小新智媒

关注传媒、技术发展趋势