彭博社专访Runway CEO:现场讲解AI视频技术,并手把手教学如何用AI秒生精美视频

文摘   2024-10-14 08:00   上海  

(关注公众号并设为🌟标,获取最新人工智能资讯和产品)

全文7,000 字,阅读约需15分钟

最近,Runway 公司的首席执行官兼联合创始人 Cristóbal Valenzuela 在洛杉矶的 Bloomberg Screentime 活动上接受了彭博社的专访,展示了他们公司在 AI 视频生成技术方面的最新突破。

Valenzuela 详细介绍了 Runway 的核心产品——"文本生成视频"技术。这项技术允许用户通过简单的文本提示来创建视频内容。对于那些从未尝试过 AI 视频生成的人来说,这个过程可能看起来神奇:只需输入一段描述性文本,AI 模型就能解读并生成相应的视频片段,长度可以根据需求调整。

随着 Runway 刚刚完成新一轮融资,业界对 AI 在电影制作中的未来应用充满期待。有人甚至大胆预测,在不久的将来,我们可能会看到第一部由 AI 主导创作的电影——也许有 90% 甚至 100% 的内容是由 AI 生成的——不仅在票房上取得成功,还有可能问鼎奥斯卡奖。

这一前景引发了一个引人深思的问题:在未来几年里,AI 将如何改变电影产业的格局,使之每个人都变成超级个体?

演讲文稿

主持人:  请欢迎 Runway 的首席执行官兼联合创始人 Cristóbal Valenzuela 上台。

一、演讲部分

大家好,我是Cristóbal Valenzuela ,刚刚你们看到的视频全部都是由 Runway 生成的。我想带大家深入了解一下这些视频是如何制作的。我相信这里的许多人都看过 AVI 格式的视频,但可能有些人从未亲自生成过视频。因此,我希望能够为大家提供一些上下文,解释今天如何使用 Runway 实际生成视频。我会引导大家了解使用 AI 制作视频的基本步骤,而最常见和最著名的方式就是“文本生成视频”。它是通过非常简单的方法生成视频,基本上你只需要输入一段文本提示。我相信你们有些人可能已经使用过需要文本提示的模型,我们的模型会解读这些文本提示,并生成任何长度的视频。我要展示的第一个视频,就是基于文本生成视频的例子。在这个案例中,我输入了一个提示,生成的视频完全根据我的提示来展示。比如说人脸特写、动物的特定镜头,我可以玩转电影风格、不同的角色,甚至可以创建飞越天空、穿越云层等无限且不可能的镜头。

这些都是高画质的视频,生成时间大约是14到15秒,速度非常快,并且未来可能会更快。模型在表达情感和捕捉真实的动作,比如飞翔的山羊等方面做得非常好,所有这些都是由文本提示生成的。然而,电影制作的核心其实是让你产生情感共鸣,让你与故事产生联系,感受到故事的情感冲击。有时候,仅仅依靠文本提示是不够的,我个人认为文本提示不会是长期的解决方案,我不认为你能用文本制作电影。因此,我们在开发更多的控制工具,让你在制作视频时拥有比单纯文本提示更多的选择。接下来我想展示一些除了文本提示之外,你还能使用的其他控制工具来使用 Runway 和 AI 制作视频。

另一种非常常见的方法是使用图像作为参考。这是一张真实的照片,我可以定义我想要的运动和动作。我可以从一张动画镜头中的第一帧开始,或者是一辆行驶中的汽车的镜头,让模型预测接下来会发生什么。这非常好,因为我可以用更好的方式控制影片的摄影风格、艺术方向和镜头的整体风格。我可以使用真实的图像,也可以使用我自己拍摄的图像,并且可以以更好的方式控制图像的构图。

我还可以做这样的操作,使用现有的视频,并通过生成的视频来渲染它。这里所有镜头的背景都是完全生成的,可能有点像视觉特效,这是最常见的说法。你可以将现有的素材与 CGI 视频结合,创造出特效镜头,唯一的不同是,现在这些镜头只需要几秒钟就可以完成。除了文本提示之外,另一种控制形式就是视频控制。我可以输入一个现有的视频,比如我自己录制的或拍摄现场的视频,然后将其转换为不同的风格或角色,或者以不同的艺术方向进行重新渲染。这样我就能更好地控制镜头的运动,定义更多具有动作驱动的元素或角色,使其更加符合我的艺术操作方向。这些视频非常有趣,特别是在动画领域上,我们投入了大量时间。你可能知道,制作动画极其困难且昂贵,这些工具正好可以降低成本。

最后,我想展示一种控制形式,它有点像是一种预告片,我们正在开发的东西,可以将演员的表演提升到一个全新的水平。你会看到两个视频,左边的是一个真实视频,演员正在表演剧本,而右边的是完全生成的视频。(展示视频)“那么,你的意思是,你特意来到机动车辆管理局,却没有带上你的驾驶执照?我理解得对吗?你需要去另一个窗口排队办理。”有趣的是,我们可以保持演员的表演和情感,并几乎实时地将其传递给右边的虚拟角色。这是我们正在研究的生成视频的一部分预告演示。

今天的 Runway 演示到此结束,谢谢大家!


二、对话部分

主持人: 好吧,刚才是不是很酷?让我们再次为 Cristóbal Valenzuela 和 Runway鼓掌,还有 Stig 的参与。Cristóbal,非常感谢你今天能来到这里和我们交流。我非常期待这次对话,因为过去几年里,AI 在制作高质量视频方面取得了令人难以置信的进步。不久之前,我还记得,可能你们也记得,AI 连逼真的手都难以生成,而现在我几乎分辨不出真假了。Cristóbal,我知道你有艺术学校的背景,我很好奇你是如何走上 AI 和视频交叉领域的?在这个快速创新的时代,建立公司又是怎样的经历?

Cristóbal Valenzuela: 是的,没错。我确实有艺术背景,其实我们公司也是从艺术学校起步的。那时我们一直对可能性充满了兴趣,大概是在八年前吧。那时,Universal 的成果可以说是一个突破性的时刻,我认为在过去十到十五年间,它激发了我们很多灵感。不过我想,我们那时意识到的一个问题是,关于如何在创意领域或方向上使用这些模型的投入并不多。所以我们早期的工作很多都是关于如何实际做到这一点。而如今这些视频看起来棒极了,是一种解放创造力的形式,能赋予许多创作者力量去做许多有趣且惊人的事情。但是七年前情况并不是这样,许多人当时认为我们是疯了,当我们向他们展示我们正在尝试做的事情时,他们觉得不可能。但我想,在过去的一年半时间里,整个行业对这些模型的看法发生了变化,机遇与挑战并存。不过至少对我们来说,今天的感觉与几年前相比非常不同。我觉得未来几年可能也不会太不同,因为我们还有很长的路要走。我们基本上是在押注于长期策略。我总是把现在可以做到的很多视频和其他事情看作是一种新媒介。对我来说,这是一台新的摄影机。我不断重复这个观点,因为我觉得这完美地概括了它的意义——如果你有一个新的表达媒介,它会创造出一种新的艺术形式。但现在感觉我们还处在新摄影机和新艺术形式的起步阶段,还有很长的路要走。

主持人: Runway AI 是真实存在的,对吧?我今天试了一下。你的工具已经被用于一些大制作电影中,比如《瞬息全宇宙》,还有像 ASAP Rocky 的音乐视频,甚至是 Stephen Colbert 的《深夜秀》。你最近还与 Lionsgate 签订了一项大合同,定制了一个基于他们作品的训练模型。我们还收到一个观众提问——这个狮门影业合作意味着什么?你觉得这对行业有什么影响?

Cristóbal Valenzuela: 是的,这是一个非常独特的合作,我们最近刚宣布。我们一直在与 Lionsgate 团队合作,主要做了两件事。第一,帮助他们了解如何最好地将 AI 技术融入他们的制作流程中,比如与他们的演员、编辑、特效主管直接合作,帮助他们理解这种技术如何赋能他们。第二,模型的训练很大程度上依赖于数据的质量和数量。因此我们专门使用狮门影业的作品集数据来训练这些模型,以便更好地满足他们的内容制作需求。我们已经在这方面努力了很长时间,终于能够谈论这个合作,真的很棒。我认为这是行业向前迈出的重要一步。其实,电影和好莱坞一直是科学与技术结合的产物,现在是时候开展更多这样的对话了。

主持人: AI 视频领域竞争非常激烈,对吧?我们有 OpenAI 宣布了 SORA,Meta 最近也发布了自己的文本生成视频模型,但这些工具还没有像 Runway 的产品那样向公众开放。你觉得这是为什么?你们是如何比这些大公司更快推出产品的?面对拥有大量资源的竞争对手,你们如何应对?

Cristóbal Valenzuela: 我认为我们起步更早,大约八年前就开始研究这一领域。所以我们更多地像是在引导人们意识到这是值得投入时间的事情。我觉得,当你创造一个新的市场并展示它的价值时,竞争是不可避免的。如果我们在构建的东西成功了,肯定会吸引竞争者来尝试复制我们的做法。我觉得我们现在正处于这个阶段,研究演示和产品之间存在很大差异,研究演示展示了潜在的应用和能力,但把产品交到真正的艺术家和电影制作人手中是完全不同的事情。我认为,对我们来说,始终关注的都是后者,也就是确保这些模型不仅能做刚才你们看到的那些事情,还要真正变得有用。这意味着,作为产品开发者,你需要了解哪些地方需要改进,什么时候需要更改,如何持续改进这些东西,而不仅仅是生成视频。因为如果你曾经尝试过仅仅使用文本提示生成视频,你会发现这并不能完全满足你作为创作者的需求。所以你需要远不止一个简单的文本提示。

主持人: 是的,这其实和我想问的另一个问题有关。比如,当你看到 Runway 的技术被部分用于制作音乐视频,甚至是长片电影时,你觉得目前最终成品中有多少比例是使用了 Runway 技术的?

Cristóbal Valenzuela: 这是一个渐进的过程。我们已经看到一些案例,比如整个视频都是由 Runway 或其他生成技术制作的,还有一些是将真人实拍与动画和 AI 内容混合的。但我认为,这回到了我之前提到的内容——电影、音乐视频、长片或短片从来都不是关于你如何制作它们的。技术总是处于第二位,电影故事的核心是让观众产生情感共鸣,对吧?你不会因为一部电影是如何制作的而去看它,而是因为它讲述了一个好故事。所以最终,我们希望确保如果你想制作一些东西,可以使用我们的工具和技术来帮助你实现目标。但到某个时候,你甚至不需要告诉别人你用了 AI,因为这已经不重要了。我认为这是我们长期目标的方向。

主持人: 你们和客户是如何衡量成功的?有没有一些显著节省成本的例子?或者是通过不同的创造力来衡量?你们如何定义 Runway 的成功?

Cristóbal Valenzuela: 对我们来说,成功的标准是我们是否帮助更多的人制作了更多的电影,讲述了更多的故事。我们的非正式使命是“最好的故事尚未被讲述”,我们想确保我们可以帮助讲述这些故事。所以,对我们来说,成功意味着更多的人能够讲述更多的故事。如果你有一亿美元的预算去拍一部电影,我认为你应该用这笔预算拍100部电影。现在,我们战术上衡量成功的方式是这样的:如果你是一名编剧,以前可能需要花费数小时、数天甚至数周时间去制作一个故事板,但现在可能只需几分钟就能完成。这样迭代的周期会非常短。如果你是一名特效艺术家,通常需要花费数周或数月去迭代抠像或制作特效,现在你希望几秒钟就能完成。这就是时间上的好处,你大幅减少了在重复任务上花费的时间,腾出时间去做更多富有创造力的事情。我认为这就是衡量成功的标准。

主持人: 有没有合作伙伴的具体案例可以分享,他们通过使用 Runway 节省了成本?

Cristóbal Valenzuela: 有的。我们和一位正在制作新剧的编剧合作过,他的第一季非常成功。他在写作时,坐在电脑前,想着自己想象的世界,如何让角色互动。但其实有很多决策是在后期制作中完成的,比如场景的时间安排,角色的摆放位置等。而他让我感到意外的是,他现在能在写作时就能渲染出这些故事,并进行可视化,这样他就能更好地编辑故事。因此,故事不必等到制作阶段才进行修改,故事本身以及剧本都可以在他写作时实时编辑,因为他可以看到它们的呈现效果。我认为,从长远来看,如果你把这些优势不断积累,许多流程和任务都可以找到工具和系统来显著优化和简化。

主持人: 我和一些独立电影制片人聊过,他们对 AI 非常感兴趣,正是因为你刚才提到的那些原因,对吧?AI 能降低入行的门槛,为他们节省时间和金钱。显然,电影制片厂也看到了其中的潜力。但与此同时,也有很多反对的声音。在过去两年里,主要的演员和编剧工会把这个问题作为他们合同谈判的重点之一。此外,许多人也普遍担心,这对创意人士意味着什么?这会取代他们的工作或让他们的工作被商品化吗?你怎么看待这个问题?你会对那些对这项技术感到害怕的艺术家说些什么?

Cristóbal Valenzuela:  我认为很多恐惧来自于对这项技术缺乏经验或机会去深入理解。再说一次,这些系统不会自己去创造电影,它们不是自主行动的代理,突然间就会制作出我们喜欢的东西,对吧?它们只是工具,供人类使用的工具,供艺术家使用的工具。所以你需要知道如何利用这个工具。如果你回顾电影史,这种情况一直存在。150年前,摄影机发明了,艺术界掀起了一场革命,因为他们认为艺术将会消亡。为什么还需要画肖像画呢?如果你可以用摄影机捕捉光线,那我们就完了,艺术家不再有存在的必要了。这实际上是19世纪初的叙述。然而,事实并非如此。实际上,电影制作一开始从绘画中汲取了很多灵感,而绘画也从电影和摄影机中获得了启发,作为一种艺术实践,它得到了更大的解放。绘画超越了肖像的局限,进入了一个更加复杂的领域。

最终,电影演变成了一种新的艺术形式。今天我们身边的许多人,150年前甚至无法想象他们能成为专业的艺术家,或者将其作为日常工作的一部分。所以对我来说,这种情况类似。这就是为什么我总是回到摄影机的比喻。如果你把它看作一台摄影机,你有两种选择:你可以说“这就是我们以前生活的方式”,这是一种新的媒介,你可以理解它、掌握它,发现新的语言和新的艺术形式会从这项新技术中诞生;或者你可以害怕它,认为这是世界末日。我更倾向于前者。


三、观众提问

观众1:关于训练数据的前沿是什么?当我们达到人类内容和数据的极限时会发生什么?

Cristóbal Valenzuela: 这是个好问题。很难说我们是否会真正达到极限。老实说,我们可以一直捕捉新的数据,不断改进模型。我不认为我们已经触及了系统能够处理的数据量上限。现在有很多创新,来自于合成数据,或者通过捕捉数据。有公司正在开发设备,专门用来捕捉环境中的数据。我认为这仍然是非常早期的阶段,至少对我们来说,我们正在训练的是我们称之为“角色模型”的东西。所谓的“角色模型”其实就是另一种说法,指的是模拟系统。我们正在努力构建这些模拟系统,它们包含了各种不同的数据点,比如文本、视频、音频和3D数据等。所以我认为现在还处于非常早期的阶段,我们还有很长的路要走。

观众2: 你们在负责任地使用 AI 时,最大的担忧是什么?我个人也有类似的疑问,特别想问一下关于“深度伪造”(Deepfake)的问题,这是一个大问题。我们即将迎来一场选举,Runway 对此有什么规定?你认为整个行业应该如何应对这个问题?

Cristóbal Valenzuela: 我认为我们可以回顾历史上的其他技术进化时刻,看看类似的情况。就像摄影机发明的时候,人们担心隐私会被侵犯,人们可能会随意拍摄不该拍的东西。事实可能确实如此,但我们集体建立了关于如何使用摄影机的规范,比如什么该拍,什么不该拍。未经他人同意录音录像是违法的,所以我们可以作为一个社会制定出关于技术使用的规则和规范。我认为这也是类似的情况。这是一项新技术,非常了不起,极其有用,并且解放了很多创意,将改变很多事情。但它只是一种技术,我们应该用与对待其他技术类似的方式来看待它。就像互联网一样,互联网极大地改变了世界,当然它也有负面影响,但我们已经集体同意了哪些事情需要加以限制。我认为对待 AI 也应该采取类似的态度。我们现在还处于非常早期的阶段,应该了解它的应用范围,然后确保规范和法规可以应对其滥用问题,但不要过分阻碍创新。现在还不需要停止创新,因为时机还不成熟。

观众3: Runway 目前主要是一个视频工具平台,但你们有没有计划扩展到其他领域?比如游戏或者互动体验?

Cristóbal Valenzuela: 这可能和我之前提到的“新媒体形式”有关。我们不把自己看作是一家视频公司,虽然目前我们最为人熟知的就是视频工具,你们看到的也是视频。但我更愿意把这些看作是像素,动态像素可以有很多不同的形式。如果你能实时生成像素,那么你将会有一些既不像电影、也不像视频游戏的东西。我认为我们目前还没有词汇来形容这种东西,因为我们还没有体验过它。想象一个场景,你开始观看某些内容,然后在观看的过程中,你可以生成接下来的情节。你可能会把它称为视频游戏,但我觉得我们会给它一个新的名称。我们的目标是建立能够实时预测这些帧并帮助你实时生成内容的模型。也许这会出现在元宇宙中,或者它会是其他形式。正如人们在上世纪初没有词汇形容摄影机一样,他们当时把摄影机称为“带记忆的镜子”。我认为我们仍然在用电影制作的语言来形容这种新事物,但最终我们需要集体想出一个新名称。

观众4: 你们如何处理内容的所有权问题?我很好奇,这在像狮门影业这样的合作中是否会有所不同,因为你们使用了他们的电影数据进行训练。而如果我是一个普通用户,使用 Runway 制作了一些东西,谁拥有这些内容的所有权?

Cristóbal Valenzuela:  你拥有它。你是一个使用技术的创作者。你可以用笔、用画笔、用电脑、用 Runway,谁是这些创作的所有者?你是创作者。我认为这一点不会改变,因为你仍然掌握着控制权。唯一可能会改变的情况是,当你把这些系统看作非人类实体时,这又是一个哲学问题——机器是否能够拥有内容?我认为机器不能拥有内容,只有人才能拥有并为内容申请版权。所以,归根结底,还是要把这些工具看作是人类使用的工具。

观众5: 所以现在如果我在 Runway 上制作了一段视频,我就拥有它的版权,对吗?

Cristóbal Valenzuela: 是的,你制作的就是你的。

观众6: 你觉得观众会像欣赏非 AI 生成的电影那样,喜欢这些 AI 生成的电影吗?

Cristóbal Valenzuela: 我真心希望在某个时刻,人们不再需要去区分这些电影是如何制作的。比如说,当你看大卫·芬奇(David Fincher)的电影时,里面充满了 CGI 特效,但你不会觉得它是一部“生成电影”,对吧?你只会觉得这是一部很棒的电影,有一个很棒的故事,看起来像真人实拍的场景,你就喜欢它。你不会去问:“他们是怎么拍的?这个镜头是怎么做到的?”这些不重要,重要的是故事好,电影好。所以我希望我们最终能达到这样的阶段,不再区分制作方式,大家只专注于故事本身,而生成技术成为像其他工具一样的存在。

主持人: 我想听听你对未来几年的预测,特别是 AI 在电影中的应用。你觉得什么时候我们会看到第一部 100% 或者说 90%以上是生成的电影,而且它要么成为票房冠军,要么获得奥斯卡奖?

Cristóbal Valenzuela: 明年。

主持人: 明年?好,我会记住你的话。

Cristóbal Valenzuela: 我们内部的另一个目标就是赢得奥斯卡奖,作为工具开发者来说。奥斯卡有一项关于技术成就的奖项,我们希望通过帮助讲述更多故事来获得这一成就。我觉得这也是衡量成功的一个很好的标准。

主持人:  好的,非常感谢你和我分享这些,这是一次很棒的对话。

Cristóbal Valenzuela: 谢谢你,谢谢大家。



原视频链接:https://www.youtube.com/watch?v=TyBQSjP8W1s&t=2s&ab_channel=BloombergLive

喜欢这篇文章吗?别忘了点赞、收藏、转发支持一下!期待在评论区听到你的看法!

往期回顾

1、[在卡内基梅隆大学,谷歌CEO Sundar Pichai演讲AI正创造一个全新生态系统, 为个人提供更多成功机会]

2、[沃顿商学院AI研讨会:AI对全球经济格局、企业战略和就业市场的多维度影响]

3、[在OpenAI开发者大会,CEO Sam Altman谈AGI时间表,同时展望AGI时代我们的生活变化]


我们旨在将AI科技与创新想法完美融合!

想要掌握人工智能,但不知从何开始?告诉我们你的需求,学习AI让你抓住这波浪潮

告别昂贵服务和缺人烦恼,再见漫长交付周期

无限创意,分分钟生成专业级产品

感受 AI 带来的全新工作体验!

欢迎各大品牌方、媒体、企业和个人等

请联系负责人微信:Milo-1101

--END--

AI深度研究员
AI时代刚刚到来,一切才刚开始,我们正当其时!
 最新文章