全球领先的人工智能公司OpenAI正式发布了视频生成模型Sora的新版本Sora Turbo,并且是将Sora Turbo作为一款独立的产品发布在sora.com上,供ChatGPT Plus和Pro付费订阅用户使用。用户可以使用Sora生成分辨率高达1080p、时长最长为20秒的视频,可选宽屏、竖屏或方形视频,支持从文本转视频、图像转视频和视频转视频。根据互联网社交平台上一些用户的分享,很多由Sora生成的视频作品看起来确实令人感到震撼。
由于实在太过火爆,Sora官方网站一度挤到崩溃,OpenAI首席执行官萨姆·奥特曼在社交平台上发贴表示:“由于需求超出预期,我们将不得不间歇性地关闭新用户注册,并且生成内容的速度会在一段时间内减慢。”
在OpenAI发布Sora产品的直播中,按照奥特曼的说法,OpenAI之所以要开发Sora工具产品,主要有三个原因。首先,OpenAI很乐意为创意人员制作工具。也是OpenAI希望人类利用AI的方式之一。其次,AI不能只通过文本与人类交互,也应该理解并生成视频。第三,OpenAI的长期目标是实现通用人工智能,视频是一个重要的环境,AI将学到很多关于世界的规律。
Sora为用户提供积分用于视频生成,具体消耗取决于视频的分辨率和时长。每月20美元的ChatGPT Plus付费套餐提供1000积分,每月200美元的ChatGPT Pro付费套餐提供10000积分。不过,积分每月会在UTC时间午夜重置,不可累积,并在每个计费周期结束时失效。另外,OpenAI正在为不同类型的用户制定不同定价,计划于明年初推出。
生成480p视频需要20-150积分,720p视频需要30-540积分,1080p视频需要100-2000积分。ChatGPT Pro付费用户专享的轻松模式视频不消耗点数。换言之,ChatGPT Plus可用于生成最多50个优先级视频(分辨率为720p、时长为5秒)。ChatGPT Pro可生成最多500个优先级视频(分辨率为1080p、时长为20秒)。ChatGPT Pro用户可以生成无限的轻松模式视频,并且这些视频无水印。
为了让用户更加轻松地使用文本、图像和视频提示Sora生成视频,OpenAI开发了全新的操作界面——可以这样理解,Sora当前大致相当于Web版的视频创意编辑工具。
注:视频字幕完全由AI生成
Sora主操作界面的下方有输入框,用户可以在此输入想要生成视频的文字描述,并提供“样式预设”、“长宽比例”、“分辨率”、“时长”、“变体”等选项。如果鼠标移到“?”图标,会显示生成视频所需消耗的积分值。
长宽比例可选16:9、1:1、9:16。分辨率可选1080p(慢8倍)、720p(慢4倍)、480p(最快)。时长可选20秒、15秒、10秒、5秒。一次可生成1个、2个或4个视频变体。预设样式则有6个选项。点击“向上的箭头”即可让Sora生成视频。
用户点击单个视频,在界面的底部便可见到编辑工具栏,有Edit prompt(编辑提示词)、View story(观看故事)、Re-cut(在故事板Storyboard中对视频进行精简或者扩充)、Remix(在已生成视频的基础上对元素进行修改替换)、Blend(将另一个视频的元素嵌入到目标视频中)和Loop(基于视频的任意部分创建流畅的循环)。界面的右上角有“喜欢”、“分享”、“下载”选项。
特别值得一提的是,在故事板Storyboard模式下,用户可以按照时间戳选择各帧动画要生成的内容,并以此串联视频生成内容,用户可以输入文字或者上传图片、视频来生成新的视频内容——简单地说就是,故事板Storyboard模式支持用户自由地创作。
OpenAI目前部署的Sora版本依然存在许多局限性。它经常生成不符合物理规律的内容,并且在处理复杂的动作和长时视频时表现不佳。尽管Sora Turbo的速度比今年二月份的预览版Sora快得多,OpenAI仍在努力使这项技术变得更经济实惠。
OpenAI现在推出视频生成技术Sora,是希望社会能够有时间探索它的潜力,共同制定规范和保护措施,以确保随着该领域的发展,技术能够被负责任地使用。
所有由Sora生成的视频都包含C2PA元数据,用于标识视频来源并提供透明性,可以用来验证内容的出处。尽管还不完美,OpenAI已经添加了一些保护措施,例如默认情况下的视频水印,并开发了一个内部搜索工具,利用生成内容的技术属性来验证视频是否来自Sora。
目前,OpenAI正在阻止特别有害的滥用行为,例如儿童性虐待材料和色情深度伪造视频。初期将限制上传人物相关内容,但随着OpenAI优化深度伪造防护功能,将逐步向更多用户开放。
OpenAI希望Sora的早期版本能够帮助世界各地的人们探索新的创造形式,讲述他们的故事,并推动视频叙事的可能性边界。期待看到全球用户用Sora创造出精彩的作品。
国内券商认为,由于Sora在视频生成任务中的表现十分出色,可以在特定场景中深度赋能用户创作视频的时间和成本,未来有望在商业办公、电子商务、广告营销、文化娱乐等场景发挥重要的作用。