迟到的Sora,被对手包围了

创业   2024-12-11 23:08   上海  

图片来源:视觉中国

因惊艳效果引发文生视频赛道热潮的Sora终于面向大众推出。

当地时间12月9日,在为期12天的技术分享活动中,OpenAI宣布,正式向付费用户开放旗下AI视频生成模型Sora。相比今年2月首次发布的版本,OpenAI推出了生成速度更快的模型版本Sora Turbo。

消息公布后,大量想要抢先体验的用户涌入致使Sora网站一度崩溃,OpenAI CEO山姆·奥特曼回应称,由于需求超出预期,将不得不间歇性地关闭新用户注册,生成速度也会在一段时间内变慢。

尽管期待已久的用户并未减退对这款产品的热情,但Sora的国际对手们并未放缓自己的步伐:科技巨头们调高了AI视频生成模型的优先级,还有更多的创业公司涌入这一赛道。

3月底,字节跳动旗下剪映团队研发的AI创作平台“即梦AI”开放内测,并在半年后发布了两款视频生成模型Seaweed和Pixeldance,Seaweed已面向平台用户正式开放。6月,快手可灵AI视频生成大模型上线,截至11月20日累计服务超500万用户。商汤、爱诗科技、Pika Labs等公司均拥有视频生成模型产品。

等待推出的过程中,Sora自身也遭遇了后院起火。今年10月,Sora团队的研发负责人蒂姆·布鲁克斯宣布从OpenAI离职,转投谷歌DeepMind。在Reddit的线上问答中,OpenAI首席产品官凯文·维尔将Sora迟迟无法正式发布归因于需要完善模型、安全因素以及计算能力有待扩展。

如今的Sora,无论对用户、OpenAI乃至整个行业来说,仍然处于相对早期的阶段,山姆·奥特曼将其称作“视频版GPT-1”。

如奥特曼所说,使用Sora与他人共同创作能够为用户带来全新的、有趣的体验,但Sora和它的对手们拥有一些相似的问题:高昂的计算成本、有限的视频生成长度、不稳定的生成质量,以及如何实现商业可持续性。

对于OpenAI而言,选择将Sora纳入ChatGPT付费用户的套餐“打包”售卖,有一定的引流效果。ChatGPT Plus套餐每月收费20美元,每月最多可以生成50个480p分辨率视频;最新推出的ChatGPT Pro每月收费200美元,除了每月可生成500个视频,支持1080p、20s等功能,Pro会员还包含了更智能的o1作为核心卖点。

由于Sora目前并未单独收费,OpenAI将Sora的功能与现有产品绑定,或可增加ChatGPT订阅服务的吸引力。如果Sora能够吸引更多用户订阅每月200美元的Pro套餐,即使新增10万Pro用户,每年也可额外带来2.4亿美元的收入。

快手可灵、字节即梦也推出了图片及视频生成的按月或包年订阅服务。在ChatGPT未进入的中国市场,快手和字节旗下抖音依靠短视频平台的流量和众多创作者,拥有天然优势,能够迅速捕捉用户的需求、建立应用场景。但与Sora和谷歌、英伟达投资的Runway相比,全球市场影响力有待提升。

AI视频可以用于低成本、快速地制作视频广告,因此对企业用户具有强大的吸引力。

比如,可口可乐公司最近推出3支全新的圣诞广告,其中一支“Secret Santa”使用了快手可灵生成了部分画面。制作方Silverside AI表示,相比传统高达数百万美元的制作费用,使用AI工具的成本大大降低,制作速度也是传统方式的5倍。

许多人工智能公司都在考虑基于AI视频的商业变现模式,将其应用于电商、教育培训、品牌推广、社交媒体等领域。但AI公司和广告主们都纷纷看好的这项技术,消费者们目前尚不买单。不少观看了可口可乐那支由AI生成的广告的消费者认为,画面和逻辑上的空洞以及无法摆脱AI感觉的人物形象,使广告的整体效果“非常糟糕”。

或许正是因为明白人类的灵感对于AI创作的重要性,OpenAI、Runway、快手等公司都在致力于与艺术家们结成同盟。

12月6日,中国首个AIGC导演共创计划正式上线。该计划由快手可灵AI联合贾樟柯等9位知名导演共同发起,9部短片全部使用可灵AI进行视频生成。其中,贾樟柯在剧情短片《麦收》中让机器人担任影片主角,利用可灵AI训练出专属的人脸模型,解决了人物脸部特征难以保持一致性的难题。

不过,在艺术创作领域,人类已经开始面对如何处理与AI之间微妙的竞合关系的问题。这种微妙关系引发了OpenAI又一“后院失火”案例。在Sora正式发布前的11月,Sora模型的API试用接口被一组艺术家测试人员在AI开源社区泄露。

此前,OpenAI向数百名艺术家开放了Sora的早期使用权以测试该模型,但部分艺术家认为,OpenAI“白嫖”了他们的无偿劳动,并借此提升公司形象。“我们不是AI企业霸主的免费测试人员、公关傀儡、训练数据。”测试人员在公开信中称。

OpenAI的Sora产品负责人罗汉·萨海在9日产品发布的直播中表示:“我们显然承担着巨大的责任。”他补充说,公司必须防止该技术被非法使用,“但我们同样希望实现创造性表达和保护之间的平衡。”

另一个使AI视频生成工具无法摆脱“早期”印象的事实是,各家模型由于在理解提示词、捕获关键词、画面想象力等方面存在差异,产出的结果无法为更多的普通创作者所用。

从多家测评网站对不同平台的测试结果来看,Sora引以为傲的“大片级”质感,现阶段仍更适合企业级用户或专业创作者,通过大量修改和迭代完成。

当Sora们真正面向大众内容创作者敞开大门时,或许证明其背后的科技公司有能力为视频生成模型找到一条可持续的变现路径,更理想的结果是——“视频版GPT-4”的诞生。(财富中文网)




在财富Plus,网友们对这篇文章发表了许多有深度和思想的观点。一起来看看吧。也欢迎你加入我们,谈谈你的想法。今日其他热议话题:

查看《韩国总统尹锡悦等8人被列入逮捕名单》的精彩观点
查看《毛戈平正式登陆港交所:开盘上涨超70%》的精彩观点

推荐阅读

财富FORTUNE
财富中文网,集世界500强韬略,铸中国商界精英
 最新文章