OpenAI正式发布AI视频生成工具Sora,Plus用户每月可生成50条

科技   2024-12-10 19:42   北京  
出品|网易科技《态度》栏目
编辑|王凤枝

OpenAI Sora官方使用指南

12月10日消息,美国时间周一,OpenAI正式发布了其备受关注的人工智能视频生成工具Sora。

这款工具的工作原理类似于OpenAI的图像生成工具DALL-E:用户只需输入想要的场景描述,Sora即可生成高质量视频片段。此外,Sora还能够根据静态图像生成相关视频、扩展已有视频或填补视频缺失的帧。这一功能让Sora在视觉生成领域展现了强大的创造力。今年2月,Sora首次亮相,而OpenAI去年凭借ChatGPT的广泛流行跃入公众视野。

根据OpenAI在YouTube上的直播介绍,Sora将于今日正式向美国以及“国际上大多数国家”的用户开放。不过,对于欧洲、英国及其他部分国家的上线时间,OpenAI尚未给出具体安排。

用户可以生成分辨率高达1080p、时长最长20秒的视频,并支持宽屏、竖屏和正方形等多种画幅比例。此外,用户还可以导入自己的素材,用于扩展、重新混合或融合内容,甚至直接从文本生成全新的视频。

Sora将免费提供给现有的ChatGPT Plus和Pro订阅用户,无需支付额外费用;Plus用户每月最多可生成50个480p视频,而Pro用户最多可生成500个。在直播中,OpenAI员工以及首席执行官萨姆·奥特曼(Sam Altman)展示了Sora的多个功能亮点,例如“混合”功能(可以将两个场景按照用户指令融合为一个视频)以及生成可无限循环播放的视频选项。

图注:ChatGPT Plus每月提供1000积分;ChatGPT Pro提供10000积分

在正式推出之前,Sora主要供一小部分“红队”安全测试人员使用,这些测试人员帮助检测模型在信息偏差和误用方面的潜在风险。

10月时,一些Reddit用户向OpenAI高管询问Sora的发布日期,并猜测延迟的原因是“推理计算和时间成本过高”或“出于安全考虑”。对此,OpenAI产品主管凯文·威尔(Kevin Weil)回应称:“我们需要完善模型,确保其在安全性、模拟能力及其他方面的表现,同时扩展计算能力!”

OpenAI的Sora产品负责人罗汉·萨海(Rohan Sahai)在直播中表示:“作为OpenAI,我们显然承担着巨大的责任。”他补充道,公司必须防止该技术被非法使用,“但我们同样希望实现创新与创意表达之间的平衡。”

今年10月,OpenAI完成了最新一轮融资,估值高达1570亿美元,融资金额达到66亿美元,并获得了40亿美元的循环信贷额度,使公司可支配流动资金总额超过100亿美元。

作为微软支持的人工智能初创企业,OpenAI正与众多科技巨头展开激烈竞争,包括亚马逊及其支持的Anthropic、埃隆·马斯克创办的xAI,以及谷歌、Meta和微软等。据预测,在未来十年内,生成式人工智能市场收入可能突破1万亿美元大关。

本月早些时候,OpenAI任命其首位首席营销官,标志着公司计划在市场推广方面增加投入,以进一步拓展用户基础。此外,今年10月,OpenAI在ChatGPT中新增了搜索功能,使其能够更好地与谷歌、必应和Perplexity等搜索引擎竞争,并吸引更多用户。

作为ChatGPT的开发者,OpenAI希望通过Sora在视频生成领域与Meta和谷歌等公司展开直接竞争。谷歌今年1月推出了Lumiere,而其他初创公司也已发布了类似的人工智能工具,例如Stability AI的Stable Video Diffusion。此外,亚马逊也推出了“Create with Alexa”,这是一款专注于生成基于提示的短片儿童动画内容的模型。

随着聊天机器人和图像生成工具在消费及商业领域的普及,视频生成正成为生成式人工智能的下一个前沿领域。虽然这一技术为AI爱好者带来了创造性的新机会,但也引发了对错误信息和深度伪造的担忧。据机器学习公司Clarity数据显示,AI生成的深度伪造视频数量同比增长达900%。

OpenAI将多模态(文本、图像和视频生成的结合)作为其战略目标的一部分,以拓展人工智能工具的应用场景。

在Sora发布之前,一些抗议者泄露了Sora的副本,表达对OpenAI对待艺术家方式的不满。OpenAI的早期访问计划中包含了约300名艺术家,这些艺术家在11月底发表了一封公开信,批评OpenAI在透明度和对艺术界的支持方面做得不够。

公开信中提到:“我们曾承诺作为早期测试者、红队成员和创意合作伙伴参与Sora的开发。然而,我们感到自己被引导参与了一场‘艺术洗白’,旨在展示Sora是一个对艺术家有用的工具。”

信中指出,数百名艺术家为Sora提供了大量无偿劳动,通过漏洞测试和反馈推动了模型开发。“尽管如此,只有少数人能通过竞争脱颖而出,他们的Sora创作作品得以公开放映,但所获得的回报与OpenAI的公关和营销价值相比微不足道。”

公开信指出:“我们并不反对将人工智能技术用作艺术创作的工具(如果反对,我们可能根本不会被邀请参加这个项目)。但我们不认同该艺术家项目的推出方式,以及这一工具在可能公开发布前的发展方向。我们公开这一情况,是希望OpenAI能变得更加开放,更加友好地对待艺术家,并真正支持艺术的发展,而不是将其仅作为公关宣传的手段。”

对此,OpenAI在11月下旬发表声明回应称:“数百名艺术家对Sora的开发作出了重要贡献,帮助我们确定了功能开发的优先级,并改进了安全措施。参与完全是自愿的,我们也未要求提供反馈或使用工具。我们很高兴能够为这些艺术家提供免费访问的机会,并将继续通过赠款、活动及其他项目为他们提供支持。”

以下为OpenAI发布Sora的官方博客文章全文:

我们的视频生成模型现已从研究预览阶段推向市场,并已在sora.com正式上线。

今年早些时候,我们推出了Sora——一款能够通过文本生成逼真视频的人工智能模型,同时分享了我们在世界模拟领域的初步研究成果。Sora是开发能与物理环境交互的人工智能模型的重要基础,标志着这一领域迈出了关键一步。

我们全新发布的升级版Sora Turbo,其速度显著超过了2月份发布的预览版。今天,这款独立产品已在sora.com上线,并向ChatGPT Plus和Pro用户开放使用。


全新设计的Sora界面

我们为Sora设计了一系列新功能,这些功能在此前的技术报告中已初步提及。

现在,用户可以生成分辨率高达1080p、时长最长20秒的视频,并支持宽屏、竖屏和正方形等多种画幅比例。此外,用户还可以导入自己的素材,用于扩展、重新混合或融合内容,甚至直接从文本生成全新的视频。

全新的界面设计让用户可以更方便地通过文本、图像或视频提示使用Sora。同时,我们的故事板工具允许用户精确控制每一帧的输入内容。此外,我们还推出了“特色板块”和“最新动态”,展示社区创作者的优秀作品并持续更新。

OpenAI Sora官方使用指南



Sora的订阅服务与可用性

Sora已纳入ChatGPT Plus订阅中,用户无需支付额外费用。每月最多可生成50个视频,分辨率为480p,或更少数量的720p视频。

对于更高需求的用户,ChatGPT Pro订阅提供10倍的使用额度,同时支持更高的分辨率和更长的视频时长。此外,我们正在为不同类型用户开发个性化的定价方案,预计将于明年初推出。


技术部署与限制

目前推出的Sora版本在一些方面仍存在限制。例如,它可能生成不符合现实的物理效果,并在处理复杂动作时表现不足。尽管Sora Turbo相比2月份的预览版速度快了很多,但我们仍在努力降低技术成本,让更多用户可以负担得起并轻松使用。

我们决定在此阶段推出视频生成技术,是希望社会各界能有时间探索其潜力,并共同制定规范和安全保障措施,以确保技术在未来能够被负责任地应用。

所有通过Sora生成的视频均嵌入了C2PA元数据,用于标识内容来源并提供透明度。这些元数据还可用于验证视频的真实性。尽管当前技术尚不完美,我们已默认添加了多项保护措施,例如可见水印。同时,我们开发了一个内部搜索工具,通过生成内容的技术属性来辅助验证其是否源自Sora。

目前,我们已屏蔽了一些严重滥用形式,例如儿童性虐待材料和深度伪造内容。发布初期,涉及人物的上传功能将受到限制,但随着深度伪造缓解措施的改进,我们计划逐步向更多用户开放这一功能。

我们希望这个早期版本的Sora能够激发用户的创造力,让他们探索新的叙事形式,讲述自己的故事,并不断扩展视频叙事的可能性。我们期待着见证Sora如何塑造全新的创作世界。





网易科技
网易科技频道,有态度的科技门户。
 最新文章