OpenAI打出王炸,Sora视频AI太猛了

科技   科技   2024-12-10 19:39   广东  



山姆·奥特曼开始上硬货。

出品 | 科技头版    作者 | 刘峰

“正版 Sora” 震撼发布 

等了将近10个月,OpenAI终于给大家带来了旗下视频生成大模型Sora的消息

就在12月10日)凌晨,OpenAI再次震惊世界,以一场直播宣布正式向用户开放人工智能视频生成模型Sora

图源:直播截图
Sora直播发布会的嘉宾由OpenAI CEO山姆·奥特曼(Sam AltmanSora团队负责人比尔·皮布尔斯(Bill Peebles阿迪亚·拉梅什(Aditya Ramesh三人组成,共进行了一场20分钟的直播。

在这场直播中,他们不仅详细介绍了Sora的新功能,更是展示了AI技术在视频创作上的无限可能。

据直播介绍,此次推出的 Sora 不同于 2 月份的演示版本,而是更高级的新版本Sora Turbo

该版本称较2月版本生成速度显著加快,并且可以生成最长达20秒的视频,还能提供这些视频的多种变体。

据悉,新版Sora具有替换删除新增元素重新剪辑扩展合并视频等功能。

具体操作中,OpenAI把他们分成了多个“按钮”

比如Remix(重混)功能允许用户替换、删除或重构视频中的元素,为视频创作提供了更多的灵活性。

Re-cut(重新切割)功能则能够让用户找到最佳的一帧视频,并在此基础上进行延展,创造出全新的视频内容。

图源:OpenAI直播
Loop(混合)功能则可以将两个视频进行无缝合并剪辑,创造出流畅的视频过渡效果。

Storyboard(故事板剪辑)功能则允许用户精准指定每个帧的输入,为视频创作提供了更高的精确度。

Style presets(风格预设)功能则允许用户预设视频的风格,一键生成具有特定风格的视频内容……

Sora一经发布,OpenAI的服务器瞬间就被“挤爆”,官方网站(Sora.com)甚至直接崩溃,停止一切注册登录。

而已经开始使用的网友也发现了在发布会直播结束后,Sora的视频生成速度开始明显变慢。

对此,Altman 急忙出面安抚用户:“由于需求超出预期,我们将不得不间歇性地关闭新用户注册,并且生成内容的速度会在一段时间内减慢。我们正在全力以赴!”

图源:X

回顾今年2月,OpenAI首次发布有关Sora的预告,声称Sora是一项理解和模拟现实的基础性AI技术,是开发能够与物理世界互动模型的重要一步。

然而,在早期测试中,Sora却表现一些明显的局限性。

例如,在物理模拟方面,模型对物体运动的理解还不够深入,常常出现动作不协调一些物体突然消失等问题。

此外,还有信息透露在某一次测试中,Sora存在“多余肢体”的问题,生成的生物不是多一只手指就是少一只眼睛。

另一方面,此次Sora的发布可以说只是OpenAI为期12天的产品直播活动其中部分。

上周,OpenAI推出了更昂贵的ChatGPT Pro订阅选项,可无限制访问OpenAI最强大的AI模型。

至于Sora的收费方面,官方介绍显示:即日起,Sora Turbo已向订阅OpenAI Plus和Pro的会员开放全部功能,无需额外付费

不过,不同的会员所拥有的使用额度则不太一致。

源:ChatGPT官网

据悉,官方页面显示,每月付费20美元的OpenAI Plus会员,单月共有50次视频生成额度(1000积分),生成的视频分辨率最高为720p,单条视频时长为5秒;

而每月付费200美元的Pro会员,单月可慢速无限次生成视频,加速生成视频500次(10000积分),并且Pro会员可同时生成5条视频,分辨率最高可达到1080p,时长则提升到20秒。

Altman自己也发文宣传:初期Sora的使用仍然受限,ChatGPT Plus订阅用户可以每月生成50个低分辨率视频,而ChatGPT Pro订阅用户则可以无限制地较慢生成高分辨率视频,以及500个快速生成的视频。

简单来说,就是会员通用,购买了ChatGPT的会员也可以使用对应的Sora Turbo。

此外,有不少朋友可能注意到了,或许是受其他竞品的启发,此次OpenAI对Sora采用了灵活的积分制定价策略

据了解,如果你已是 ChatGPT Plus 和 Pro 会员,那么当你需要生成一个 480p、5s 的视频只需要消耗 25 个积分;

生成 480p、20s 的视频则需要 150 个积分;

生成所需积分 | 源:ChatGPT官网

此外,当你使用Re-cut、Remix、Blend或者Loop这些功能或生成的作品超过5s时,需要支付额外积分,功能用得越多、时长越长扣得也越多。

额外所需积分 | 源:ChatGPT官网
因此,纵使Sora带来了许多颠覆性的AI功能,想要注意体验也需要付出一定的代价。

有些用过多家视频AI的用户则表示,Sora是他们用过最贵的文生视频大模型

“对标 Sora”成为现实

随着Sora Turbo的正式发布,“对标Sora”话题又一次引起了关注

2月份Sora预告发布以来,Sora一度销声匿迹,OpenAI对外界也一直保持沉默

与此同时,国内市场上却涌现出了众多文生视频大模型,如快手可灵AI智谱清影AI海螺AI等。

这些国产视频AI发布时不少科技媒体第一时间将它们广泛地与Sora进行对比,并打上了“对标Sora”“国产Sora”等标签。

一些业内人士对此并不认同,他们始终认为这些AISora并非同一概念之间有着本质上的差别

如今,随着更高级的Sora Turbo正式亮相,是时候通过具体的效果展示为这场"对标"争论画一个句号

那就先来聚焦官方的直播演示。

长达数十分钟Sora的功能展示中,OpenAI通过直播向外界展示了Sora的强大能力:

能够生成最高1080p分辨率、最长20秒、支持16:9/1:1/9:16等多种画面比例的视频。

图源:Sora官网

用户可以输入文字或上传图像,利用全新上线的UI界面对生成的视频进行修改、创建、扩展、循环、混合,甚至完全基于文本生成全新的内容。

OpenAI强调,Sora无法实现一键生成一段故事片,而是需要不断优化。

例如,如果用户需要生成一段较长的视频,则需要打开分镜(Storyboard)功能,该功能打开后将在页面上展示四个视频,用户可以从不同视角了解视频细节。

图源:OpenAI直播

点击分镜中视频,用户可以在描述框输入具体提示词,也可以设置风格画面比例时长分镜个数分辨率等元素。

一切就绪后,一条完整的视频随即就能生成

如果说听上去依然很空洞,别着急,接下来给大家展示OpenAI直播中演示的具体案例。

直播中,OpenAI团队在描述框中输入了“一只黄尾白鹤站在小溪里”的提示词,并把生成出的视频放在了时间轴的前面部分;

随后,他们又在新的描述框中输入提示词“这只鹤将头探入水中并叼出一条鱼”,并把这段视频放在了同一个时间轴的后半部分。

两段视频并不连续,Sora可以自行生成中间的过渡片段使之成为一段完整视频。
图源:OpenAI直播

另一个演示中,OpenAI展示了如何用Remix工具改变视频中的物体,从而优化你想要的视频

例如,在前面分镜部分的演示中,OpenAI给出的提示词为“长毛猛犸象走过沙漠景观”

而在后续的优化提示框中,可以直接输入把猛犸象变成「机械猛犸」,就得到了下面这样一条视频。
图源:OpenAI直播

更多奇妙的功能等待着用户们自行去探索,这里不做过多赘述

小编更希望聊一聊的是,Sora是否真的“远远超越”咱们国产自己的视频AI

事实上,好奇这一点的网友非常多,在短短不到一天的体验中,外网就爆出了不少Sora的不足之处:

在用户输入提示词“一只鹈鹕沿着俯瞰港口的沿海小径骑自行车”后,Sora对应生成了一段视频,但在该视频画面中,鹈鹕却像突然吃了云南菌子一样,在中途莫名其妙地变为向相反的方向骑行。
图源:网易新闻

还有外网网友爆料,Sora对于性别的概念比较模糊,当提示词过长的时候,会出现把“一男一女”生成为“两个女孩”的画面。

不过,当我们把同一段提示词交给各家AI进行生成时,它们各自的问题也随之暴露。

据了解,有用户反馈,当提示词为“维京演员的情感表演。当演员皱眉时,镜头推到脸上”Sora、快手可灵、MiniMax海螺表现各有不同。

具体来说Sora的视频镜头氛围出色,粗看有电影大片风范,但无法体现“演员皱眉”、“镜头推到脸上”。

图源:Sora

快手可灵AI的表现则较为严谨,基本一比一根据提示词生成视频,但画面也相对较为死板。
图源:可灵AI

MiniMax海螺生成的视频也有好有坏,亮点在于表情变化更加明显,缺点则是运镜提示词完全理解错误,变成了“镜头逐渐拉远”

图源:海螺AI
总的来说,这些视频大模型都具有各自的优势,当然也存在属于它们自己的不足等待被解决。

随着Sora Turbo的正式发布,国内外视频AI的竞争将更加激烈

哪怕是OpenAI,也需要继续学习与进步,让技术优势变成真正的产品优势。

电商卖家精英群,限时免费开放
仅限淘系、京东、拼多多、快手、抖音等平台卖家入群

铁粉推荐

华为余承东:有人转6万给我,要订3台尊界S800

华为突然降价,释放重大信号

美团拿下华为Mate70配送大单


马斯克最担心的事发生了

微信重大更新,将解决占手机内存问题


关注,跟主编交个朋友 ↓↓↓
商务合作请联系微信/电话:18565716396

点右下角在看,下次可以优先收到我的文章 


科技头版
科技互联网头部大号,近300万精英关注,一起见证改变世界的力量。合作vx:2881339630
 最新文章