Sora正式上线!视频生成的“纯元”来了

文摘   2024-12-11 20:25   北京  

▲关注中国信息化周报

新视界、新思维、新洞察

12月10日,OpenAI宣布正式向用户开放AI视频生成模型Sora,该系统可以根据文本提示生成逼真的视频。同时,OpenAI宣布推出Sora的新版本Sora Turbo,版本将作为独立产品提供给ChatGPT Plus和Pro用户。上线当天,服务器火爆到挤不进去。SoraOpenAI创始人山姆·奥尔特曼在社交媒体X上表示:“Sora需求超出预期,注册将被不定期禁用,生成速度会暂时变慢。”

截至目前,距离Sora的首次公开预览已过去10个月。这期间竞品频出,替代款层出不穷,Meta、谷歌、亚马逊,以及国内的Minimax、生数科技,其视频生成产品都曾掀起广泛讨论,Sora带来的新鲜感与惊喜被不断稀释。

“闭关修炼”后的Sora准备如何赢回用户期待呢?跟上一版本相比,新版本的Sora在时长上有较大突破,用户可以通过文字、图像或其他视频素材,生成长达20秒的视频。更重要的是,此次Sora将提供“编辑”服务,通过配套一款视频编辑器,使生成视频的效果更加可控。这无疑是对创意行业的新一轮冲击。而国产版Sora们,准备好接招了吗?

做大做强的Sora

新版本的Sora的生成视频自由度更高。支持任意视频尺寸,用户可自主选择生成视频的长宽比;支持多种分辨率,涵盖从480p到1080p的区间;支持多种时长选项,最长可生成20秒的动态内容;支持多方向视频版本生成,用户可从一次性生成的多个方向的视频版本中选择最佳版本。

新版本的Sora拥有多种视频编辑功能,如Remix(重混)、Re-cut(重新剪辑)、Storyboard(故事板)、Loop(循环)、Blend(混合)以及Style presets(风格预设)。

Remix功能允许用户对生成的视频进行修改,可替换、删除或重新构想视频中的元素。例如,最初生成视频是“打开通往图书馆的大门”,用户可选择门的具体款式,如中式、法式,也可以将图书馆替换成飞船、丛林、月球等景观。用户只需通过Remix描述希望视频如何更改,剩下的工作直接交给Sora。

Re-cut功能让用户能够选中视频中的最佳帧,然后向任一方向延伸来完成场景。如官方演示视频中的“水獭玩球”片段,用户只需选出最心仪的几帧,便可使用Re-cut编辑一下,再生成在那几帧之前或者之后的片段。

Storyboard功能允许用户按时间轴的方式,把一段故事切成多个不同的卡片。用户可以描述环境、角色、动作,Sora会自动把它们补成一段流畅的故事。如描述“广阔的红色星球景观,远处停靠着一艘宇亩飞船”“从宇亩飞船内部向外望去,一个太空牛仔站在画面中央”“特写镜头下,宇航员眼睛透过针织织物面罩望向远方”,Sora会根据这三条提示自动补成一段完整的剧情,这很像电影里的分镜或是动画的手稿,让用户能够精确地控制视频的每一帧。

Loop功能允许用户剪辑并创建首尾无缝衔接的循环视频。Sora会在开头和结尾中添加大量帧,将它们连接起来制作出无限循环播放的视频内容。

Blend功能可以将两个不同的视频合并为无缝剪辑的新视频。例如,可以将雪花飘落的视频和花朵飞舞的视频融合在一起,创造出从雪花过渡到花瓣的自然效果。

Style presets功能允许用户发挥自己想象力,创建想要的风格。如两头猛犸象在雪地走路的场景,用户可以将其转换为纸工艺品风(大地色调为主,配以柔和的粉彩,点缀鲜艳的色彩,柔和的环境光增强手工质感,画面中的人、物和景都等全部元素都变成纸板质地,呈现出的折痕和褶皱)、档案风(100T胶片拍摄,画面具有颗粒质感、高对比度效果,配合浅景深营造电影感、戏剧感,具有浓郁的怀旧氛围)等。

服务器被挤爆

六大编辑功能出人意表,新版本Sora一经上线,便获得用户追捧。许多用户都在社交平台分享了自己的试用效果,小狗超人、名流街拍、乌鸦觅食、战场重现,许多想法从文字、图片变成了动态的视频。AI评论员Rowan Cheung评价道:“圣诞节提前来到了AI世界”。同时也有用户反馈,新版Sora存在物理规律理解不足等问题,如手部细节不自然,人物腿部动作混乱,物体相互穿过、凭空出现和消失等。试用新版的编辑功能,发现元素变更不如样片中丝滑。但瑕不掩瑜,新版Sora基本践行了“通过文本、图像或视频将您的想象力变为现实”的slogan,因此广大用户趋之若鹜。因反响过分热烈,导致服务器不堪重负,官网称“Sora账户创建暂时不可用”。

Sora的正式发布将给视频制作领域带来革命性的变化。早在2月份推出Sora预览版时,OpenAI一直积极推动其商业落地,邀请艺术家、电影制作人和动画师试用该服务,向电影制片厂、媒体高管、经纪公司示好。影视、广告、游戏开发、社交媒体等行业的内容创作者无疑将是Sora的核心用户。一方面Sora将大大降低视频创作的门槛,变革内容创作流程,另一方面也将对原有生态产生较大的冲击。

针对此前一直被频繁提及的安全问题,OpenAI表示采取了一系列措施以应对潜在的风险和滥用问题。首先,Sora生成的视频会带有可见的水印和C2PA元数据,以明确标识视频的AI来源,确保内容的透明性和可追溯性。其次,在上传内容前,用户需同意一项协议,承诺不上传包含未成年人、露骨或暴力内容以及受版权保护的材料。再次,Sora设有内容过滤器,严格审核涉及未成年人和敏感内容的视频,并通过提示重写功能减少版权侵犯风险。最后,OpenAI表示,滥用媒体上传可能会导致帐户被禁止或暂停。

Sora目前有两种付费模式。一是每月收费20美元的ChatGPT Plus订阅用户,每月最多可生成50个视频,分辨率最高可达720p,时长为5秒。二是12月6日推出的每月收费200美元的ChatGPT Pro订阅用户,每月最多可生成500个视频,分辨率最高为1080p,时长为20秒,且订阅者可以下载没有水印的视频。OpenAI表示,仍在为不同类型的用户量身定制定价,计划于明年初推出 。

国产平替们竞争白热化

Sora的火爆蔓延全球。在国内,互联网大厂和大模型公司均积极布局视频大模型赛道,主要玩家包括字节跳动、快手、阿里云、Minimax、生数科技、爱诗科技、智谱AI等。近日,腾讯混元大模型也宣布上线视频生成能力,正式加入视频生成赛道。

在实际试用中,各大国产视频生成模型与Sora的差逐渐缩小,部分功能甚至实现超越。快手的可灵AI能够生成长达两分钟的1080p视频;智谱AI推出的新清影视频生成工具支持生成10秒、4K、60帧的超高清视频;国产视频生成模型在理解中文语境、生成中国风作品方面也展现出了明显优势。但不可否认,新版Sora的编辑功能,对生成视频细节连贯性的处理,丰富完整的产品体验,仍是国产视频生成模型需要学习的地方。

视频生成领域的“鲶鱼”再次现身,可以预想这条赛道又要“卷”起来了。


作者:于帆
编辑:高珊珊
监制:刘晶

—End—



注:转载、添加白名单以及商务合作请在公众号后台留言,未经许可、不得转载,不得随意修改及盗用原文。

中国信息化周报
《中国信息化周报》与中国信息主管网联动,围绕政府、制造、金融、医疗、教育等行业内容,面向信息化建设领域,报道信息化建设中的新需求、新应用、新体验,为各级工业和信息化主管部门的决策者、企事业单位信息化建设的管理者提供全方位、多元化服务。
 最新文章