真正可以与Sora竞争的视频生成模型终于出现,Runway在6月17日晚发布了Gen-3模型,在上一代Gen-2已经落后于Luma、可灵、Dreamina后,成功反超,达到了接近Sora的生成效果。目前生成效果的排名更新Sora≈Runway Gen-3>可灵≈Luma>Dreamina>>Pika,Gen-3模型会在几天后开启测试,我们会在第一时间上评测。Pika在公布了同步人物嘴形和声音的功能后沉寂许久,我们预计Pika也即将推出模型更新。
Gen-3的特性与示例
Gen-3训练数据与标注显著高于Sora之外的模型,其字母具有高度描述性、时间密集的特点。与可灵和Dreamina对比能发现能够对场景中的元素进行富有想象力的过渡和精确的关键帧,也能更好的处理超现实的内容。
Gen-3对人物、表情和动作生成的效果更加精细,并且可以生成稳定的包含文字的视频内容,大幅提高了其作为视频生产工具的能力。
同时我们也发现Gen-3生成的视频在美学角度也是高于之前的模型,其文档中也表述Gen-3训练是由科学家、工程师和艺术家的跨学科团队共同研发和训练的,能更好地理解各种风格和电影术语。