开头忍不住先说一句,Vidu1.5是真TM强!
Sora从2月份昙花一现,就再也没翻起浪花,直接难产了。
生数科技联合清华大学在4月份发布了Vidu 1.0,支持一键生成16秒、1080P分辨率的视频内容,这是国内第一个Sora级别的AI视频大模型。后来才有了清影、可灵这些。
这张代表了Vidu 1.0的视频截图大家应该还有印象吧,画面的丰富度在当时可以说是比Sora演示的差不了多少。
这几天,生数科技联合清华大学发布了Vidu 1.5,Vidu早在9月份就突破了“多主体一致性”的难题,1.5版本又新增了多图参考功能,这方面是真的遥遥领先。
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)
今天咱们从Vidu 1.5的每个功能来详细了解。
一、图生视频
这个功能不是最惊艳的,因为之前的AI视频平台都有,效果上也差不多,只是给大家实测看下。
很多小白应该也知道了,前段时间很火的那些让老照片动起来的视频就是用类似工具做的。
二、参考生视频
这个功能最能体现出主体一致到底有多么强。
可以添加1-3张图片,根据图片和提示词来生成视频。
先来几段官方DEMO,简单了解下这个功能。
主体一致性真的太强了!!!!
说它这方面遥遥领先,世界第一,真的不过分。
当然,一开始看了DEMO我也是不信的,我必须得实测下。
而且我觉得官方DEMO里的小男孩还是太简单了,得给它上难度,特意用Midjourney生成了一个头发更乱一点的。
再简单裁一下,输入的图片和提示词就是这样。
开始我也没多想,后来才注意到,Vidu是支持中文的。
来看下生成的效果。
人物主体一致性确实是够了,但是怎么跟官方DEMO差这么多?尤其是背景和清晰度上,让我怀疑自己用了盗版的。
发现底部能调清晰度,那再来一条吧。
这才对嘛!这飘逸的小发型,是这个味儿!全方位无死角的帅。
我用的720P,跟官方DEMO还是有点差距,但是我信了,Vidu 1.5的DEMO是真的,不用打折扣。
极速模式大概10秒就能生成4秒的视频,720P大概要3分钟。
三、文生视频
这个功能大家已经很熟悉了,不放官方DEMO了,来个我实测的视频看看,还是720P的。
新注册有免费积分,这些功能都可以体验下。粗略算了下,订阅的话,一个720P的视频大概2块钱,但我更关心API的价格,等我联系上他们官方的人再来汇报。
项目链接
https://www.dongaigc.com/p/tools/vidu-1
寻找更多开源项目,就到 懂AI(dongai.ai)
软件开发,AI项目快速落地,专业团队高质量交付。
关注「开源AI项目落地」公众号
与AI时代更靠近一点
关注「AGI光年」公众号
获取每日最新资讯
关注「向量光年」公众号
加速全行业向AI转变