实测!生数科技联合清华大学发布Vidu 1.5,AI视频大模型再现划时代功能,主体一致性世界第一。

科技   2024-11-16 18:07   山东  


开头忍不住先说一句,Vidu1.5是真TM强!


Sora从2月份昙花一现,就再也没翻起浪花,直接难产了。


生数科技联合清华大学在4月份发布了Vidu 1.0,支持一键生成16秒、1080P分辨率的视频内容,这是国内第一个Sora级别的AI视频大模型。后来才有了清影、可灵这些。



这张代表了Vidu 1.0的视频截图大家应该还有印象吧,画面的丰富度在当时可以说是比Sora演示的差不了多少。


这几天,生数科技联合清华大学发布了Vidu 1.5,Vidu早在9月份就突破了“多主体一致性”的难题,1.5版本又新增了多图参考功能,这方面是真的遥遥领先。


扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)


今天咱们从Vidu 1.5的每个功能来详细了解。


一、图生视频


这个功能不是最惊艳的,因为之前的AI视频平台都有,效果上也差不多,只是给大家实测看下。


很多小白应该也知道了,前段时间很火的那些让老照片动起来的视频就是用类似工具做的。




二、参考生视频


这个功能最能体现出主体一致到底有多么强。



可以添加1-3张图片,根据图片和提示词来生成视频。


先来几段官方DEMO,简单了解下这个功能。



主体一致性真的太强了!!!!


说它这方面遥遥领先,世界第一,真的不过分。


当然,一开始看了DEMO我也是不信的,我必须得实测下。


而且我觉得官方DEMO里的小男孩还是太简单了,得给它上难度,特意用Midjourney生成了一个头发更乱一点的。



再简单裁一下,输入的图片和提示词就是这样。



开始我也没多想,后来才注意到,Vidu是支持中文的。


来看下生成的效果。


人物主体一致性确实是够了,但是怎么跟官方DEMO差这么多?尤其是背景和清晰度上,让我怀疑自己用了盗版的。



发现底部能调清晰度,那再来一条吧。



这才对嘛!这飘逸的小发型,是这个味儿!全方位无死角的帅。


我用的720P,跟官方DEMO还是有点差距,但是我信了,Vidu 1.5的DEMO是真的,不用打折扣。


极速模式大概10秒就能生成4秒的视频,720P大概要3分钟。


三、文生视频


这个功能大家已经很熟悉了,不放官方DEMO了,来个我实测的视频看看,还是720P的。




新注册有免费积分,这些功能都可以体验下。粗略算了下,订阅的话,一个720P的视频大概2块钱,但我更关心API的价格,等我联系上他们官方的人再来汇报。


项目链接


https://www.dongaigc.com/p/tools/vidu-1




寻找更多开源项目,就到 懂AI(dongai.ai)


软件开发,AI项目快速落地,专业团队高质量交付。


 关注「开源AI项目落地」公众号

与AI时代更靠近一点

 关注「AGI光年」公众号

获取每日最新资讯

 关注「向量光年」公众号

加速全行业向AI转变

开源AI项目落地
分享有价值的开源项目,并且致力于Ai项目的落地。
 最新文章