智谱 AI 清影全新升级,上手实测不敌可灵

创业   2024-11-11 18:02   广东  

作者子川

来源AI先锋官


最近,又被一款国产AI视频工具刷屏了。
而它,就是智谱全新迭代的“新清影”。
废话不多说,先来看一下新清影究竟“新”在哪?
模型能力全面提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力明显增强。
4K超高清分辨率:支持生成 10s、4K、60 帧超高清视频,视觉体验拉到极致,动态画面更加流畅。
带声效的AI视频:新清影可以生成与画面匹配的音效了。音效功能将很快在本月上线公测。
挑重点:升级过后的清影能和视频生成领域第一梯队的可灵相比较吗?
全新的音效功能到底效果怎么样,会不会成为下一个被全网抄的功能呢?
带着这些疑问,我们一个一个来看一下。
首先我们来看一下清影全新推出的新功能“音效功能”。
音效功能顾名思义就是:能够生成与视频相匹配的音频内容,如爆炸、水流、乐器、动物叫声、交通工具声等
由于目前“音效功能”还没有正式推送,我们看一下官方发的几个demo。
不吹不黑,如果不是我之前听过哥斯拉的声音,我肯定会觉得这就是哥斯拉的声音,而且音效从小到大,表现的极其自然,过渡的也非常顺滑。
听完哥斯拉的嘶吼,我们再来听一个难度更高的“赛车声”。

一样,十分不错,大家可以连接耳机听一下,表现效果会更好。
现在AI视频生成领域,已经从无声变有声了!
接下来,我们再看一下全新升级的清影,从多个角度分析,看其是否已经都到视频生成领域的第一梯队。
1.拟人性
提示词:一只柴犬手里拿着报纸,它正坐在沙发上看报纸。

vidu:

可灵:

清影:

想从生成的质量来看,无疑是vidu目前最差,毕竟吃了画质不好的亏,不过和清影和可灵相比,我们可以看到在文字理解方面以及色彩的搭配上,可灵所展示的效果更好。
2.运镜定理
提示词:两只蝴蝶停落在花朵上,视频画面由远到近不断的放大。

vidu:

可灵:

清影:

面对运镜相关的提示词,它们三都可以生成相应的提示词。vidu和清影又又又放了老毛病,一个画质不行,一个视频颜色太鲜艳,在同行的衬托下,那只好是可灵更好了
3.再来一个经典的
提示词:一个时髦的女人走在东京的街道上,到处都是温暖的霓虹灯和生动的城市标志。她穿着黑色皮夹克、红色长裙、黑色靴子,拿着一个黑色钱包。她戴着太阳镜,涂着红色的口红。她走起路来自信而随意。街道是潮湿和反光的,创造了一个彩色灯光的镜子效果。许多行人走来走去。

vidu:

可灵:

清影:

好家伙!最后一组,大家来评判一下吧。
不过,最后来了一个超级大反转,智谱团队直接宣布,把这个“新清影”背后的底层模型,也就是CogVideoX v1.5,直接开源了。这个时候只能说一句:“清影yyds,我和清影天下第一好”。

开源地址在这:

https://github.com/thudm/cogvideo
感兴趣的兄弟们可以直接去体验一下了。



 .END.
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。



往期文章回顾


AI先锋官
AIGC大模型及应用精选与评测
 最新文章