智谱 AI 清影全新升级,上手实测不敌可灵
创业
2024-11-11 18:02
广东
作者|子川
来源|AI先锋官
模型能力全面提升:在图生视频的质量、美学表现、运动合理性以及复杂提示词语义理解方面能力明显增强。4K超高清分辨率:支持生成 10s、4K、60 帧超高清视频,视觉体验拉到极致,动态画面更加流畅。带声效的AI视频:新清影可以生成与画面匹配的音效了。音效功能将很快在本月上线公测。挑重点:升级过后的清影能和视频生成领域第一梯队的可灵相比较吗?全新的音效功能到底效果怎么样,会不会成为下一个被全网抄的功能呢?首先我们来看一下清影全新推出的新功能“音效功能”。音效功能顾名思义就是:能够生成与视频相匹配的音频内容,如爆炸、水流、乐器、动物叫声、交通工具声等由于目前“音效功能”还没有正式推送,我们看一下官方发的几个demo。不吹不黑,如果不是我之前听过哥斯拉的声音,我肯定会觉得这就是哥斯拉的声音,而且音效从小到大,表现的极其自然,过渡的也非常顺滑。听完哥斯拉的嘶吼,我们再来听一个难度更高的“赛车声”。一样,十分不错,大家可以连接耳机听一下,表现效果会更好。接下来,我们再看一下全新升级的清影,从多个角度分析,看其是否已经都到视频生成领域的第一梯队。提示词:一只柴犬手里拿着报纸,它正坐在沙发上看报纸。vidu:
可灵:
清影:
想从生成的质量来看,无疑是vidu目前最差,毕竟吃了画质不好的亏,不过和清影和可灵相比,我们可以看到在文字理解方面以及色彩的搭配上,可灵所展示的效果更好。提示词:两只蝴蝶停落在花朵上,视频画面由远到近不断的放大。vidu:
可灵:
清影:
面对运镜相关的提示词,它们三都可以生成相应的提示词。vidu和清影又又又放了老毛病,一个画质不行,一个视频颜色太鲜艳,在同行的衬托下,那只好是可灵更好了提示词:一个时髦的女人走在东京的街道上,到处都是温暖的霓虹灯和生动的城市标志。她穿着黑色皮夹克、红色长裙、黑色靴子,拿着一个黑色钱包。她戴着太阳镜,涂着红色的口红。她走起路来自信而随意。街道是潮湿和反光的,创造了一个彩色灯光的镜子效果。许多行人走来走去。vidu:
清影:
不过,最后来了一个超级大反转,智谱团队直接宣布,把这个“新清影”背后的底层模型,也就是CogVideoX v1.5,直接开源了。这个时候只能说一句:“清影yyds,我和清影天下第一好”。开源地址在这:
https://github.com/thudm/cogvideo
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。