作者|子川
来源|AI先锋官
近日,AI视频生成领域又迎来了一匹黑马——MiniMax8月31日首次举行的MiniMax Link伙伴日上,MiniMax创始人、CEO闫俊杰发布MiniMax首款 AI 高清视频生成模型技术:abab-video-1。据了解,abab-video-1画质方面最高支持1280*720的25fps,“拥有电影感镜头移动”,并且支持带文字元素。目前视频时长最高支持6秒。未来或支持10秒。目前仅有文生视频功能,不久会陆续推出图生视频以及文图结合生成视频的能力。
先来一个简单的,【孙悟空拿着一根金色的棍子在天上飞】。主要考察其对中国神话人物的理解能力。整体的质感还是不错的,不过视频的呈现和我们脑海中的【孙悟空】有点不符,顶多算是“穿着盔甲的猴子罢了”,棍子还长出了一个头。。。接下来就更翻车了,【孙悟空拿着金色的棍子从迷雾中走出来】金色的棍子也变成了烧火棍,还冒着熊熊大火!(此次是多次生成最为离谱的一次,大家权当个笑话看啦~~)下面来一段较长提示词,测试abab-video-1模型对长句子的理解能力。提示词:
阳光明媚的午后,一个可爱的男孩坐在柔软的草地上。突然,一只毛茸茸的小猫蹦跳着来到他身边。男孩轻轻抚摸小猫的背部,小猫舒服地咪咪叫。两个小伙伴开始玩起了追逐游戏,男孩拿着逗猫棒,小猫欢快地跳跃。他们在花园里奔跑,穿梭在五彩缤纷的花丛间。男孩开怀大笑,小猫欢快地喵喵叫。最后,疲惫但满足的两个小家伙依偎在一起,享受着美好时光。这次生成的效果还是值得不错滴,(手部稍微有点崩)。可能是因为视频时长的原因,它只生成了提示词前面部分,后面部分就没有生成了。MiniMax推出的abab-video-1作为新生界的黑马自然免不了和目前国内最好的视频生成工具,可灵来对比一番,再加上暂且还跨越不了的大山——Sora。此次评测均采用Sora同款提示词。大家来看一下效果如何?提示词:两艘海盗船在一杯咖啡中航行时相互争斗的逼真特写视频
Sora:
可灵:
MiniMax:
从生成的效果来看,Sora毋庸置疑是No.1,但是可灵和MiniMax相比,小编觉得这一局MiniMa胜。(主要是可灵的大炮有点大)一个时髦的女人走在东京的街道上,到处都是温暖的霓虹灯和生动的城市标志。她穿着黑色皮夹克、红色长裙、黑色靴子,拿着一个黑色钱包。她戴着太阳镜,涂着红色的口红。她走起路来自信而随意。街道是潮湿和反光的,创造了一个彩色灯光的镜子效果。许多行人走来走去。
Sora:
可灵:
效果一目了然,咱就不拿Sora来比较了,较为清楚的看到可灵生成的视频脸部稍微有点崩,但是MiniMax没有崩,不过颜色更为鲜艳了点。摄像机跟在一辆黑色车顶架的白色复古SUV后面,它在陡峭的山坡上沿着松树环绕的陡峭土路加速行驶,灰尘从轮胎上扬起,阳光照在越野车上,在土路上加速行驶,在现场投下温暖的光芒。这条土路弯弯曲曲地延伸到远处,看不到其他的汽车或车辆。道路两旁的树木都是红杉,点缀着一片片绿色植物。从后面看到的汽车跟随曲线轻松,使它看起来好像是在崎岖不平的地形上行驶。土路本身被陡峭的丘陵和山脉包围,上面是清澈的蓝天和缕缕的云。
这三组比下来,MiniMax的文生视频的整体能力要比可灵更好,当然,也是因为可灵的舒适区是在图生视频领域,文生视频能力还是差了点意思。整体测试下来,MiniMax最让人惊艳的点是在于,视频中所有的画面主体,几乎不会发生剧烈形变或者崩坏,生成的颜色也更为艳丽。
目前MiniMax推出的abab-video-1视频模型已经上线网页版海螺AI。
且免费
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。