起码在抽象这块,AI视频永远无法取代人类

体娱   2024-08-23 23:41   江苏  


文丨千里茜 审核丨菜包

排版丨鹿九


近两年生成AI技术发展迅猛,从两年前最开始的AI图,到今年年初的sunoAI音乐,最后终于到了这几个月新鲜的AI生成视频。许多专家学者曾经在两年前预言,AI是未来的希望是提高生产力的重要工具,那想必现代的人类一定在好好利用AI提高生产力吧,让我们看看他们在用最新的AI视频做什么:


(慈禧玩手机)


人类的创造力和想象力被严重低估了,当有人觉得AI可以取代人类的时候,不妨看看人类最近在整什么活:


(模仿AI)


AI不能理解人类的抽象,一点都不能。


人类有三大欲望,食欲,x欲和睡眠欲,而其中“吃”是把AI的CPU给干烧了的罪魁祸首。当人们看到AI出的图里有五根手指握筷子,甚至关节错位,手伸到汤里吃面条的时候,AI技术发展迭代其中的一个目标,便是有必要让AI充分理解吃是怎么一回事。



很快,各个AI领域的专家用了一年多的时间终于让AI初步理解了“吃”,AI生成的图终于好看了那么一点,但今年是2024年,图已经out了,该炼炼视频了。


无论AI的图多么精美,“吃”永远才是人们判断AI是否牛x的标准,当6月快手的国产可灵视频生成大模型横空出世,人们先质疑再质疑,你有本事来段吃饭的视频呢?面对质疑,他们端出了一段吃汉堡的视频。



虽然有些许瑕疵,还是能看出有些假的,但不仔细看确实不会在意,这下人们终于对AI彻底放下了心,也彻底放飞了自我:看来AI已经完全理解“吃”了,那咱们整点平时吃不到的,来盘凉拌见手青尝尝咸淡:



吃电子菌子,中赛博病毒,几万人一同见小人想想还是挺带感的,最关键的是这玩意还是安全的。



当然人类对吃的探索肯定不仅限于这些简单的东西,只不过因为各种各样的原因,人类无法去尝试,AI的出现终于让人们吃到那些以前吃不到的东西了,比如意大利面拌42号混凝土:



目前的视频生成大模型主要玩法基本一致,可以选择一张图或者一段视频作为素材,然后通过文字描述让AI在素材基础上生成符合文字描述的视频,即便是AI不理解,也会按照人类的要求把意大利面和42号混凝土放一起。


AI表示虽然我不能理解你们人类的抽象,但反正我不吃。


(口  感  极  差)


食欲之后是睡眠欲,人类的梦有很多,如果问最大的梦是什么,恐怕还得回到最开始。无论是最开始的文字,还是后来的图片,直到视频,人们总希望过去的时光能够倒流。21年左右,人们用现在更先进的AI技术修复照片和视频,最好……让他们动起来。


到了今年可灵AI出现后,最开始流行的,同样是把老照片当素材,让里面的人活过来。对于人来说,AI一开始的用处也许就是“让人复活”。chatgpt对话模型训练加上声音模型训练再加上如今的视频,数字生命的构想确实一点一点在变成现实,但是……



接下来还有很长的路要走,这种东西起码现阶段还是自欺欺人的,是一个遥不可及的梦,所以不如让它别太严肃伤感回归娱乐吧。于是老照片还是那个老照片,但里面的人会干什么就由不得他了。什么慈禧?慈禧也得跟着我们吃面玩手机。


AI视频生成模型其实并不是新鲜玩意了,2023年就已经有Runway模型,和Stable AI本家的Stable video diffusion,但那时的模型还并未成熟,彼时的AI只能进行图像识别,应用领域主要在抠图这块。



直到2023年底,RunwayGen2模型推出,不仅能识别图像还能让图像动起来,AI生成视频的雏形出现。


三个月后,OpenAI的Sora文生视频大模型推出,可以通过纯字符生成视频,我们如今熟悉的AI生成视频才算是真正开始了它的故事,如今国外的AI生成视频工具五花八门,后来的Pika,Wonder Studio等等,都是相当不错的工具。



也许你会问,既然年初就有了,怎么感觉这段时间才火起来呢?那毕竟在这之前上述这些模型都是国外的,语言问题不谈,翻墙和会费的门槛对于国人来说开始太高了。


一直到今年6月6日,快手的可灵视频生成大模型才横空,不仅基本功能和国外的模型几乎相同,使用门槛相对低很多,最重要的是它和后来抖音的dreamina一样,大部分功能都是免费的,虽然可生成的视频时长较短,但也足够让人玩出花了。


随着AI视频逐渐火热,如今人们需要让AI理解的不再仅仅是吃和老照片“复活”这种简单的东西,而是人类抽象的本质,就像泛式与瓶子在AI中的激情战争。



让原本打的不可开交的人瞬间回归相亲相爱,最后大家坐一起吃面条,AI不能理解但只能硬着头皮按照需求生成视频,最终的成品中的人们打到一半的愤怒脸瞬间变成笑脸,虚空中掏出一碗不知道哪来的面条,带着假的不能再假的表情吃下了面条。


这种虽然我不知道为什么,但甲方要求了,只能硬着头皮做,最后做出来一个抽象产品的感觉很是奇妙,尤其是当你看到了视频最后由于无法理解,没办法用逻辑去串,只能从虚空中拿出面条的时候,这种诡异又抽象的搞笑感让人欲罢不能。



正当我饶有兴趣地刷着这类短视频时,更加抽象的东西来了……人类开始反向故意模仿AI生成视频。


虽然你很清楚这就是史,但这种吃了拉又吃下去再拉一次的产物远比原来的AI视频更加抽象,人们也纷纷开始模仿起这种AI视频,甚至在为了怎么看起来更像AI上较起了劲,冲突更强的反转,更加毫无逻辑的展开,各种虚空出现的物品……



看到这我相信,接下来的AI无论怎么发展,是不是人们提高生产力的工具已经不重要了,它能让人类脑子里那些更抽象的想法变成现实这就够了。不过这回又该轮到AI不理解了,人类到底为什么闲着没事要干这种没营养的事呢?其实人类自己也不理解。



 往期推荐 点图可阅 

七十几个网红大逃杀,把擦边女主播关进笼子拍卖?

“分不清游戏与现实”,是对现代玩家最恶毒的诅咒?


扫描下方二维码关注 情报姬 获得更多一手资讯

也欢迎大佬找姬投稿哦~ 投稿邮箱:crsq477@163.com

点击这里,给我好看


情报姬
为二次元发声!
 最新文章