别笑,你可能也分不清这些视频是不是AI的。
科技
2024-10-08 15:01
山西
大数据文摘受权转载自数字生命卡兹克
作者::卡兹克、小瑞
昨天,我和我的小伙伴们都拜倒在了一个AI视频的测试下。我,一个专门做AI的自媒体,在一顿狂点之下,轻敌了,堪堪拿了60分。。。我的小伙伴,有不及格的,有70分的,但是最高的那个也才90分。你们可以评论区留言猜一下,谁是AI谁不是AI,反正我看的快眼花了。友情提示:这三不是全AI,是真有一个是真实的视频。只能说,AI要是真的想骗我,有时候真的一骗一个准,我还得摇着脑袋说,这肯定不是AI。我们都尚且如此,更不用说对AI不是那么关注的普通人了。比如之前一个案例,一个由“AI马斯克”背书的一家所谓的外汇公司轻松骗走了一名82岁的退休老人69万美元(大概495万元人民币)的毕生积蓄。还有B站UP主滤镜粉碎机拍的视频,用AI口型驱动后的自己,骗走了老妈的2万块钱。7月份,在X上还有个视频非常的火,就是所谓的拜登退出总统竞选后首次发表视频讲话。
防不胜防,真的,当现在AI视频越来越逼真,在口型驱动、AI换脸技术几乎快没有任何门槛的情况下,一些伪造的视频,对一些对AI不太了解的人,几乎就是降维打击,难以分辨。现在做这种视频,真的很简单,去年这种技术火起来的时候,就是2D数字人还有heygen那套让霉霉说中文,让郭德纲说英文,普通人用起来,还稍微有点难度,效果也没那么好,语音不够真,唇形也有破绽。一年以后,门槛几乎已经被拉到了0,而且效果也走到了你不仔细识别真假难辨的地步。你直接上传一段念123456的视频,再加一段配音,直接就用AI对完口型完事。就跟很久以前影视圈的那群Idol一样,不背台词上来念123456,再后期配音。
现在AI更近一步,直接把这种技术,下放给了所有普通人。现在已经不知道有多少带货的短视频,是用12345+AI换出来的了,抖音上刷到太多太多了。还有比如剪映里,有个视频翻译,你只需要上传一段你自己的视频,它就能把你说中文的声音,翻译成另外5种语言,口型还一模一样。
但是我觉得,做归做,在如今法规不完善的情况下,知道如何识别是否是AI换口型做出来的AI视频,还是有必要的。
有两个我自己认为比较实用,也是可能为数不多的方法。
我大概用一个故事来解释一下这种换口型的原理。用张三来举例子吧。
比如张三这哥们,最近迷上了做木偶戏。木偶戏本身都是肢体艺术,但是张三想更近一步,让观众看到木偶好像在说话。于是,张三想到了一个很抽象的办法,先录下自己说话的声音,然后用橡皮泥给木偶做一个能动的嘴巴。他把这个橡皮泥的新嘴巴安在木偶脸上,然后根据录音的节奏移动木偶的嘴巴,以便跟说话时候的口型对齐。AI对口型技术和这个木偶戏很像。它先找到视频中人物的嘴巴,然后根据声音创造一个新的会动的嘴巴,最后把新嘴巴"安装"到原来的脸上。这种假嘴巴,如果你细看的话,还是会发现一些问题的,比如嘴巴周围可能有点模糊,像是用橡皮擦蹭过的那种感觉。一些技术不是很好的AI对口型,他的嘴巴跟踪做的不是很好,还会产生轻微的抖动现象。最有效的,还是认真看牙齿,至少现在的AI,还达不到那种完美一致性的牙齿的动作和物理效果,经常会产生一些奇奇怪怪的BUG。比如霉霉这个AI视频。
这个东西你只要有心留意,或者只是多看几遍,肯定能还是能感觉的出来的。这个对于每次都上传新的视频片段的做法是无效的,因为每次都是实拍换口型而已,但是可以有效的鉴别2D数字人。比如这个Reid Hoffman和自己AI分身访谈的视频。你会发现,这个AI分身翻来覆去就那么几个重复的动作。
一些做的不是特别好的2D数字人,因为动作匹配算法不是很好,还会有一些莫名其妙的耸肩、点头或用来强调的手势,说话时目光游离,不自然的眨眼等等。就是你能明显的感觉到,一些肢体动作是完全不匹配你的说话的重音和节奏的。但是有些做的好的,你可能看不出来,这时候,就需要你去数对方的动作了。因为2D数字人做法,是你录一段3~5分钟的视频,这个视频里会包含一些动作,后面你不管怎么驱动,其实动作都是从这3~5分钟的原始片段里去取。这个就是识别AI视频,或者说AI数字人的一个为数不多的识别方法了。显然,类似的AI伪造视频,在社交媒体上,只会越来越继续增长。X上已经快被类似的视频淹没了。没有门槛,足够整活。在法规不完善的今天,你拿这些“创作者”也没有任何办法。但是,我觉得让普通人都知道、了解这项技术,可能是对抗一些不法分子的最有效的途径之一。
谷歌被俄罗斯罚款2,500,000,000,000,000,000,000,000,000,000,000,000美元