都说“耳听为虚,眼见为实”,但在AI技术井喷的时代,你看到听到的一切可能都是假象。
11月9日,湖南公安通报一起AIGC(人工智能生成内容)诈骗案件。一位老人在手机营业厅进行视频通话,视频里有位身穿警服的男子称老人涉嫌违法犯罪,需要配合警方进行资金核查。神色慌张的老人正准备根据指引缴纳所谓“犯罪款项”,引起了巡逻义警的注意,这才阻止了一起诈骗。
老人与“警察”视频通话截图。图源:“湖南公安”微信公众号
其实,这是骗子利用警方在网上公开的照片、视频,通过AI换脸技术冒充“警察”而成的把戏。
如今的AIGC正在快速迭代,图片、音频、视频似乎无所不能。从“明显假”到“真假难辨”再到“以假乱真”,在泛娱乐内容当道的短视频平台,AIGC为网友们提供了情绪价值,但有些内容似乎“跑偏”了,还给不少人带来了困扰。
只需10秒,AI就能“偷走”你的声音
前不久,“雷军AI配音”相关视频在网络掀起风波。在网传视频中,小米公司创始人、CEO雷军的声音特征的语音内容“锐评”假期堵车、年轻人赖床、游戏外挂等话题。
如果仅仅是对热门话题的调侃或“心灵鸡汤”倒也罢了。部分AI配音视频用词较为过激,甚至还含有粗俗言论。有网友说“切换到每个软件都在被雷总追着骂”。
“雷军AI配音”相关视频
其实,这些发言和雷军本人并无干系,而是AI配音生成。记者搜索发现,目前市面上有大量AI配音的在线插件或小程序,用户只需选择相应的人物声音并输入文字,最快只需10秒,便可借用他人的声音发表言论。
有些软件甚至提供了更加“灵活”的创作空间,能克隆任何音色。在一个开源网站上,导入一段45秒内的人声音频用于训练模型。等待几分钟后,即可通过输入文字生成任意音频内容。
除了雷军,被“偷走”声音的公众人物还有不少。
今年9月底,一段据称是某直播平台老板卢某某的酒后录音在网络上流传,卢某某在录音里表现出对消费者的傲慢,以及对相关人士的不尊重,为该平台招致了不小的争议。
警方调查发现,音频系通过深圳某科技公司开发的模型伪造。嫌疑人上传卢某某此前直播片段的约30秒录音,就完成克隆,输入文本后生成网传视频。
“只需一段话,克隆任何声音”?记者在多个电商平台发现,有的网店或个人账号提供“AI克隆声音”的软件售卖或生成语音服务,标价在几元至几十元不等,支持方言和多种外语。
记者向其中一家店咨询,客服表示提供声音素材即可进行克隆,根据声线数量及生成音频字数(长度)综合收费,但不得商用。
不仅如此,AI变声的技术还可以进行实时转换。B站知名UP主、北京师范大学法律硕士周伟华(网名“第七翼刀”)就做过一期关于AI换脸、变声的实验视频。
在视频里,周伟华将自己的照片和音频通过AI进行训练,并邀请一位发型、口音和自己相仿的男性朋友,登录在线会议与自己的同学进行视频通话。在480P的画质里,“假脸”和“假声”几乎能做到音画同步,一招“瞒天过海”成功骗过对面的同学,也让评论区的网友大开眼界。
真人(左)和AI换脸后(右)对比。图源:B站UP主“第七翼刀”
AI玩过界可能涉嫌违法
“网友都喜欢有趣的内容,名人效应加热门话题的打法,很容易被算法推荐。”一位活跃在多平台的萌宠自媒体达人熙熙(化名)从创作者视角,给出了自己的看法。
熙熙说,自己在剪辑视频时为了增加戏剧性和互动性,也会使用AI配音给宠物“加戏”,让宠物用人类的口吻对话,“AI配音比较容易玩梗,视频数据确实好了很多。”
很多网友也表示,AI变声能够降低自己在视频里使用原声的“羞耻感”,再加上模糊五官和脸部轮廓的滤镜,“有种平静的疯感”。
被广大网友追捧的黄瓜特效
配音软件里的不同音色
配音软件里的不同音色
小方的通话记录。图源:受访者
小方和家人的聊天记录。图源:受访者
多个互联网平台添加AIGC内容相关提示
为了从内容源头进行引导和规范,陈光文律师认为,内容平台应该通过技术与人工审核相结合的方式,加强AIGC相关内容的监管。此外,平台有责任向用户宣传知识产权保护、人格权保护等相关法律知识,告知用户内容侵权及违反公序良俗造成的后果,让AI内容更为规范。
当然,AI并不可能自行开展无秩序、无底线的内容创作,目前AIGC的导向仍牢牢把握在训练模型的人类手里。业内人士建议,应加强AI反制技术研究,“以AI制AI”,以“道高一丈”去对抗“魔高一尺”。
以AI合成声音为例,清博智能学研院副院长郝雅婕向潮新闻记者介绍,在波形分析中可以看出AI语音特殊的频谱特征,例如高频细节较少、自然噪声不足等。并且,AI语音的波形往往有较为平滑的过渡,真人语音的波峰和波谷则会更明显。
从直观的听觉感受来说,真人语音的节奏停顿会依语境情绪而改变,但AI语音可能会有一些断句不合理的地方,并且句子间没有明显气口。这样的感触在真人与AI语音对话时会有比较明显的感受。这些都可以成为我们鉴别真伪的方法。
“目前一些专业的语音分析工具可以用于辅助识别AI音频,但仍需要不断提高精度,以适应不断进化的AI合成技术。”郝雅婕认为,规范AIGC的道德和法律界限需要多管齐下。在不久的将来,如果能建立起相关行业标准,在生成内容中加入“AI标识”或数字水印,对完善网络内容治理、促进生成式人工智能技术健康发展有极大好处。
此外,一些科技公司正加强对AI图像的反制研究,在公安、金融的视频认证场景已有应用。甚至一些智能手机都搭载了deep fake(深度伪造)检测能力,能识别视频通话中的AI换脸,并弹出相关提示。
AIGC的主场,在当下,更在未来。持久的行业竞争将刺激内容平台参与者加快技术创新的脚步,裂变出更多可能。不论AIGC是用于娱乐还是创作,都需要为人类向好向善服务,才能实现行业的长足发展。
而对于广大网民来说,无论是听新闻、接电话还是刷视频,不妨多留一个心眼,“眼见不一定为实,有图不一定有真相”,冷静分析综合判断,必要时拿起法律武器保护自己的权益。
精彩回顾