韩国N号房卷土重来，这一次是Deepfake，波及超200所学校

职场 2024-09-04 08:42 浙江

金磊一水发自凹非寺
量子位 | 公众号 QbitAI

Deepfake（深度伪造），再度深陷舆论的风波。

这一次，用这项AI技术犯罪的严重程度被网友直呼是“韩国N号房2.0”，魔爪甚至伸向了众多未成年人！

事件影响之大，直接冲上了各大热搜、热榜。

早在今年5月，《韩联社》便通报过一则消息，内容是：

首尔大学毕业生朴某和姜某，从2021年7月至2024年4月，涉嫌利用Deepfake换脸合成色情照片和视频，并在通信软件Telegram上私密传播，受害女性多达61人，包括12名首尔大学学生。

仅是这位朴某便用Deepfake合成了大约400个色情视频和照片，并与同伙一起分发了1700个露骨的内容。

然而，这件事情还是Deepfake在韩国泛滥的冰山一角。

就在最近，与之相关的更多细思极恐的内幕被陆续扒了出来。

例如韩国妇女人权研究所公布了一组数据：

从今年1月1日到上周日，共有781名Deepfake受害者在线求助，其中288名（36.9%）是未成年人。

而这个“N号房2.0”也是非常恐怖的存在。

据《阿里郎》进一步的报道：

一个与Deepfake相关的Telegram聊天室，竟吸引了220000人，他们通过篡改妇女和女孩的照片来创建和分享伪造的图像，受害者包括大学生、教师，甚至是军人。
不仅是受害者有未成年人，甚至加害者也有大量的青少年。

不仅如此，这次舆论的兴起过程也是非常的drama。

因为肇事的韩国男性们（以下简称韩男）可以说是非常的猖獗，有舆论苗头的时候，他们就会稍微“克制”一下：

有些韩男对这件事的态度也是较为恶劣，甚至有初中男生开公开写到“不用担心，你不够漂亮，不至于被Deepfake”这种话。

于是乎，韩国女性们（以下简称韩女）的反击开始了。

她们将“阵地”转向韩国之外的社交媒体，例如在X上，有人发布了制作Deepfake学校的地图：

还有韩女在微博中发布“求救贴”：

随着舆论在各大社交媒体上发酵，韩国政府也出面做出了表态：

目前已经有超过200个学校收到Deepfake影响；计划将Deepfake犯罪的刑期从5年提高到7年。

据了解，韩国警方已成立特别工作组，专门应对深度伪造性犯罪等虚假视频案件，该工作组将运行到明年3月31日。

Deepfake已逐渐进化

事实上，最新Deepfake技术已经进化到了“恐怖”阶段！

生图AI Flux以一组真假难分的TED演讲照片，引千万𝕏（前推特）网友在线打假。（左边由AI生成）

深夜直播的“马斯克”，也吸引了上万群众围观打赏，甚至搞起了网友连麦。

要知道，整场直播仅用一张图片就能实现实时换脸。

这一切果真如网友所言，Deepfake已将科幻照进现实。

其实，Deepfake一词最早起源于2017年，当时一名Reddit用户“Deepfakes”将色情女演员的面部替换成了一些美国知名演员，引起一片争议。

而这项技术可以追溯到2014年，Goodfellow与同事发表了全球首篇介绍GAN的科学论文。

当时就有迹象表明，GAN有望生成仿真度极高的人脸。

后来随着深度学习技术的发展，自动编码器、生成对抗网络等技术逐渐被应用到Deepfake中。

简单介绍下Deepfake背后的技术原理。

比如伪造一个视频。

其核心原理是利用深度学习算法将目标对象的面部“嫁接”到被模仿对象上。

由于视频是连续的图片组成，因此只需要把每一张图片中的脸替换，就能得到变脸的新视频。

这里要用到自动编码器，在应用于Deepfake的情况下输入视频帧，并编码。

△图源：维基百科

它们由编码器和解码器组成，编码器将图像减少到较低维的潜空间，解码器从潜表征中重建图像。

简单说，编码器将一些关键特征信息（如面部特征、身体姿势）转换成低维的潜在空间表示，而解码器将图像从潜在表示中恢复出来，用于给网络学习。

再比如伪造图像。

这里主要用到生成对抗网络（Gan），它是非监督式学习的一种方法，通过让两个神经网络相互博弈的方式进行学习。（此方法也可以用于伪造视频）

第一个算法称为生成器，输入随机噪声并将其转换为图像。

然后，该合成图像被添加到真实图像流（例如名人图像）中，这些图像被输入到第二个算法（称为判别器）中。

判别器试图区分样本来源于真实还是合成，每次注意到二者之间的差异时，生成器都会随之调整，直至最终再现真实图像，使判别器无法再区分。

然而，除了让外观上看起来无法区分，当前的Deepfake正在施展“组合拳”。

声音克隆也升级了。现在，随便找一个AI工具，只需提供几秒原音，就能立马copy你的声音。

用合成声音伪造名人的事件也层出不穷。

此外，1张图生成视频已不再新奇，而且目前的工作重点在于后续打磨，比如让表情、姿势看起来更自然。

其中就有一项唇形同步技术（Lip syncing），比如让小李子开口说话。

‍

如何识别Deepfake？

虽然Deepfake现在已经很逼真了，但下面还是给大家介绍一些识别技巧。

目前网络上大家讨论的各种方法，归纳起来就是:

不寻常或尴尬的面部姿势
不自然的身体运动（肢体畸变）
着色不自然
音频不一致
不眨眼的人
皮肤的衰老与头发和眼睛的衰老并不相符
眼镜要么没有眩光，要么有太多眩光，并且无论人如何移动，眩光角度都保持不变。
放大后看起来很奇怪的视频
……

得，列文虎克看了直呼内行，不过单凭肉眼观察着实有点费人了！

更高效的方法还得是，用魔法打败魔法——用AI检测AI。

国内外知名科技企业均有相关动作，比如微软就开发了一种身份验证工具，可以分析照片或视频，并对其是否被操纵给出评分。

OpenAI此前也宣布推出一款工具，用于检测由AI图像生成器DALL-E 3创建的图像。

在内部测试中，该工具在98%的时间内正确识别了DALL-E 3生成的图像，并且能以最小的影响处理常见修改，如压缩、裁剪和饱和度变化。

芯片制造商英特尔的FakeCatcher则使用算法分析图像像素来确定真假。

而在国内，商汤数字水印技术可将特定信息嵌入到多模态的数字载体中，支持图像、视频、音频、文本等多模态数字载体。官方称这种技术能保证超过99%的水印提取精度，且不会损失画质精度。

当然了，量子位此前也介绍过一种很火的识别AI生图的方法——调整饱和度检查人物牙齿。

饱和度拉满下，AI人像的牙齿就会变得非常诡异，边界模糊不清。

Science发文：需要标准和检测工具

就在昨天，Science也发表了一篇文章对Deepfake进行了探讨。

这篇文章认为，Deepfake所带来的挑战是科学研究的完整性——科学需要信任。

具体而言，就是由于Deepfake逼真的造假、以及难以检测等原因，进一步威胁到对科学的信任。

而面对这一挑战，Science认为应当“两手抓”，一是使用Deepfake的技术道德标准，二是开发精准的检测工具。

在谈及Deepfake与教育发展的关系时，文章认为：

尽管Deepfake对科学研究和交流的完整性构成重大风险，但它们也为教育提供了机会。
Deepfake的未来影响将取决于科学和教育界如何应对这些挑战并利用这些机会。
有效的错误信息检测工具、健全的道德标准和基于研究的教育方法，可以帮助确保Deepfake在科学中得到增强，而不是受到Deepfake的阻碍。

总而言之，科技道路千万条，安全第一条。

One More Thing

当我们让ChatGPT翻译相关事件的内容时，它的反应是这样：

嗯，AI看了都觉得不妥。

参考链接：
[1]https://en.yna.co.kr/view/AEN20240826009600315
[2]https://en.yna.co.kr/view/AEN20240828003100315?input=2106m
[3]https://en.yna.co.kr/view/AEN20240829002853315?input=2106m
[4]https://www.arirang.com/news/view?id=275393&lang=en
[5]https://www.science.org/doi/10.1126/science.adr8354
[6]https://weibo.com/7865529830/OupjZgcxF
[7]https://weibo.com/7929939511/Out1p5HOQ

推荐阅读点击标题可跳转

1、机器学习中的样本重要性权重 (Importance Weight)

2、终于有人将Transformer可视化了！

3、谷歌SRE工程师打拼9年：年薪超60万美元、钱赚够了、对技术不再那么热爱

Python开发者

点击获取精选Python开发资源。「Python开发者」日常分享 Python 相关的技术文章、实用案例、工具资源、精选课程、热点资讯等。

我用免费大模型DIY了个作业批改助手，手机端可用！

Python即将成为TIOBE 2024年度编程语言

劝大家早点拿下软考证，风口已经很明显了

哗然！MIT教授NeurIPS演讲公开歧视中国学生，大会官方认错、本人道歉

分享 7 个用 Python 开发成的数据库

GitHub 公开评测，国产 AI 表现……

GitHub谎报了Copilot的统计数据！两年了，我们还是没办法证明AI编程助手能提高代码质量

再用 `print` 进行 Python调试，你就OUT啦！

惊掉下巴！被字节起诉800万实习生，拿下NeurIPS 2024最佳论文

Python 3.13 中的 7 个新类型特性

最强图解微型神经网络--多层感知器

美国教授痛心：UC伯克利GPA 4.0计算机本科生，毕业即失业？ML博士直呼太卷后悔转行

三种 Transformer 模型中的注意力机制介绍及 Pytorch 实现：从自注意力到因果自注意力

字节起诉前实习生，索赔 800 万

吴恩达出手，开源最新Python包，一个接口调用OpenAI等模型

信息论、机器学习的核心概念：熵、KL散度、JS散度和Renyi散度的深度解析及应用

陪你一起刷题面试，字节跳动又出了一款新工具

失业小哥在父母卧室做AI应用，日入2万刀！晒账单爆火全网，AI初创价值3500万

B站知名up主何同学被指盗用开源项目——网友锐评「移源丁真：鉴定为自研」

太荒谬了！千人公司一刀切禁用 JetBrains，非俄籍“备胎” VSCode 上位

强烈建议尽快搞个软考证！（重大利好）

阿里全球数学竞赛决赛结果公布，姜萍违反预选赛规则未获奖

裁员了，很严重，今年千万别离职

用Python实现十大经典排序算法(附动图)

字节回应大模型训练被实习生攻击

Python协会曝出丑闻：49万元被“熟人”挪用，发现时账户仅剩183元，险些破产

裁掉数千人、把工作外包给 AI！一年多后，这家巨头的 CEO 恳求无人搭理，预算还要超 5 亿？

Python3.8即将结束生命周期

时间序列特征提取：从理论到Python代码实践

OpenAI canvas一夜封神！超强AI编码研究神器，ChatGPT再次颠覆人机交互

一文让你搞懂 Python 的 pyc 文件

刚刚，诺贝尔物理学奖颁给AI教父！

深度学习六十年简史

17岁开发 AI 应用，4个月入账700万，开学第一天晒账单火了

腾讯居然还自研了 Git 客户端，也是没想到…

开源 9 年后，词频数据库 wordfreq 宣布停止更新，创始人：网上全是垃圾，OpenAI 和谷歌要为此付出代价

突发！高通拟收购英特尔；大连思科再裁员，补偿 N+7

谢尔盖布林：谷歌不敢用Transformer，作者剩一人了，现在我每天都在写代码

PyTorch官宣：告别CUDA ！

“神仙外企”、“IT养老院”前员工忆往昔：曾经是乌托邦、工资多得花不完只能买房

3个完美替代 Navicat 的工具，香！

又一款 AI 编码工具火出圈！OpenAI 投资、碾压 VS Code、8 岁女孩用它 45 分钟就能构建一款聊天机器人

韩国N号房卷土重来，这一次是Deepfake，波及超200所学校

谷歌SRE工程师打拼9年：年薪超60万美元、钱赚够了、对技术不再那么热爱

机器学习中的样本重要性权重 (Importance Weight)

谷歌推世界首个AI游戏引擎，2000亿游戏产业恐颠覆！0代码生成游戏，老黄预言成真

突发！IBM中国研发岗访问权限一夜关闭，千人或被裁

终于有人将Transformer可视化了！

下载量超 5000 万的知名应用，开发团队“全军覆没”，从此发版人唯剩老板一个

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉

韩国N号房卷土重来，这一次是Deepfake，波及超200所学校

金磊 一水 发自 凹非寺量子位 | 公众号 QbitAI

Deepfake已逐渐进化

△图源：维基百科

如何识别Deepfake？

Science发文：需要标准和检测工具

One More Thing

金磊一水发自凹非寺
量子位 | 公众号 QbitAI