首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

三只羊卢总的录音AI到底能不能做出来？我的答案是：当然能。

科技 2024-09-29 14:01 山西

大数据文摘受权转载自数字生命卡兹克

作者：卡兹克

今天凌晨，N多人给我发了一张图，说警方通报了，问我到底怎么看三只羊录音是不是AI这事。

还有朋友跟我说，有个号称国内AI第一人的，之前信誓旦旦的说这录音必不可能是AI，AI做不出来。所以这个通报背后，会不会背后是有些阴谋论？

我差点都喷了，国内AI第一人？我第一反应是院士也下场参加这种无聊的事了？

然后查了一下...哦.....算了不提了。

我觉得我有必要科普一下，就是AI到底能不能做到三只羊卢总录音级别？

我可以明确的给你一个回答，是：能。

先简单说下前情提要。

三只羊跟辛巴有一段乱七八糟的风波，反正就是互相掐架，你来我往，好不热闹。

然后风波正甚时，三只羊董事长卢文庆的一段炸裂的录音被全网疯传。

就是这个，我做了删减，其中一些不雅片段我也全部消音处理了。

内容炸裂不堪入耳，信量极大且内容十分惊人，其中涉及权斗、出轨等等等，总结一下就是卢总自爆和三只羊所有女主播有过不正当的关系。还点名看不起张一鸣。。。

大概就是这么个事，然后三只羊就举报了，说这录音是AI合成的。

网上就吵得不可开交了，大部分人最大的理解就是，AI做不出来这种级别的录音，为什么？因为那个“国内AI第一人”说的。

这段录音听着很真实对吧，有情绪有方言有杂音，所以问题其实就是两个，这段录音，到底是不是AI做的？以及，AI到底能不能做到这种级别的录音？

第一个问题，今天已经有了答案，我永远无条件相信我们的公安，他们发布的通报，我也相信就是事实，这个没有任何可以争议的。所以第一个问题的答案相当明确，那就是AI做的。

那么第二个问题，最关键的来了，AI到底能不能做到这种级别的录音。

我的答案，当然能。

首先，我需要在这里科普一下，AI是个大类，而在细分里面还有很多赛道。

有语言大模型（GPT、Claude、豆包等等），有AI绘图（MJ、SD、FLUX等等），有AI音频（11Labs、SVC、GPT-Sovtis、Suno等等）、有AI视频（Runway、可灵、豆包、Pixverse等等）、有AI 3D（TripoAI、Meshy等等）。

而AI音频里，又分为AI生成音乐、AI生成音效、声音克隆。

这个录音，属于声音克隆这个赛道里面的。

所以不要说AI能做出来这个就比OpenAI比ChatGPT还要牛逼，都不是一个赛道的，有啥可比的，就像你说哇这个洗衣机洗衣服真牛逼，比那个冰箱还要牛逼。。。

而声音克隆，又分为两种：TTS（文本生成语音）、SVC（AI换声）。

TTS就是给一段一个人的人声，只要几秒几十秒的素材，就能训练一个AI模型，然后直接用文字就能生成特定人声音音频的语音合成，现在最好的开源项目应该是GPT-sovits。

SVC你就可以通俗的理解成AI换声，就是AI时代的变声器。现在AI变声器领域三个扛把子项目：So-vits-svc、RVC、DDSP。

OK，现在清楚在AI声音克隆领域，也有两种手段来实现声音伪造了吧。

TTS项目，优点是数据要求短，5秒的音频素材就行，就能克隆你的声音，后续只要给文本就能生成音频，成本极低效果极快。但是缺点就是，情绪、停顿、真实度的上限都很低，听个几十秒，就能非常轻松的听出来哦这个是AI味道。

而之前，大家觉得AI做不了卢总的音频伪造，都是先入为主的带入了TTS的思路，觉得一定是用TTS做出来的。

非常坦率的讲，TTS做卢总这种级别的音频，就我所知道的市面上公开的产品（不包括各大公司内部实验室的项目），确实有点难。

但是，思路打开，TTS做不了这个，但是SVC呢？

SVC的缺点，就是成本高，需要起步30分钟的音频数据集，然后跑几个小时的炼丹训练这个人的人声模型，最后还需要再找一个人录一段音频，再用SVC换声，把音色替换过去。

而优点就非常的直白了，这玩意能保留说话人的所有情绪、停顿、语气、方言等等等等，质量上限约等于无限，只要模型好，你根本听不出来这到底是不是AI的。

连歌声都可以无缝换声，换你个说话声音，简直就是个小case了好吧。

去年爆火的AI孙燕姿，就是拿svc做的。

我也写过好几篇关于SVC的教程。

用SVC做特定人物AI配音 - 你奶奶都会的AI声音教程

AI唱歌之终极喂饭教程 - SVC的极限就在这了

也给大家听一下，我用SVC换声后，用我自己的声音替换李荣浩的模特的效果。

这是AI直出，我只加了背景音乐。

这就是SVC。

所以用SVC做卢总的AI音频伪造，步骤也很简单。

1. 从网上收集卢总的30分钟左右说话数据，这个很好找，毕竟他是名人。

2. 用SVC或者RVC，把卢总的声音清洗完，训练成一个AI模型。

3. 卢总是安庆人，合肥那边安庆人很多，找一个跟他口音差不多的，把需要合成的音频自己先念一遍。

4. 最后用SVC的AI模型，把念完的音频替换成他的声音。

女声同理。

至此，完毕。

如果你还想听着真实一点，就用剪映啥的加点风噪环境音，太多了，随便找，你要环境音，传统音频软件能处理，当然，你也可以拿着带环境音的数据集进去训练，虽然我不推荐这么做。。。

特别是原视频那个方式，是把录音发到手机上，再用手机播放，用另一台手机来录，本身环境音就一堆了，还夹在着哥们背景笑声，乱七八糟的。这都属于场外因素了。。。

所以，回到第二个问题，AI能不能做卢总那种的伪造录音？当然能。

不要把AI想的太神话，也别把AI想的太垃圾，人工智能，很多时候是人工+智能。

现在的TTS，解决不了情绪问题，那为啥非要让AI去搞定情绪？

你人工念完了换音色不就行了？这就是人工+智能。

思路打开，不要太局限。

AI是你的助手，是辅助工具，是让你用的，不是让你啥都甩给他当甩手掌柜的。

最后，我想声明一下。

我写下这篇文章，不是让大家去知道这个技术，而去犯法，做一些法外之事，成为法外狂徒。

而是希望做一个关于AI音频的小小科普，抹平信息差，让大家知道有这么个技术，上限就在这，不要觉得AI做不到就可以掉以轻心。而是要知道，现在的AI，可以达到什么地步，什么水平。

在人工+智能的加持下，能做到什么事情。

科技的进步是不可逆的，所有人都是这巨大洪流中的一滴水，只会被裹挟着前行，知道永远比不知道好，知己知彼，方能百战不殆。

我们学习很多东西，学习AI，很多时候，是为了保护我们自己。

还有，保护我们的家人。

然后，更好的生活。

黑色小圆动图分割线

租售GPU算力

租：4090/A800/H800/H100

售：现货H100/H800

特别适合企业级应用

扫码了解详情☝

点「在看」的人都变好看了哦！

http://mp.weixin.qq.com/s?__biz=MjM5MTQzNzU2NA==&mid=2651735711&idx=1&sn=2702dc2cea392f51c470caa1fa329312

大数据文摘

普及数据思维，传播数据文化

最新文章

深夜重磅！ChatGPT可以“AI搜索”了，但并不完美

谷歌被俄罗斯罚款2,500,000,000,000,000,000,000,000,000,000,000,000美元

OpenAI放弃自制AI芯片！伦敦场开发者日Hugging Face工程师现场“拷问”Sam Altman

想用AI特效在万圣节“鬼混”，看这一篇就够了。

AI + 影视，学会「避坑」再「吟诗」丨CNCC 2024

做AI捏捏，享赛博解压。

困扰18亿人的“全球干旱”，被AI更准确预测了

开源一夜崩塌：Linux无理由除名俄罗斯开发者。我们该醒了？

帮老外割草、送餐、保洁，中国服务机器人冲向海外

Character AI被起诉！14岁青少年自杀，AI陪伴何去何从

加强版Claude3.5正式上线，一句话操控电脑的时代真的要来了。

Transformer能否推理引争议，DeepMind连夜更新论文开源数据集：Transformer真的很强

Andrej Karpathy预言AI马太效应：差异只会越来越显著

“AI调解员”登上Science！Google DeepMind打造，“劝架”水平远超人类

台积电股价创历史新高，先进制程比想象中重要？

谷歌计划将 Gemini 并入 Deepmind，下个月开始生效

这个AI插件，想让你体验在浏览器上开挂的感觉。

对统计学“又爱又怕”，到底如何学统计？

科研那些事（万字长文，真诚分享）

创造历史，马斯克成功回收20多层楼高的星舰助推器

从广东看中华文明起源，《穿越磨刀山》以AI技术开拓考古新视野

苹果发文质疑：大语言模型根本无法进行逻辑推理

三星，正在自救

o1诞生对下一轮AI爆发的启示：技术远远没有收敛，仍在演进丨智源Workshop精华观点回顾

马斯克的Cybercab首秀！没有方向盘和踏板，26年量产，特斯拉这次又玩大的了

哈佛大学俩学生开发出一种 AI 眼镜，看你一眼就能扒光所有个人信息

AI 法力无边！物理诺贝尔奖颁给了 HNN 之父和深度学习之父

别笑，你可能也分不清这些视频是不是AI的。

两万字实录：大语言模型、提示学习与未来科技研发的交汇点

破纪录！OpenAI成为史上第一家估值万亿元的AI公司！独家融资协议：“别投对手公司”

是什么，缔造了英伟达神话？

ChatGPT上线全新功能Canvas - 我消灭你，与你无关。

为何马斯克的“盲视”不可能超越肉眼？

当代年轻人，在AI实现婚纱照自由

国庆从你的城市出发，5小时高铁最远能到哪

颠覆认知：大模型不可靠，越大越不可靠？最新研究登上 Nature

科研大佬投稿顶会的经验分享：时间安排、idea灵感、科研习惯

三只羊卢总的录音AI到底能不能做出来？我的答案是：当然能。

2024工博会最新洞察：机器人走向大负载，中国厂商从跟随到并跑

AI击败人类！DeepMind推出AlphaChip，几小时内即可生成“超人”芯片布局

Meta放大招，发布真AR眼镜！但让人“高”攀不起

腾讯 Robotics X 控制负责人郑宇近日离职，已加入优必选

OpenAI CTO深夜离职！Altman再发长文：感谢她做的一切，我将专注于技术和产品

热门视频：人形机器人一拳破次元！远程暴打沙袋和乒乓球

Sam Altman罕见发长文：ASI终将至，准备好迎接“智能时代”吧！深度学习是有效路径

Nature重磅：颠覆AI计算，提升460倍能效，新型分子忆阻器有望为Transformer提速

西安一高校老师实名公开举报！397页PDF痛诉同院老师学术不端，评审推诿包庇

世界气象组织最新报告：AI正在革新天气预报，更快、更便宜、更易获得

为人工智能赋予机器人躯体的“登月计划”项目，倒在具身智能热潮之前

科普之旅｜漫话智能体-当机器学会思考

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉