三只羊的录音门事件,AI如何合成的

科技   2024-09-30 08:00   重庆  
感谢阅读,我是江枫,专注AI,编程,副业领域。
关注公众号可领取一份大礼包,包含AI/python/副业 资料。


最近最大的新闻瓜,莫过于三只羊的录音门事件。录音一公开,引起全网热议。三只羊被骂上热搜


不过最近合肥市公安局发出了通告



经过调查,这个录音是AI合成的。不是真人语音。


大家都在分析这么牛逼的录音是用什么AI软件合成的时候。有公司跳出来亲自解释了。并且公布了调查证据书。


说实话,这家公司我还真没听说过。不过既然人家都发通知了,我决定上去试一把。看看真实的技术如何


登录官网,这段广告词写得挺不赖:想象力的极限,远非声音的极限。是在内涵谁么



然后还有一条更新跳出来。99.9%的音色与情感还原度。看上去很牛逼。


首先,需要导入一段语音作训练。我选择了英语:浴血黑帮 中的一段语音来作为训练


原语音:



然后在添加角色中上传该语音文件进行训练


训练完成后,这时需要上传一段文本来生成语音。既然是截取的英剧对白。那就用莎士比亚的一首诗来生成声音,看看效果如何


文本

Shall I compare thee to a summer's day? 

Thou art more lovely and more temperate: 

Rough winds do shake the darling buds of May,And summer's lease hath all too short a date:Sometime too hot the eye of heaven shines, 

And often is his gold complexion dimm'd; 

And every fair from fair sometime declines, 

By chance or nature's changing course untrimm'd;But thy eternal summer shall not fadeNor lose possession of that fair thou owest; 

Nor shall Death brag thou wander'st in his shade,When in eternal lines to time thou growest: 

So long as men can breathe or eyes can see,

 So long lives this, and this gives life to thee


插入文本后,进行语音生成



AI生成后的语音效果:



怎么说呢,前面十几秒还是不错的,到后面语音就走样了。语气,语速都变样


看起来用平台上的音效生成功能,达不到完全逼真的效果。如果对某个人声经过长时间的训练。也不是没有可能


但在这家公司平台上也没找到有开源模型训练的入口。合成三只羊录音门事件这么一段逼真的语音,技术难度不小。


这家公司也就成立一年多,在业界也没听说过。不少网友对此表示了质疑。



三只羊录音门事件还会不会有进一步的发展,等官方的通告吧。



写在最后

这段录音是完全合成还是部分合成,通告中并没有明确说明。我感觉完全合成的难度太大。


这个事件细想一下还是比较恐怖。真的是以假乱真了。相关AI语音合成,语音生成工具,应该需要更严格的法律约束才行。



我是玩AI的程序员,更多AI有趣的玩法关注公众号,可领取一份大礼包,包含AI/python/副业 资料。

AI时代大有可为,对AI工具,AI智能体,AI赚钱感兴趣的欢迎添加vx交流。

程序猿玩AI
玩AI的程序猿: 江枫,专注AI工具,AI副业,AI智能体,分享AI新闻
 最新文章