最近最大的新闻瓜,莫过于三只羊的录音门事件。录音一公开,引起全网热议。三只羊被骂上热搜
不过最近合肥市公安局发出了通告
经过调查,这个录音是AI合成的。不是真人语音。
大家都在分析这么牛逼的录音是用什么AI软件合成的时候。有公司跳出来亲自解释了。并且公布了调查证据书。
说实话,这家公司我还真没听说过。不过既然人家都发通知了,我决定上去试一把。看看真实的技术如何
登录官网,这段广告词写得挺不赖:想象力的极限,远非声音的极限。是在内涵谁么
然后还有一条更新跳出来。99.9%的音色与情感还原度。看上去很牛逼。
首先,需要导入一段语音作训练。我选择了英语:浴血黑帮 中的一段语音来作为训练
原语音:
然后在添加角色中上传该语音文件进行训练
训练完成后,这时需要上传一段文本来生成语音。既然是截取的英剧对白。那就用莎士比亚的一首诗来生成声音,看看效果如何
文本
Shall I compare thee to a summer's day?
Thou art more lovely and more temperate:
Rough winds do shake the darling buds of May,And summer's lease hath all too short a date:Sometime too hot the eye of heaven shines,
And often is his gold complexion dimm'd;
And every fair from fair sometime declines,
By chance or nature's changing course untrimm'd;But thy eternal summer shall not fadeNor lose possession of that fair thou owest;
Nor shall Death brag thou wander'st in his shade,When in eternal lines to time thou growest:
So long as men can breathe or eyes can see,
So long lives this, and this gives life to thee
插入文本后,进行语音生成
AI生成后的语音效果:
怎么说呢,前面十几秒还是不错的,到后面语音就走样了。语气,语速都变样
看起来用平台上的音效生成功能,达不到完全逼真的效果。如果对某个人声经过长时间的训练。也不是没有可能
但在这家公司平台上也没找到有开源模型训练的入口。合成三只羊录音门事件这么一段逼真的语音,技术难度不小。
这家公司也就成立一年多,在业界也没听说过。不少网友对此表示了质疑。
三只羊录音门事件还会不会有进一步的发展,等官方的通告吧。
写在最后
这段录音是完全合成还是部分合成,通告中并没有明确说明。我感觉完全合成的难度太大。
这个事件细想一下还是比较恐怖。真的是以假乱真了。相关AI语音合成,语音生成工具,应该需要更严格的法律约束才行。
我是玩AI的程序员,更多AI有趣的玩法关注公众号,可领取一份大礼包,包含AI/python/副业 资料。
AI时代大有可为,对AI工具,AI智能体,AI赚钱感兴趣的欢迎添加vx交流。