科技发展日新月异,AI正在一步步渗透到我们生活的方方面面。前阵子ChatGPT 大火,让我们见识到了AI在文字领域的强大。但你可能没想到,现在连音频领域也被AI给轻松拿捏了!
前两天,我在网上冲浪时无意间发现了几个有趣的音频:马斯克在线跳舞、黄仁勋给我们拜年...我一度怀疑自己的耳朵,这些大佬什么时候干过这种事?直到我点开详情才发现,原来这些都是由一个叫做 Fish Audio 的 AI 语音克隆工具生成的!
没错,你没看错,Fish Audio 号称只需10秒,就可以克隆任何人的声音,甚至可以让克隆出的声音说任何话!一开始我还半信半疑,但当我实际体验了一番后,完全被震惊到了。
不信?我们来听听
Fish Audio 最大的特点就是门槛低、操作简单,国内可以直接访问,注册只需要一个QQ邮箱就可以。
免费用户每天可以免费使用50次,相当良心了。生成的音频质量我听下来,大概能达到原声音的7-8成相似度,虽然还达不到以假乱真的地步,但对于我们日常做做自媒体配音、和朋友恶搞玩玩,已经完全够用了。
使用 Fish Audio 大致可以分为4步:
1. 注册账号。直接填 QQ邮箱就行,也可以用谷歌账号登录。
2. 探索发现区。Fish Audio 上已经有很多网友上传了各种名人的声音素材,比如丁真、雷军、曹操、唐僧...感兴趣的直接拿来用就可以了。
3. 克隆声音。如果你想克隆某个声音但发现区里没有,可以自己动手上传音频来克隆。上传音频时长最好在10-45秒之间,25秒最佳。
音频最好是纯人声,有背景音乐的话建议先用剪映等软件处理一下。上传后,Fish Audio 几乎是秒克隆,很快就能用了。
4. 文字转语音。输入你想让克隆的声音说的话,选择克隆的音源,稍等片刻就能生成想要的音频了。免费用户单次可生成500字内的文本,个人感觉一般够用了。如果文本太长可以分段生成,再自己拼接一下。
我尝试着克隆了郭德纲、雷军、蔡徐坤等人的声音,除了个别长句断句不太自然、语气韵律不太稳定外,整体效果还是相当不错的,跟原音相似度能有七八成。多生成几次,选最满意的一个就行。
总的来说,Fish Audio 作为一款 AI 语音工具,在易用性和音色还原度上都令人印象深刻,虽然还不算完美,但胜在够免费、够方便,用来做做视频配音、日常娱乐恶搞,绝对是一个不错的选择!感兴趣的小伙伴不妨自己去体验体验,相信你也会有惊喜的发现。
鉴于AI的过于强大,未来可能会带来一些深层次的伦理问题。但在法律和监管跟上之前,我们不妨先尽情享受这项黑科技带来的乐趣吧,毕竟人生在世,开心最重要嘛,哈哈~
哦,对了,再强调一遍,加创客涛,领取AI资料大礼包,微信号:chuangketao2024