我最近在做AI的视频,需要用到语音讲解,但是我录了好几次语音,发现效果都不太好。
而且每次录音,还得找安静的地方,记住好文稿。录一次费不少时间。录过几次后,有点崩溃的感觉。
于是问了下AI圈的朋友们,有没有什么值得推荐的AI语音合成工具。圈友们出奇一致的推荐了chatTTS这款工具。
大家都说这工具傻瓜部署,用法简单,电脑硬件没要求。这不就是我想要的理想工具么
从圈友那要来工具后,我使用了一下,发现确实好用。生成的声音真的很逼真,听不出来多少AI味。
01
如何打开
本地解压软件后,点击app.exe
同时弹出运行对话框
稍等一小会,浏览器就会弹出对话框。这就正式来到了chatTTS的配置界面了。界面非常简单。就几个参数
默认使用的ip是127.0.0.1,端口是9966。如果你想修改IP和端口。
打开.env文件。在文件中修改IP和端口。然后重启程序就可以生效了。
02
如何使用
chatTTS总共也就10个配置项,下面来说说这些配置项的使用
选择音色:有默认的13个音色可以选择,男声和女声都有。
自定义音色值:0-9999可选,填入不同的数字代表不同的声音,填入这个后,前面的选择音色就不生效了。
Prompt中可以设置预期的提示词,比如laught,break,oral等。如果你不需要口语化的效果,可以设置[oral_0]
推理token和refine token采用默认值即可。
temperature: 代表背景噪声,我一般就直接拉到最低,表示无背景噪声。
top_p:可以调语速。我一般用默认值0.7
基本上常规设置的就这几个选项。设置完成后,点击立即合成声音 就可以让软件生成了
生成后在下方有生成的语音,右边按钮可以下载。
还有播放速度也可以调整
点击 显示API调用,还给出了API调用代码。这点做的很贴心。
03
效果怎么样
输入的文本:今天天气不错,我扫了一个共享单车,沿着江边骑行道骑行。
女声:
男声:
加入中英文夹杂的:
使用感受
使用下来,chatTTS的部署,操作确实是傻瓜级别的。而且生成的声音效果都不错。
但需要注意一点,一次输入的文本不可太长,否则会出现声音忽高忽低,或者失真的表现。
软件比较大,超过2个G,有兴趣的朋友可以联系我,发你下载链接。
更多AI有趣的玩法关注公众号,可领取一份大礼包,包含AI/python/副业 资料
你好,我是江枫,本硕电子信息工程,主业程序员。AI时代,开启自己自媒体IP之路。国内最大AI社群:AI破局俱乐部成员。毕业至今,换过一次工作,呆过2个公司。下一份工作:数字游民。