EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。免费开源,功能强的离谱!
EmotiVoice
EmotiVoice(易魔声)是一款来自 GitHub 的强大开源 TTS 引擎(Text To Speech,即文本转语音)。它支持多角色、多语言和多种情绪的语音合成。
这款工具完全免费、无广告,支持中英文,并内置了2000多种不同的音色,适用于Windows、MacOS、Linux等平台。今天我们将重点介绍它的 Windows 本地部署包,大小约为 5.3GB。
通过 EmotiVoice,我们可以在自己的电脑上合成 2000 多种不同音色及 7 种情绪的语音,效果极为出色,带有情感,几乎可媲美真人。
每种音色(说话人)都支持自定义普通、生气、开心、惊讶、悲伤、厌恶、恐惧等 7 种情绪。
注意:为了达到最佳使用体验,请使用拥有 Nvidia GPU 的 PC。GPU 性能将会影响该工具的语音合成效率。
使用方法非常简单:解压软件压缩包后,双击运行【Start.bat】即可启动软件。
软件本地服务将在 CMD 命令行窗口中运行:
服务启动成功后,将会打开一个 WebUI。在此 WebUI 中,我们可以根据自己的需求开始合成语音:
选择说话人、情绪、语言后,输入合成语音所需文本,点击【合成音频】即可生成语音:
合成音频的速度取决于 GPU 的算力、GPU 的性能释放、选择的语音模型(说话人)的效率以及输入文本内容的长度。
合成成功后,我们可以在线试听合成的语音。点击语言进度条右侧的【···】即可将语音文件保存到本地(WAV 格式):
除了合成单句语音外,EmotiVoice 还支持故事剧本的多人合成。我们可以自定义剧本中各个角色的名称、语音模型、说话内容和情绪:
如果我们在使用过程中勾选了自动保存生成的语音,可以进入软件文件夹,打开wav_file文件夹查看合成的语音文件:
退出软件时,只需关闭 CMD 窗口和网页窗口(WebUI)即可。
EmotiVoice 合成的语音听起来相当不错(注意输入文本内容的标点符号),带有情绪,非常逼真。大家感兴趣的话可以下载试用!
以上就是本期的全部内容。如果你喜欢这期内容,记得「关注」、点「赞」、点「在看」支持一下“格物时间”,感谢大家的支持!
EmotiVoice(GitHub):https://github.com/netease-youdao/EmotiVoice
搬运:https://www.123pan.com/s/6ZFcVv-4ufzH.html
「点个关注
格物时间
快人一步」
拓展阅读:
2024-07-17
2024-07-16
2024-07-14
2024-07-13
2024-07-10
2024-07-07
2024-07-06
想要获取AI资源和学习AI的朋友,可以加入我的知识星球。