强到离谱的开源、免费工具:目前见过同类工具中最强的存在

科技   2024-07-19 19:36   北京  

EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。免费开源,功能强的离谱!

EmotiVoice

EmotiVoice(易魔声)是一款来自 GitHub 的强大开源 TTS 引擎(Text To Speech,即文本转语音)。它支持多角色多语言多种情绪的语音合成。

这款工具完全免费、无广告,支持中英文,并内置了2000多种不同的音色,适用于Windows、MacOS、Linux等平台。今天我们将重点介绍它的 Windows 本地部署包,大小约为 5.3GB。

通过 EmotiVoice,我们可以在自己的电脑上合成 2000 多种不同音色及 7 种情绪的语音,效果极为出色,带有情感,几乎可媲美真人。

每种音色(说话人)都支持自定义普通生气开心惊讶悲伤厌恶恐惧等 7 种情绪。

注意:为了达到最佳使用体验,请使用拥有 Nvidia GPU 的 PC。GPU 性能将会影响该工具的语音合成效率。

使用方法非常简单:解压软件压缩包后,双击运行【Start.bat】即可启动软件。

软件本地服务将在 CMD 命令行窗口中运行:

服务启动成功后,将会打开一个 WebUI。在此 WebUI 中,我们可以根据自己的需求开始合成语音:

选择说话人、情绪、语言后,输入合成语音所需文本,点击【合成音频】即可生成语音:

合成音频的速度取决于 GPU 的算力、GPU 的性能释放、选择的语音模型(说话人)的效率以及输入文本内容的长度。

合成成功后,我们可以在线试听合成的语音。点击语言进度条右侧的【···】即可将语音文件保存到本地(WAV 格式):

除了合成单句语音外,EmotiVoice 还支持故事剧本的多人合成。我们可以自定义剧本中各个角色的名称、语音模型、说话内容和情绪:

如果我们在使用过程中勾选了自动保存生成的语音,可以进入软件文件夹,打开wav_file文件夹查看合成的语音文件:

退出软件时,只需关闭 CMD 窗口和网页窗口(WebUI)即可。

EmotiVoice 合成的语音听起来相当不错(注意输入文本内容的标点符号),带有情绪,非常逼真。大家感兴趣的话可以下载试用!

以上就是本期的全部内容。如果你喜欢这期内容,记得「关注」、点「」、点「在看」支持一下“格物时间”,感谢大家的支持!

EmotiVoice(GitHub):https://github.com/netease-youdao/EmotiVoice

搬运:https://www.123pan.com/s/6ZFcVv-4ufzH.html


「点个关注

格物时间

快人一步」

拓展阅读:

【神器集·第一期】这 6 个神仙工具,我不允许你不知道

2024-07-17

【值得收藏】6个神仙工具确实好用

2024-07-16

2024DragonKMS神龙最新版:激活Windows和Office的终极选择

2024-07-14

【2024 AI推荐】25个 AI 工具神器万字长文推荐

2024-07-13

搜遍全网!终于挖出11款不可错过的极好用的阅读神器

2024-07-10

10个黑科技工具,AI一键生成视频、音乐和图片,完全免费!

2024-07-07

12个必备神器!提升效率与创意的神奇免费工具

2024-07-06


想要获取AI资源和学习AI的朋友,可以加入我的知识星球。



科技侠来了
个人成长,效率工具,管理方法论,编程自动化,App及数码电子评测,阅读分享。与你共同格物新知。
 最新文章