在中国的小公司,是不可能去研究自己的开源模型框架的。不过他们如果不想去购买阿里云的接口服务,最好的方式就是使用一些开源的模型自己搭起来,自己使用。不过开源的框架很多,你需要选择那个框架,基本都是研发人员在选择框架,作为产品主需要熟悉主流的几个框架就行了,做法都差不多。遇到有些技术总监,他自己也不知道如何选择,选型错误给公司造成巨大的损失。
Whisper【Openai】
PaddleSpeech【百度】
ChatTTS【】
开源语音合成项目ChatTTS的使用方法和功能。通过在线网页demo和Python代码开发,用户可以控制说话人的情绪、音色、文本口语化程度、笑声程度和停顿程度,并生成逼真的语音。
视频还介绍了如何在驱动云平台上部署和使用ChatTTS,并提供了详细的教程和代码。同时,视频还介绍了如何导出和导入音色控制,以及如何进行多轮对话。可以去网页上体验
比如这段话的语音生成效果,https://chattts.com/zh#Demo