CosyVoice V2,是阿里通义实验室语音团队最新推出的免费开源语音生成大模型,相比上一版本,语音的准确性、稳定性、自然度大大提高,生成速度也更快了,支持中文、英语、日语、韩语、中国方言(粤语、四川话、上海话、天津话、武汉话等),支持跨语言和语码转换场景的零样本语音克隆。
效果演示:
已制作成傻瓜式一键启动包,解压即用。(注意解压路径不要带中文、空格特殊符号)
使用方法:
1.运行启动CosyVoice.exe等待片刻。
2.在弹出的页面输入需要生成的语音文本。
3.选择推理模式。
3s极速复刻:一般情况下使用这种模式。
跨语种复刻:比如样本是中文,需要生成英文语音的情况下使用。
自然语音控制:配合instruct文本使用,比如需要生成方言语音内容,可在instruct文本框内输入:用天津话说这段话
4.上传音频样本,建议在15秒以内,内附简易裁剪功能。
选择好样本区域后点“Trim”完成裁剪。
5.在prompt文本框内输入样本音频的文字内容,如果需要方言,在instruct文本框内输入“用粤语说这段话”、“用天津话说这段话”,如果是生成普通话,请留空,最后点击生成音频按钮等待即可,生成完毕后自由下载。
生成速度取决于电脑配置,仅供娱乐,请勿它用!
不支持Win7!只支持Windows 10、11,N卡,显存最好≥8G,不然的话生成长文本比较慢,但也能玩。
【傻瓜式整合版下载地址1】复制下方链接打开夸克APP可直接保存
https://pan.quark.cn/s/16e0d72e7d58
【傻瓜式整合版下载地址2】
https://pan.xunlei.com/s/VOETR-YM9WExOYsEE_pgAe1RA1?pwd=8wh8#
其他信息晚点更新到网站xx7z.com......
原版项目地址:https://github.com/FunAudioLLM/CosyVoice