3秒克隆你的声音,最新CosyVoice V2一键整合包,人人可以玩。

科技   2024-12-19 18:23   云南  

 
             


CosyVoice V2,是阿里通义实验室语音团队最新推出的免费开源语音生成大模型,相比上一版本,语音的准确性、稳定性、自然度大大提高,生成速度也更快了,支持中文、英语、日语、韩语、中国方言(粤语、四川话、上海话、天津话、武汉话等),支持跨语言和语码转换场景的零样本语音克隆。


效果演示:





已制作成傻瓜式一键启动包,解压即用。(注意解压路径不要带中文、空格特殊符号


使用方法:


1.运行启动CosyVoice.exe等待片刻。



2.在弹出的页面输入需要生成的语音文本。



3.选择推理模式。



3s极速复刻:一般情况下使用这种模式。

跨语种复刻:比如样本是中文,需要生成英文语音的情况下使用。

自然语音控制:配合instruct文本使用,比如需要生成方言语音内容,可在instruct文本框内输入:用天津话说这段话


4.上传音频样本,建议在15秒以内,内附简易裁剪功能。





选择好样本区域后点“Trim”完成裁剪。


5.在prompt文本框内输入样本音频的文字内容,如果需要方言,在instruct文本框内输入“用粤语说这段话”、“用天津话说这段话”,如果是生成普通话,请留空,最后点击生成音频按钮等待即可,生成完毕后自由下载。



生成速度取决于电脑配置,仅供娱乐,请勿它用!


不支持Win7!只支持Windows 10、11,N卡,显存最好≥8G,不然的话生成长文本比较慢,但也能玩。


【傻瓜式整合版下载地址1】复制下方链接打开夸克APP可直接保存

https://pan.quark.cn/s/16e0d72e7d58


【傻瓜式整合版下载地址2】

https://pan.xunlei.com/s/VOETR-YM9WExOYsEE_pgAe1RA1?pwd=8wh8#


其他信息晚点更新到网站xx7z.com......


原版项目地址:https://github.com/FunAudioLLM/CosyVoice


 
             

an小轩砌站
软件/插件/教程/游戏/互联网资源分享
 最新文章