首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

董宇辉说重庆话，TTS效果又进化了

文摘 2024-07-07 23:09 重庆

最近想拍短视频，把视频号做起来。但对新手来说，真的很费事。话说AI能力这么强，能不能自动生成可用的视频效果呢？声音逼真程度很关键！

那种一听就是合成声音的，很难让人产生信任，对IP打造也没帮助。前几天出的Fish Audio效果就不错，拟真程度很高了。比如下面这个视频，纯AI生成的。

声音克隆，语音合成，文本转语音（TTS）有很多，最近也好像卷起来了。这里汇总一些开源的文本转语音(TTS)模型。

GPT-SoVITS

支持英语、日语和中文
零样本文本到语音能力
集成工具包 GitHub: https://github.com/RVC-Boss/GPT-SoVITS

GPT-SoVITS，语音克隆神器！零样本也能秒变声线，多语言支持超给力。对新手友好，让创意无限发挥，真心好用！

Fish Speech v1.2

效果稳定,支持声音克隆
经过30万小时英语、中文和日语音频数据训练
在线版本可用模型: https://huggingface.co/fishaudio/fish-speech-1.2 在线demo: https://fish.audio/zh-CN/

Fish Speech v1.2，太惊艳了！这TTS工具声音超自然，宛如真人。处理文本也超智能，让我每次使用都感叹不已，强烈推荐！

CosyVoice (阿里巴巴)

多语种、混合语言支持
音色和情感控制能力
在零样本语音生成、跨语言语音克隆和指令跟踪方面表现优秀

CosyVoice，真牛！音色自然得就像真人，各种场景都能应对自如。阿里出品，必属精品，强烈推荐给需要的朋友们！

SenseVoice (阿里巴巴)

FunAudioLLM框架的一部分
结合先进的语音理解和生成技术
适用于语音翻译、情感语音聊天、互动播客和富有表现力的有声读物朗读等项目地址: https://fun-audio-llm.github.io GitHub: https://github.com/FunAudioLLM

SenseVoice，语音识别大牛！多语言、情感识别全搞定，效率还超高。

ChatTTS

对话式TTS,支持多人
支持中英文
韵律细腻,仿真程度高
音色不好固定 GitHub: https://github.com/2noise/ChatTTS 模型: https://huggingface.co/2Noise/ChatTTS/tree/main

Seed-TTS (字节跳动)

期货产品，还未开源模型或API
支持多种语言,包括英语和中文
可进行同语言和跨语言生成
能处理各种文本类型和情感表达项目介绍: https://bytedancespeech.github.io/seedtts_tech_report/

Parler-TTS (Hugging Face)

可控制音调、速度、性别、噪音水平和情绪特征等 GitHub: https://github.com/huggingface/parler-tts 模型: https://huggingface.co/parler-tts

MetaVoice-1B

支持多语言
在英语处理上实现了情感语音节奏 GitHub: https://github.com/metavoiceio/metavoice-src

MARS5-TTS

可为体育解说、动漫等韵律复杂和多样化场景生成语音 GitHub: https://github.com/Camb-ai/MARS5-TTS

OpenVoice

原生支持英语、西班牙语、法语、中文、日语和韩语
灵活的语音风格控制和零样本跨语言语音克隆能力 GitHub: https://github.com/myshell-ai/OpenVoice

EmotiVoice

支持中英文双语
包含2000多种不同音色 GitHub: https://github.com/netease-youdao/EmotiVoice/blob/main/README.zh.md

这个列表展示了各种TTS模型的不同能力、语言支持和独特特性,反映了语音合成技术领域的多样性和快速发展。

如果现在没有合意的模型，那可以”让子弹飞“一会。

就这样了，如果觉得有用，请点赞收藏转发评论。欢迎关注我！

http://mp.weixin.qq.com/s?__biz=MzIyNDAzMzYxNQ==&mid=2652030785&idx=1&sn=bec5fba5bb33ed13ebab0c4a9a7b06d1

专注AI智能体，分享AI应用，探索和实践AI应用落地，我是越山，关注我，让AI为你打工。

最新文章

本地Excel中调用AI大模型

AI应用开发框架，一文读懂LangChain

少数人知道的短视频下载方式，抖音，B站，小红书，油管，X， Tiktok全拿下

10000块的提示词被破解了

1024节日大礼-精选三款AI编程神器

Claude重磅升级，可以像人一样控制电脑了！

教师做课，So Easy!

AI应用落地到哪了？

OpenAI终于又Open了，开源Agent框架Swarm

4.1w人付费AI社群，每月自增长500人，听听洋哥的心法

不懂就问，个人IP如何做到年入百万？

扣子Coze十月改版，期待商业变现

【建议收藏】十大AI神器，国内可用

9个智能体平台和框架，有没有你不知道的

想得多，做得少，这是病，得治！

你为什么总是啥都想干，啥都干不成?

AI加持，快速学习知识变现，太爽了！

AI做动画视频，直接出两分钟讲故事的那种

AI帮老师做公开课，效果杠杠的

企业能用AI做什么？看看这10个真实的案例

哥，我该怎么开始学习智能体?

AI编程神器Cursor的10大使用技巧

这个AI工具助力10倍学习新知识

扣子Coze 多Agent模式，要不要用？

未来年轻人可能比老年人更容易失业，而赚钱的工作竟然是这个！

5000天后，AI带来的6大巨变，最赚钱的竟然是...

用扣子Coze智能体，创作独一无二的公众号封面图

扣子Coze智能体提取抖音视频文案

AI智能体究竟是个啥子东西？

标题就是自媒体的命，怎么能交给AI

谁能想到智能体给我换了个孩子

降本增笑，从网易云宕机事件看AIOps的重要性与最佳实践

太逗了，黑悟空72变，变脸

案例 | 扣子Coze接入个人微信

聊天机器人大爆发！访问量暴增18倍，autoresponderAI 如何在市场中脱颖而出？

绝了，扣子Coze一键生成商拍图，电商玩家的福音

AI智能体，换脸真好玩

扣子Coze上搭一个AI日报智能体

3分钟,给老奶奶讲AI智能体

个人IP天花板董宇辉突然离职，超级个体必学的10个生存法则

搞智能体，赚钱才是硬道理！风口上的流量还能从哪来

拆解这9个智能体案例，成为扣子Coze智能体高手

来扣子coze薅羊毛，1块钱的算力包不香吗？

5000张海报轻松搞定，扣子Coze插件FastPoster让创意不止于1

实测4个最火的扣子Coze海报插件，快来看看哪个好用

AI智能体提升写作效率 -- 特朗普挨枪为例

搭建智能体必备的基本功，看看你掌握多少

5大智能体平台，除了coze，还有...

哭死，要做9000张海报，有必要上智能体了。

董宇辉说重庆话，TTS效果又进化了

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉