首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

【AI】完美复刻，香港中文大学与国内联手的AI声音克隆模型来了！

文摘 2024-11-02 15:06 河北

点击上方关注我们吧

近日，香港中文大学与趣丸科技联合推出了一款语音克隆模型——MaskGCT模型。

这款模型采用了先进的声音克隆与合成技术，具备多语种、风格化和高音质的语音合成能力

开创性的语音克隆与风格迁移

MaskGCT的主要优势在于其自然逼真的声音克隆效果。

通过仅需3秒的音频样本，用户便可以高度仿真任意人类或非人类声音，无论是人物声音、动漫角色音色，还是低语等情感语调，均可实现逼真再现。

MaskGCT的声音克隆不仅注重语音内容的复制，同时能够高度还原说话者的情感和语调。

这种风格迁移能力使得MaskGCT特别适用于影视配音、虚拟人声生成及多样化的语言教育等多个应用场景。

此外，该模型还在多个TTS基准数据集上达到了最新的SOTA（最先进技术）效果，性能超过了当前主流的TTS模型。

可控的语音生成与多语种支持

MaskGCT的另一个显著特点是其强大的可控性。

用户可以灵活调整生成语音的长度、语速、语气等参数，使生成的声音能够符合特定场景需求。

例如，用户可以通过修改文本内容直接影响语音内容的输出，使音色、韵律等特性保持一致。

同时，MaskGCT对多语言的支持极为全面，能够实现中、英、韩、日、法、德六种语言的语音合成。

这一多语言支持，尤其在全球化市场中具有重要意义，帮助模型在多语种环境下保持高一致性和高质量的输出。

这种灵活可控的特性使MaskGCT在应用上拥有巨大的潜力，特别适用于教育和翻译等对语言需求多样化的行业。

基于Emilia数据集的高稳定性

MaskGCT的训练数据集——Emilia数据集，包含了多种语言和丰富的语音样本，使模型能够适应多种语音类型，稳定性和适应性都得到了显著提升。

这种多语言数据集由趣丸科技和港中大（深圳）合作打造，包含10万小时的多语言语音数据，覆盖了日常对话、演讲、情感表达等多样化场景。

得益于该数据集的支持，MaskGCT不仅实现了高度精细的声音复制，还在大规模语言环境中表现出了卓越的稳定性。

在Amphion系统上，MaskGCT的开源发布也意味着更广泛的开发者和机构可以使用并优化这一模型，以满足更多元化的需求。

这一举措进一步推动了多语种语音合成领域的发展，并为全球开发者的语音应用提供了灵活的开发环境。

应用潜力与未来前景

MaskGCT在影视娱乐、教育培训、智能助手等领域具有广阔的应用前景。

影视行业可以通过MaskGCT实现高效的多语言配音和角色声音还原；教育行业则可以使用其生成的多语言语音资源，提升语言学习的互动性与真实感；

而在智能助手和虚拟人技术中，MaskGCT的情感表达与语言迁移能力，使得虚拟人能够更为贴近人类交互体验。

对此，各位读者有什么想说的？

欢迎留言，一起交流你的观点与看法！

合作与交流

您的支持 · 我们的动力

诚邀投稿:

欢迎各位粉丝、朋友们提供稿件（前沿科技进展、科技产品动态、经典文献解读、技术原理科普、行业市场分析、科研生活感悟、社会民生观察等）。联系微信号：133 9674 1340，并请注明详细联系信息，对入选推送稿件者，我们会及时联系您，以微信红包形式给予报酬。

对前沿科技感兴趣的朋友，可以点击关注公众号，订阅感兴趣的话题专栏！

也可添加下述小编微信！小编邀请您一起加入“前沿科技观察”群聊！

让我们每天下午4点，一起探索全球最前沿的科技资讯！开启你的科技之旅，与志同道合的伙伴一同品味科技发展带来的时代红利，创新型的未来！

编辑|前沿科技观察

供稿|科创产业观察

审核|前沿科技观察

http://mp.weixin.qq.com/s?__biz=MzI3NzYyNjIzOQ==&mid=2247497641&idx=4&sn=463bea6fb9254cf3917e1fea380b7d7e

前沿科技观察

聚焦科学前沿、着眼科技热点！理工博士，用最接地气的文字，传递最“好玩”的科技讯息！

最新文章

【小米】小米15钻石限定版已被抢购一空，雷军表示短期不能到货

【极氪】新车型亮相：2025款极氪X五座后驱版和长续航版发布，起售价13.5万元起

【中兴】中兴发布 5G AI CPE G5 Pro路由器，速度可达4.29Gbps

【AI】会模拟人类思维？昆仑万维发布了这款AI高级搜索

【荣耀】一句话点咖啡？荣耀YOYO智能体有多实用？

【华为】中国移动与华为发布“智网慧城”计划：推动5G-A与人形机器人创新

【小米】小米发布新款 Redmi G24 IPS 显示器：高刷新率与色彩体验的提升

【AGM】内置AI智学系统，深圳这家公司的学习机有多强悍？

【比亚迪】比亚迪10月销量突破50万辆大关，创下新纪录

【苹果】小体积，大性能，苹果2024款 Mac mini 正式发布

【一加】一加 13 正式发布：性能与设计的全新提升

【微软】微软开源OmniParser：突破性视觉基础GUI自动化工具

【vivo】iQOO 13正式发布发布：性能之光

【华西医院】将AI引入医疗！华西医院与华为联合发布“华西黉医”医学大模型

【联想】联想智能手表开售：时尚科技兼具

【AI】ElevenLabsAI推出AI语音生成工具Voice Design

【荣耀】荣耀Magic 7系列手机发布，搭载骁龙8至尊版处理器

【科大讯飞】灵巧轻便，科大讯飞翻译机 4.0 星火版上市

【华为】华为2024年前三季度财报出炉，营收持续增长

【AI】完美复刻，香港中文大学与国内联手的AI声音克隆模型来了！

【小米】小米澎湃 OS 2 正式发布：全新性能优化与生态互联体验

【小米】搭载澎湃OS 2系统的小米手表 S4 正式发布

【字节跳动】音画完美同步！抖音母公司推出了这款AI配音模型

【百川智能】百川智能发布Baichuan 4，专为企业打造

小米新旗舰终于来了，小米15有多强？

【比亚迪】比亚迪营收首次超越特斯拉

【小米】首发价格159元，Redmi 手环 3 正式发布

【众擎】真正意义适用于工业环境，国产全尺寸人形机器人来了

【荣耀】荣耀手表 5已上架：智慧升级，亮点满满

【苹果】苹果发布2024款24英寸M4 iMac，带来显著性能升级

【极越】极越 CEO 夏一平 24 小时智驾 2000 公里挑战成功

【AI】ChatGPT的最大对手Claude 3.5又推出改进版

荣耀 X60 Pro 系列手机正式开售，性能强劲

【芯片】芯擎科技“星辰一号”自动驾驶芯片成功点亮

【苹果】内置ChatGPT的苹果AI即将上线，或将带动手机销量？

【AI】智谱推出端到端情感语音模型GLM-4-Voice

【比亚迪】2025款比亚迪唐DM-i：家庭出行最佳选择，三大进化带来全新体验

【荣耀】荣耀 X60 系列正式开售，高性价比+高实用性

【芯片】中国版脑机接口要来了？国内科研团队又取新突破

【小米】小米电视 S Pro Mini LED 2025 系列开售：影像与性能再升级

【宁德时代】宁德时代发布骁遥超级增混电池：400公里续航+4C超充

【鸿蒙智行】鸿蒙智行公布充电基础设施最新进展：构建智能出行未来

【小米】小米手环 9 Pro 开启预热：更大屏幕、更高续航和全新功能

【AI】Stability AI 推出 Stable Diffusion 3.5

【AI】能实时真实对话，科大讯飞推出“星火超拟人数字人”

【比亚迪】比亚迪郑州“迪空间”正式开馆：中国首个新能源汽车科普馆

【联想】联想发布小新 13 Air 2025全铝超轻盈本

【芯片】英特尔酷睿 Ultra 9-285K 处理器开售

【华为】华为MatePad Pro流金典藏版发布

【芯片】一汽红旗自主研发的碳化硅功率芯片首次流片！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉