明星声纹总动员:CNSRC 2022 说话人识别竞赛全栈资源发布

文摘   科技   2022-07-20 17:34   山东  

日前,由清华大学、厦门大学、希尔贝壳公司联合承办的说话人识别竞赛 CNSRC 2022 收官。组委会发布如下信息:

  • 目前,竞赛所有信息已发布,包括竞赛队伍成绩、系统描述文件、Odyssey 2022 研讨会视频回放等。详细信息请访问 http://cnceleb.org/workshop

  • 竞赛注册系统重新开放,接受研究机构常态化报名,利用竞赛资源推动日常科研工作。注册系统请访问 http://cnceleb.org/competition

  • 声纹检索 (Speaker Retrieval) 赛道数据开源需要使用该数据的学者请通过注册系统完成注册后下载该数据。




CN-Celeb 数据简介

CN-Celeb 是清华大学语音语言技术中心发布的多场景中文明星数据库。该数据库包含了互联网公开可下载的 3,000 位中国明星的音频数据,覆盖访谈、演讲、歌唱、影视、文娱等多种真实复杂场景。同时,每位明星有可能出现在多个场景下,因此具有大量跨场景识别案例。CN-Celeb 是目前已知最为复杂的说话人数据库,是验证说话人识别系统实际性能的金标准。关于 CN-Celeb 的更多信息,可访问数据库官网 http://cnceleb.org




CNSRC 2022 竞赛简介

CNSRC 2022 设定了两个任务:说话人确认 (Speaker Verification) 和说话人检出 (Speaker Retrieval)前者验证测试语音是否属于某一声称说话人,后者从50万背景语音中检出目标说话人的10句发音。每个任务依训练数据不同,又分为固定赛道 (Fixed Track) 和开放赛道 (Open Track);前者仅允许使用 CN-Celeb 作为训练集,目的是验证算法先进性;后者可利用任何数据进行训练,目的是验证当前技术所能达到的性能上界。关于 CNSRC 2022 的更多信息,可访问赛事官网 http://cnceleb.org/competition



CNSRC 2022 技术报告



码下载技术报告


扫码观看视频回放



CNSRC 2022 全部合规系统性能列表




清语赋
清华大学语音语言团队 (CSLT) 科研学术分享和日常生活百态
 最新文章