日前,由清华大学、厦门大学、希尔贝壳公司联合承办的说话人识别竞赛 CNSRC 2022 收官。组委会发布如下信息:
目前,竞赛所有信息已发布,包括竞赛队伍成绩、系统描述文件、Odyssey 2022 研讨会视频回放等。详细信息请访问 http://cnceleb.org/workshop。
竞赛注册系统重新开放,接受研究机构常态化报名,利用竞赛资源推动日常科研工作。注册系统请访问 http://cnceleb.org/competition。
声纹检索 (Speaker Retrieval) 赛道数据开源。需要使用该数据的学者请通过注册系统完成注册后下载该数据。
CN-Celeb 数据简介
CN-Celeb 是清华大学语音语言技术中心发布的多场景中文明星数据库。该数据库包含了互联网公开可下载的 3,000 位中国明星的音频数据,覆盖访谈、演讲、歌唱、影视、文娱等多种真实复杂场景。同时,每位明星有可能出现在多个场景下,因此具有大量跨场景识别案例。CN-Celeb 是目前已知最为复杂的说话人数据库,是验证说话人识别系统实际性能的金标准。关于 CN-Celeb 的更多信息,可访问数据库官网 http://cnceleb.org。
CNSRC 2022 竞赛简介
CNSRC 2022 设定了两个任务:说话人确认 (Speaker Verification) 和说话人检出 (Speaker Retrieval);前者验证测试语音是否属于某一声称说话人,后者从50万背景语音中检出目标说话人的10句发音。每个任务依训练数据不同,又分为固定赛道 (Fixed Track) 和开放赛道 (Open Track);前者仅允许使用 CN-Celeb 作为训练集,目的是验证算法先进性;后者可利用任何数据进行训练,目的是验证当前技术所能达到的性能上界。关于 CNSRC 2022 的更多信息,可访问赛事官网 http://cnceleb.org/competition。
CNSRC 2022 技术报告
扫码下载技术报告
扫码观看视频回放
CNSRC 2022 全部合规系统性能列表