INTERSPEECH 2025丨ML-SUPERB 2.0 挑战赛:推动多语言语音科技迈向新高度

文摘   2025-01-06 18:01   河北  

随着语音技术在各领域应用的迅速扩展,全球语言与口音的多样性成为技术进一步突破的重大挑战。为了应对这一难题,来自卡内基梅隆大学(CMU)、斯坦福大学(Stanford University)、乔治梅森大学 (George Mason University)、台湾大学与芝加哥丰田技术学院 (TTIC)的研究团队连手,在即将举行的 INTERSPEECH 2025 国际会议上推出了 ML-SUPERB 2.0 挑战赛(Multilingual SUPERB 2.0 Challenge)。该挑战旨在推动多语言语音技术迈向新高度,为语音科技的全球化应用奠定坚实基础。

  官方网站(文末点击“阅读原文”直接访问)

https://multilingual.superbbenchmark.org/


语言数量规模
ML-SUPERB 2.0 提供了包含大量不同语言的语音数据集。
  • 训练集:涵盖 141 种语言的丰富语音数据,从主流语言到稀有方言,为参赛者提供多元化的语言资源以训练模型。

  • 开发集:包含训练集中的141种语言,和另外的56 种方言与口音,为模型性能的全面评估提供支持。


这些数据反映了全球语言的多样性,确保技术不仅服务于主流语言,更覆盖小众语言。


新型评估机制
ML-SUPERB 2.0 在评估机制上进行了创新,模型评估指针除了传统的语音识别和语言识别错误率外,还强调模型在每种语言上都具备稳定性能,真正做到对所有语言的友好支持,激励研究者关注小众语言与弱势语言的平等支持,最终实现“No Language Left Behind”。


主办方提供算力进行推论
为提升参赛体验,降低参赛门坎,挑战赛引入了在线实时排名系统。参赛者只需提交模型,即可由主办单位提供算力进行推论,实现快速评估与实时反馈。


重要时间 

2024.11.25

Challenge announcement

2024.12.4

Leaderboard is online and accepting submissions

2025.2.7

Leaderboard Submission Deadline

2025.2.10

Challenge Winners Announced

2025.2.12

Paper Submission Deadline


引领语音科技的未来
ML-SUPERB 2.0 挑战赛不仅是一场技术比拼,更是推动语音科技迈向新纪元的重要一步。通过凝聚全球研究者与开发者的力量,挑战赛将加速多语言语音技术的创新与普及,为语音技术的应用场景带来更多可能性。参赛者可前往官方网站(https://multilingual.superbbenchmark.org/) 获取详细信息,并在 2025 年 2 月 7 日前提交结果。让我们携手参与这场语音技术的盛会,见证语音科技未来的开启!

永久福利 直投简历
简历投递:join@speechhome.com
扫码关注我们
助力AI语音开发者的社区


语音之家
助力AI语音开发者的社区
 最新文章