不到半年,又掌握了10种方言?!
企业
2024-11-15 16:00
北京
“拿扎、落咋、辣砸”
你知道这几个称呼是在叫谁吗?
偷偷提示你
这几个都是神话中小英雄的
的方言版称呼哦
我国幅员辽阔,语言资源丰富
拥有十大汉语方言
及难以计数的土语方言
“醉里吴音相媚好,白发谁家翁媪?”
“少小离家老大回,乡音无改鬓毛衰”
从古至今
方言就传递着深深的人文情感
拥有着无与伦比的魅力
近日,热播剧《上甘岭》中
男女主人公通过方言传递情报的情节
引发了热议
有网友表示赞叹,认为是“鬼斧神工”
让敌人无法破译
也有很多网友感慨
这么有魅力的方言,应该好好去守护
为了能够守护方言
更好地理解方言
今年5月,中国电信推出了
具备超多方言识别能力的
星辰语音大模型
构建了一座打通隔阂的 AI 之桥
星辰语音大模型
攻克“全国最难懂方言”——温州话
更是让大家津津乐道
星辰语音大模型实现了单模型同时支持普通话、英文和 40 种方言的自由混说,并可以通过“一个”ASR(自动语音识别)能力应用于全国多个方言区域,带来更灵活的功能和服务选择,大幅改善用户体验。星辰语音大模型的超多方言能力应用场景丰富多样,涵盖会议系统、智能客服、校园安全、助老助农等多个领域。在智能会议场景,其超多方言识别能力已上线星辰慧记智能会议系统,助力企业快速转写并总结不同地域的客户声音,提升开会效率。星辰语音大模型还落地多地市的12345平台,赋能客服人员更自然流畅地理解市民通过方言提出的问题和需求。在今年9月举办的权威国际语音顶会 Interspeech 2024上,星辰语音大模型凭借领先的技术实力,在离散语音单元建模挑战赛中斩获语音识别赛道冠军;并在 IEEE SLT 2024 说话人溯源国际挑战赛的说话人确认赛道获得第一名。在多方言语音识别建模过程中,首先面临的问题是人工标注的方言数据非常稀缺。中国电信TeleAI团队采取了两条路径,一是获取更多无标注的方言数据;二是减少模型对标注数据的依赖。与传统的有标注训练方法相比,TeleAI利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。同时,TeleAI还在模型结构和成本优化上进行了创新,实现对人工标注数据的需求量大幅缩减约50倍,且保障模型效果与有监督训练的方言模型水平相当。在多方言联合建模的过程中,一些音频的识别文本看似与音频发音一致,但结果却严重错误,核心问题是发音混淆。例如,粤语中的“八”(粤语拼音:baat3)与普通话中的“八”(汉语拼音:ba1)发音基本一致;但粤语中的“二”(粤语拼音:yi6)与普通话中的“二”(汉语拼音:er4)在发音上相差甚远。为了解决这些问题,TeleAI团队采用“字+标签”作为新的建模单元,单元中的“字”代表了音频中的发音信息和音频对应文本的语义信息;而“标签”则是用于区分同字不同音的附加属性,如方言标签或语言标签等。这样既可以充分借鉴不同方言乃至语言间的发音规律,又能有效解决相似语言中的同字不同音问题。