不到半年,又掌握了10种方言?!

企业   2024-11-15 16:00   北京  

“拿扎、落咋、辣砸”

你知道这几个称呼是在叫谁吗?

偷偷提示你

这几个都是神话中小英雄的

的方言版称呼哦



你知道上面几个称呼是在叫谁吗?

哪吒                                                                               

-点击查看答案-


我国幅员辽阔,语言资源丰富

拥有十大汉语方言

及难以计数的土语方言

“醉里吴音相媚好,白发谁家翁媪?”

“少小离家老大回,乡音无改鬓毛衰”

从古至今

方言就传递着深深的人文情感

拥有着无与伦比的魅力



近日,热播剧《上甘岭》中

男女主人公通过方言传递情报的情节

引发了热议

有网友表示赞叹,认为是“鬼斧神工”

让敌人无法破译

也有很多网友感慨

这么有魅力的方言,应该好好去守护


为了能够守护方言

更好地理解方言

今年5月,中国电信推出了

具备超多方言识别能力的

星辰语音大模型

构建了一座打通隔阂的 AI 之桥

星辰语音大模型

攻克“全国最难懂方言”——温州话

更是让大家津津乐道



而如今,时隔不到半年
星辰语音大模型的多方言能力再次突破
不仅攻克了湛江话、宜宾话、
洛阳话、烟台话等
将方言种类从30种提升至40种
还引入对英文的识别
同时,模型的参数量增加一倍
大幅提升了识别的准确率


星辰语音大模型
打造了国内首个
且独立通过算法和服务“双备案”的
语音大模型
并在多个国际权威评比中斩获冠军佳绩

星辰语音大模型“超多方言”有多强?

‍‍
星辰语音大模型实现了单模型同时支持普通话、英文和 40 种方言的自由混说,并可以通过“一个”ASR(自动语音识别)能力应用于全国多个方言区域,带来更灵活的功能和服务选择,大幅改善用户体验。



星辰语音大模型的超多方言能力应用场景丰富多样,涵盖议系统、智能客服、校园安全、助老助农等多个领域。

在智能会议场景,其超多方言识别能力已上线星辰慧记智能会议系统,助力企业快速转写并总结不同地域的客户声音,提升开会效率。



星辰语音大模型还落地多地市的12345平台,赋能客服人员更自然流畅地理解市民通过方言提出的问题和需求。



在今年9月举办的权威国际语音顶会 Interspeech 2024上,星辰语音大模型凭借领先的技术实力,在离散语音单元建模挑战赛中斩获语音识别赛道冠军;并在 IEEE SLT 2024 说话人溯源国际挑战赛的说话人确认赛道获得第一名。


“超多方言”大模型如何炼成?

在多方言语音识别建模过程中,首先面临的问题是人工标注的方言数据非常稀缺。中国电信TeleAI团队采取了两条路径,一是获取更多无标注的方言数据;二是减少模型对标注数据的依赖。

与传统的有标注训练方法相比,TeleAI利用海量无标注数据进行预训练,再通过少量有标注数据进行微调。


同时,TeleAI还在模型结构和成本优化上进行了创新,实现对人工标注数据的需求量大幅缩减约50倍,且保障模型效果与有监督训练的方言模型水平相当。

在多方言联合建模的过程中,一些音频的识别文本看似与音频发音一致,但结果却严重错误,核心问题是发音混淆。例如,粤语中的“八”(粤语拼音:baat3)与普通话中的“八”(汉语拼音:ba1)发音基本一致;但粤语中的“二”(粤语拼音:yi6)与普通话中的“二”(汉语拼音:er4)在发音上相差甚远。



为了解决这些问题,TeleAI团队采用“字+标签”作为新的建模单元,单元中的“字”代表了音频中的发音信息和音频对应文本的语义信息;而“标签”则是用于区分同字不同音的附加属性,如方言标签或语言标签等。


这样既可以充分借鉴不同方言乃至语言间的发音规律,又能有效解决相似语言中的同字不同音问题。
(注:上下滑动查看更多详情)


通过星辰语音大模型
方言不再成为“难以逾越”的鸿沟
如今,TeleAI已将星辰语音大模型的
超多方言预训练和微调阶段代码
及相关预训练模型正式对外开源,
目标加速AI技术的
快速落地和应用普及

AI砥砺,星辰注智
中国电信用AI守护方言
用星辰大模型系列产品体系
提供多样化、一体化的
大模型应用服务
为千行百业释放澎湃动力


“星标”我们,让遇见更为简单


编辑:庄文超、陈博博、张广

执行主编:廖鸿翔、张朋










主编:刘晖平
好友都在看

【点击图片阅读】国内首个!这个公园也太潮了吧!

【点击图片阅读】又双叒亮相央视《新闻联播》!


点点在看,让更多人看到↓↓↓

中国电信
中国电信集团公司官方微信
 最新文章