秋有云栖应最惜,一年一度一归来。
在语音AI快步迈入大模型的时代,今年的云栖大会颇有看头。通义实验室语音团队除了向大家汇报我们近一年的语音平台产品更新,还会发布几款备受期待的新语音大模型,借此机会,与各位多模态大模型领域从业者爱好者相互切磋和品鉴。
#Part1 论坛
主题1
演讲嘉宾
鄢志杰 通义实验室语音团队负责人
时间
9月19日 13:30-17:30
地点
杭州云栖小镇 D1-4
主题2
摘要:以ChatGPT为开端,大模型以及多模态大模型成为了AI的大势。本演讲将会介绍通义实验室在大模型时代下的音频理解、音频生成以及音频多模态大模型的相关研究和开源工作。包括音频理解大模型SenseVoice、音频生成大模型CosyVoice,以及最新的音频多模态大模型。其中SenseVoice用于高精度的多语种语音识别、情感识别和音频事件检测;CosyVoice则用于自然语音生成,并支持多种语言、音色和情感控制,在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行能力方面表现卓越。本次分享,我们会发布音频多模态大模型MinMo和实时多语言语音翻译大模型Gummy。
演讲嘉宾
杨宝嵩 通义实验室算法科学家
时间
9月19日 14:00-17:30
地点
杭州云栖小镇 B3-3
#Part2 模型互动展览
9月19日-9月21日全天
杭州云栖小镇 1号馆和2号馆
👇点击阅读原文,可直达领票链接