首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

2024云栖｜不变的追求，探觅智能应用场域的新可能

文摘科学 2024-09-06 13:33 浙江

秋有云栖应最惜，一年一度一归来。

在语音AI快步迈入大模型的时代，今年的云栖大会颇有看头。通义实验室语音团队除了向大家汇报我们近一年的语音平台产品更新，还会发布几款备受期待的新语音大模型，借此机会，与各位多模态大模型领域从业者爱好者相互切磋和品鉴。

#Part1 论坛

主题1‍‍‍‍‍‍‍‍‍

《语音+大模型，探索智能应用场域的新可能》

摘要：语音交谈作为人类最常使用的交互模式，是连接人与智能世界的关键。在本论坛主题中，我们将发布通义语音大模型的升级系列模型和产品，着重探讨产品如何形成“语音+大模型”的场景化应用，展示语音理解、语音交互和语音翻译等技术在多场景应用中的突破，以及产品如何解决这些场景落地难题，为用户带来耳目一新的智能交互体验。

演讲嘉宾

鄢志杰 通义实验室语音团队负责人

时间

9月19日 13:30-17:30

地点

杭州云栖小镇 D1-4

主题2

《大模型时代的音频理解、生成和多模态》

摘要：以ChatGPT为开端，大模型以及多模态大模型成为了AI的大势。本演讲将会介绍通义实验室在大模型时代下的音频理解、音频生成以及音频多模态大模型的相关研究和开源工作。包括音频理解大模型SenseVoice、音频生成大模型CosyVoice，以及最新的音频多模态大模型。其中SenseVoice用于高精度的多语种语音识别、情感识别和音频事件检测；CosyVoice则用于自然语音生成，并支持多种语言、音色和情感控制，在多语言语音生成、零样本语音生成、跨语言声音合成和指令执行能力方面表现卓越。本次分享，我们会发布音频多模态大模型MinMo和实时多语言语音翻译大模型Gummy。

演讲嘉宾

张仕良 通义实验室算法科学家

杨宝嵩 通义实验室算法科学家

时间

9月19日 14:00-17:30

地点

杭州云栖小镇 B3-3

‍‍‍

#Part2 模型互动展览‍‍‍‍

互动展区
‍‍

1.FunAudioLLM：音频理解与生成大模型

2.音频多模态大模型

3.通义听悟API

时间

9月19日-9月21日全天

地点

杭州云栖小镇 1号馆和2号馆‍‍‍‍‍‍‍

👇点击阅读原文，可直达领票链接

阿里语音AI

阿里巴巴通义实验室语音团队，基于多模态大模型语音识别、语音合成、自然语言理解等 AI 技术，实现“能听、会说、懂你”式的智能人机交互体验。

最新文章

开源上新｜通义语音处理技术ClearerVoice-Studio

看见新力量｜通义智能语音技术助力听力熊打造领先的AI智能终端——用大模型陪伴青少年学习成长

开源上新｜FunASR多语言离线文件转写软件包

云栖发布：从级联到端到端语音翻译大模型Gummy

2024云栖｜不变的追求，探觅智能应用场域的新可能

阿里通义音频生成大模型 FunAudioLLM 开源！

开源上新｜FunASR离线文件转写GPU软件包1.0

2024 Interspeech&ACL｜通义实验室入选两大会议论文速览

开源2.0｜从事视频剪辑的“熬者们”，自动化剪辑工具 FunClip请收好

技术沙龙直播｜3D-Speaker多模态说话人开源详解

在新东方，通义大模型已正式“上岗”

技术开源｜FunASR升级第三代热词方案

通义听悟功能上新！超长音视频自由问，还会做思维导图

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉