【直播预告】Xmart•学生论坛丨刘濠赫:LDMs in audio decoding

文摘   2024-11-07 18:04   北京  
Xmart青年论坛上海交通大学跨媒体语言智能实验室(SJTU X-LANCE lab)创办,中国计算机学会语音对话专委会主办,语音之家协办,旨在邀请国内外优秀的青年学者分享其最新科研工作和成果促进多元且深入的交流与合作Xmart学生论坛作为其中一个系列,致力于邀请国内外知名高校有成体系工作的研究生,主要通过线上分享的方式,系统地介绍其科研成果和心得,为青年学生打造一个学术探讨思维碰撞多学科交叉融合的平台。


Xmart•学生论坛丨刘濠赫:Latent Diffusion Model as a Versatile Coarse-to-Fine Audio Decoder

  形式:线上

  时间:11月9日(周六) 14:00 ~ 16:00

  报告摘要

Latent diffusion models (LDMs) have demonstrated exceptional generative capabilities across various modalities. This talk will explore LDMs as a coarse-to-fine audio decoder, offering a versatile framework for audio tasks. We will begin by covering the fundamentals of diffusion models and their control over forward and backward processes. Next, we will look into specific applications, including the AudioLDM series for text-to-audio generation, models for audio quality enhancement, and neural audio codecs. The talk will highlight common design principles across these models and include interactive demos. We will conclude by discussing the strengths and limitations of LDMs in audio decoding and potential future research directions.


  报告嘉宾

刘濠赫

刘濠赫,英国萨里大学视觉、语音与信号处理中心(CVSSP)的高年级博士生。他的研究方向包括音频质量增强、生成、源分离和识别等领域。他在 TPAMI/TASLP/JSTSP/ICML/AAAI/ICASSP/INTERSPEECH 等顶级学术期刊和会议上发表多篇论文。论文总引用量超过1800次,他的GitHub开源项目广受关注,共收获超过8500颗星标。代表作包括AudioLDM、SemantiCodec、NaturalSpeech等。此外,他还曾在Meta、微软和字节跳动等公司担任实习研究员。


  参加方式
直播将通过语音之家微信视频号进行直播
手机端、PC端可同步观看
👇👇👇


腾讯会议参加

会议号:409-237-723



实 验 室 介 绍


上海交通大学跨媒体语言智能实验室(SJTU Cross Media Language Intelligence Lab, X-LANCE)成立于2012年,前身是“智能语音实验室”(SpeechLab),经过多年发展,成为了涵盖视听文语言信息处理核心各研究领域的“跨模态语言智能实验室”。目前,跨媒体语言智能实验室的教师组有一位教授、四位副教授和一位科研助理,拥有二十余名博士研究生,近四十名硕士研究生,还包括ACM班、AI班、IEEE班、电院CS等专业、巴黎卓越工程师学院、密西根学院等的三十余名本科生。

实验室获得了包括国家重点研发计划、自然科学基金委优秀青年科学基金在内的诸多国家和企业项目支持。实验室与思必驰科技股份有限公司深度合作,成立了“上海交通大学思必驰智能人机交互联合实验室”。实验室可调动丰富的数据资源以及多达数百块H800、A800、A10等GPU卡的丰富计算资源,是国际上极少数可以进行产业级大尺度数据分析和研究的人工智能实验室之一。

X-LANCE实验室致力于做能够改变世界的国际水平的技术研究,实验室的学术信条:要用技术改变世界,首先必须是一个优秀的工程师;而一个杰出的工程师一定是一位科学家。



永久福利 直投简历
简历投递:join@speechhome.com
扫码关注我们
助力AI语音开发者的社区

语音之家
助力AI语音开发者的社区
 最新文章