客座编辑
陈婧, 北京大学智能学院研究员、博士生导师
陈婧于2009年获北京大学智能科学系信号与信息处理专业博士学位。2009年到2012年,她在英国剑桥大学从事博士后研究。她于2013年加入北京大学智能科学系,任百人计划研究员。她的主要研究领域包括听觉和语音感知、听觉计算模型、语音信号处理以及通过脑-机接口进行语音神经解码。
卢晶,南京大学声科学与工程系副系主任、教授、博士生导师
卢晶博士现任南京大学声学研究所副系主任、教授和南京大学—地平线智能音频联合实验室主任。他是npj Acoustics的编委会成员,中国声学学会常务理事,中国声学学会/中国电子学会声频工程分会副主任委员,美国声学学会(ASA)语音通信(Speech Communication)、信号处理(Signal Processing)和工程声学(Engineering Acoustics)技术委员会委员。他曾十余次担任声学领域顶尖国际会议(ASA、ICA、InterNoise、ICSV)国际科学委员和分会主席。他的主要研究方向包括音频信号处理、沉浸式音频、声学换能器以及音频处理系统的实时实现。他主持了20多个政府和行业项目,并发表了300多篇期刊和会议论文,其中包括声学领域顶刊美国声学学报(J. Acoust. Soc. Am.)论文30余篇。他获得授权发明专利超过40项,研究成果已在工业界得到广泛应用。
钱彦旻,上海交通大学计算机科学与工程系教授,博士生导师
钱彦旻博士于2007年获得中国华中科技大学电子与信息工程系学士学位,并于2012年获得中国北京清华大学电子工程系博士学位。自2013年以来,他一直在中国上海交通大学计算机科学与工程系工作,目前担任全职教授。2015年至2016年,他在英国剑桥大学工程系担任副研究员。他在语音和语言处理领域的同行评审期刊和会议上发表或共同发表了300多篇论文,包括T-ASLP、Speech Communication、ICASSP、INTERSPEECH和ASRU。申请80余项中美专利,6次带队获得国际评测冠军。他目前的研究兴趣包括语音和音频信号处理、自动语音识别和翻译、说话人和语种识别、语音抗噪与分离、音乐生成与理解、语音情感感知、多模态和跨模态信息处理、自然语言理解、深度学习建模,多媒体信号处理等。他曾获得中国多个顶级学术奖项,包括教育部长江学者计划和国家优秀青年基金。
牛海强,中国科学院声学研究所研究员,博士生导师
牛海强博士是中国科学院声学研究所声学国家重点实验室的全职教授。他目前担任《美国声学学会期刊》(JASA)的副编辑。同时,他还是Chinese Physics Letters (CPL)、Chinese Physics B (CPB)、《物理学报》、《物理》的 四刊联合青年编委、《声学学报》青年编委。此外,他还是中国科学院青年创新促进会的成员。2015年至2017年,他在美国加州大学圣地亚哥分校Scripps海洋研究所担任博士后研究员。他于2018年成为副教授,并于2021年晋升为全职教授。他的研究兴趣包括机器学习在海洋声学中的应用、稀疏贝叶斯学习在声学信号处理中的应用、地声反演和海洋声学层析成像。
Alan Hunter, 英国巴斯大学工程学院机械工程系副教授
Alan Hunter 博士于2001年和2006年分别获得新西兰坎特伯雷大学的电气与电子工程荣誉学士学位和博士学位。2007年至2010年,他在英国布里斯托大学担任研究助理,2010年至2014年,他在荷兰海牙的 TNO(荷兰应用科学研究组织)担任国防科学家。2014年,他加入了英国巴斯大学工程学院,目前担任机械工程系的副教授和副系主任。自2017年以来,他还担任挪威奥斯陆大学信息学系的兼职副教授。他的研究兴趣包括水下声学、信号处理、成像和机器智能。他特别关注使用声纳和海洋机器人进行水下遥感的应用。Alan博士是电气电子工程师学会(IEEE)的高级会员,并担任《IEEE 海洋工程期刊》的副编辑。
Timothy Rogers,英国谢菲尔德大学动力学研究组高级讲师
Timothy Rogers 博士是谢菲尔德大学动力学研究组的高级讲师。他的研究兴趣是数据驱动分析与工程动力学的交叉领域。他感兴趣的问题包括机器学习、尤其是贝叶斯方法,在信号处理、系统识别和工程系统监测中的应用。他的研究旨在将能从工程洞察和理解中获取的最大价值,与能够从数据中学习的模型的灵活性相结合。在这个过程中,他不仅关注所开发模型的预测准确性,还关注所返回解决方案在物理意义上的可解释性。
专题征稿
人工智能与机器学习在声学信号处理中的应用
AI and Machine Learning in Acoustic Signal Processing
扫码进入征稿页面
近年来,人工智能(AI)、机器学习(ML)与声学信号处理的交叉领域迅速发展,提供了新的方法来分析、解释和增强声音。将 AI 和 ML 技术整合到声学信号处理中的潜力,将有力促进从语音识别、音频内容分析、环境声音监测和生物医学诊断等众多应用。本特刊旨在探讨这个领域的最新发展和突破,为研究人员和从业者提供一个展示他们前沿进展的平台。
本特刊的主要目标是探索如何利用 AI 和 ML 技术来应对声学信号处理中的复杂性。应用AI和ML的优势在于能够有效处理大量数据、实时适应新模式以及提高信号分析和增强任务的准确性和效率。本特刊希望吸引推动理论研究和实用解决方案的论文,提供可在实际应用中实施的新工具。我们欢迎如下投稿主题:
声学场景分析:开发用于识别和分类各种声学环境的算法,这对于智能监控、城市噪声监测和上下文感知系统等应用至关重要。
信号增强:特别关注基于 AI 的降噪、去混响和信号清晰度改善技术。这些方法在通信、助听器、水下通信以及在各种噪声环境中微弱水下信号检测等场景中至关重要。
声源定位与分离:AI/ ML 模型在多声源环境中检测、定位和隔离目标声源。应用包括会议系统中的说话者分离、提高娱乐系统中的音频质量、增强自主系统中的环境感知,以及提高水下声源定位/检测的准确性和分辨率。
语音与音频处理:将深度学习模型应用于语音识别(ASR)、音频生成、语音转换、情感识别、语音翻译等任务。这些任务对于开发更自然和直观的人机交互系统至关重要。
音乐信号处理:研发用于访问、分析、操作和创作音乐的 AI 模型,例如音乐信息检索、音乐生成、音乐合成、计算机伴奏和机器音乐演奏。
环境与生物医学声学:这些领域中的 AI 应用涉及利用声学信号进行野生动物监测、检测环境变化以及医学诊断。例如,处理水下声学信号用于海洋生物学和环境监测,分析心脏或肺部声音用于诊断,超声信号处理用于医学成像。
声学检测方法:用于其他物体检测的新方法。例如,在声学数据中检测异常、时间序列分类、裂缝/缺陷定位。
我们鼓励能展示跨学科方法或 AI/ML 与声学信号处理融合的研究,欢迎能突出新方法、新应用和塑造声学信号处理未来新兴趋势的投稿。
点击“阅读原文”,访问征稿页面