前沿 | 近期【声学】相关学术论文整理

科技   2024-12-23 18:31   江苏  




本文整理了一些近期发表的声学相关论文,供大家了解科研进展。



1.使用声音传输损耗编码变分自编码器的通风声学谐振器逆向设计

Journal of Mechanical Science and Technology

Pub Date  : 2024-12-21

DOI : 10.1007/s12206-025-0103-y

Jin Yeong Song, Seok Hyeon Hwang, Min Woo Cho, Keon Ko, BaekGyu Kim, Kyungjun Song, Sang Min Park

文章摘要:
用于同时进行声音衰减和通风功能的通风声学谐振器(VARs)在声学领域带来了独特的挑战。传统的通风声学谐振器设计方法受限于对人类直觉的依赖以及大量计算资源的需求。本研究提出了一种新型的声音传输损耗编码变分自动编码器(STL-VAE),用于通风声学谐振器的逆向设计。STL-VAE 模型通过将目标声音传输损耗(STL)编码到潜在空间中来克服这些限制,从而能够生成实现宽带声音衰减的 VAR 设计。STL-VAE显著降低了目标 STL 和生成的 VAR 设计之间的均方误差(MSE),比训练数据集中的最佳设计高出 100 倍以上。所提出的方法为设计复杂的声学超材料提供了一种高效和准确的途径,可用于城市和工业降噪领域。


2.结合声呐、相机和深度学习的水下混凝土桥梁结构两步快速检测

Computer-Aided Civil and Infrastructure Engineering

Pub Date  : 2024-12-17

DOI : 10.1111/mice.13401

Weihao Sun, Shitong Hou, Gang Wu, Yujie Zhang, Luchang Zhao

文章摘要:
桥墩的水下部位存在缺陷对跨河(江)桥梁的安全性和耐用性构成潜在危害。水下缺陷隐蔽,检测难度大,很容易被忽视。声学方法在直接对水下缺陷进行精确测量方面面临诸多挑战,而光学方法则非常耗时。本研究提出了一种将声学与光学相结合的两步式水下混凝土桥墩快速检测方法。第一步将宏观声纳扫描与改进后的 YOLOv7(目标检测算法) 相结合,以检测和定位桥墩及其缺陷。其次,利用相机靠近缺陷处进行图像采集,并使用改进后的 DeepLabv3+(语义分割模型) 进行缺陷识别。检测结果显示,在缺陷及桥墩检测方面,平均精度均值(平均准确率均值 @0.5)达到 95.10%;在对裸露钢筋及剥落情况进行识别时,交并比均值为 0.914。该方法已应用于一座实际的跨江(河)桥梁,相较于传统方法对一排 11 个桥墩进行评估时,其检测时间缩短了 51.2%。

3.摩擦羽毛的声学效果:猫头鹰羽毛的天鹅绒减少了摩擦噪声

Journal of Experimental Biology

Pub Date  : 2024-12-13

DOI : 10.1242/jeb.246234

Lori G Liu,Christopher J Clark

文章摘要:

与猫头鹰安静飞行能力相关的一种羽毛结构是它们飞行羽毛上柔软的背侧表面:天鹅绒。这种天鹅绒是从羽毛小枝向上延伸出的细长丝状羽支构成的一片绒毛层。空气动力学噪声假说认为,这种天鹅绒可降低由湍流引起的空气动力学噪声;而结构噪声假说则认为,天鹅绒起到干润滑剂的作用,能减少羽毛相互滑动产生的摩擦噪声。

我们通过对斑鸮(Strix varia)翅膀上 24 个位置的天鹅绒长度进行量化,然后定性评估 24 种鸟类中天鹅绒的存在来研究结构噪声假设。我们发现,天鹅绒在猫头鹰、夜鹰、鹰和隼中至少独立(趋同)进化了4次。

接着,我们将 17 种鸟类(包括独立进化出天鹅绒的四个分支)的 96 对羽毛相互摩擦,进行三种实验:对照组、涂抹发胶(破坏天鹅绒)和去除发胶。羽毛相互摩擦的声音是宽频带的,类似于摩擦砂纸或魔术贴的声音。有天鹅绒的物种产生的摩擦声比没有天鹅绒的物种低20.9 分贝,当用发胶处理后,带有天鹅绒的羽毛的声音增加了 7.4 分贝,而相较于对照组,缺乏天鹅绒的羽毛的声音仅增加了 1.7 分贝。这些结果都支持天鹅绒的主要功能是减轻羽毛相互摩擦的声音的假设。

4.声学中基于 Krylov 的模型降阶的误差估计和停止准则

arXiv - EE - Systems and Control

Pub Date  : 2024-12-13

DOI : arxiv-2412.10559

Siyang Hu, Nick Wulbusch, Alexey Chernov, Tamara Bechtold

文章摘要:
根据所关注的频率范围,基于有限元的声学问题建模会产生具有极高维状态空间的动力系统。由于这些模型大多可以用稀疏矩阵的二阶线性动力学系统来描述,因此数学模型降阶为加快仿真过程提供了一种颇具价值的可能性。在这项工作中,我们着手解决在给定所需精度的情况下,为降阶系统寻找最优阶数的问题。为此,我们重新审视了一种基于两次连续克雷洛夫(Krylov)迭代所得的两个降阶模型差异的启发式误差估计器。我们对该估计器进行了数学分析,并证明了两个连续降阶模型的差异确实为真实的模型降阶误差提供了足够准确的估计。这一说法得到了两个声学模型上的数值实验的支持。我们简要讨论了它作为基于 Krylov 的模型降阶的停止准则的可行性。

5.多声道语音增强算法的音素量表评估

Trends in Hearing

Pub Date  : 2024-12-12

DOI : 10.1177/23312165241292205

Nasser-Eddine Monir, Paul Magron, Romain Serizel

文章摘要:

在复杂的声学环境中,语音清晰度受到噪声和混响的挑战,多声道语音增强技术成为帮助听力损失患者的一种颇具前景的解决方案。此类算法通常在语句层面进行评估。然而,这种方法忽略了通过音素特定分析所揭示的细微声学差别,可能会掩盖有关其性能的关键信息。

本文对三种前沿的多声道语音增强算法进行了深入的音素层面评估。这三种算法(filter-and-sum network、minimal variance distortion free response 和 Tango)在不同的噪声条件和空间设置中进行了广泛的评估,利用实测房间脉冲响应开展逼真的声学模拟,并借助双耳听力设置中多个麦克风所提供的多样性优势。

这项研究着重于精细的音素层面分析,结果显示,虽然像爆破音这类音素受环境声学影响极大,且相关算法较难对其进行处理,但像鼻音和咝音这类音素在经过增强处理后则有显著改善。这些研究表明,在嘈杂环境下音素清晰度有了重要提升,其研究结果可为开发更具个性化且能识别音素的助听器技术提供思路。此外,虽然这项研究提供了有关已处理语音的物理指标的广泛数据,但这些物理指标不一定模仿人类对语音的感知,因此,这些发现的影响将需要通过听力测试来进一步调查。

6.通过时域研究探讨移动和多个噪声源对通风窗主动噪声控制性能的影响

Building and Environment

Pub Date  : 2024-12-09

DOI : 10.1016/j.buildenv.2024.112425

Johann Kay Ann Tan, Siu-Kit Lau

文章摘要:

交通基础设施带来的噪声是交通拥堵城市的主要噪声污染源。尤其是在那些炎热潮湿的城市中,更需要好的建筑立面元素来改善建筑的声学和通风性能以应对噪声和炎热气候的干扰。通风窗口设计为应对这些干扰提供了潜在的解决方案,并且可以通过在通风腔内实施主动噪声控制 (ANC) 进行改进。

高度城市化的环境可能有无数的噪声源同时出现,其中某些人声源是动态的和移动的,例如来自车辆和铁路的噪声。在本研究中,采用时域方法分析多个噪声源和移动噪声源对通风窗中 ANC 性能的影响。

本研究进行了各种仿真实验,结果表明,由于噪声源数量的增加,主动噪声控制性能会有所下降,但仅涉及单一单频的噪声源数量增加情况除外。研究还显示,主动噪声控制的收敛时间会受到多频噪声源数量增加的影响。最后,移动噪声源随时间变化的主动噪声控制性能会因移动噪声源撞击通风窗时所处的位置不同而发生改变。

7.开发改进的 Mel-Frequency 倒谱系数信号处理算法,以通过无线网络增强水声信号

Measurement 

Pub Date  : 2024-12-07

DOI : 10.1016/j.measurement.2024.116414

P. Ashok, B. Latha

文章摘要:

水下应用,包括深水定位系统、预警系统、自主水下航行器的跟踪以及深水和浅水的水下无线通信等,都面临独特的挑战。水下环境中的环境噪声变化很大,位置依赖性强,且具有独特性。水下通信固有的衰减、色散和环境噪声使这些挑战更加严峻。

为了通过无线网络增强水下声学信号,开发一种改进的梅尔频率倒谱系数(IMFCC)算法。该过程从使用水听器或水下传感器进行细致的数据收集开始,然后进行全面的预处理,以消除可能降低信号质量的噪声、伪影和干扰。特征提取是一个关键步骤,涉及将IMFCC适配到水下领域。这种适配可能需要修改标准的IMFCC参数,以更好地捕捉水下信号的特性。

对算法的进一步改进包括优化滤波器组参数、调整倒谱分析阶段,并整合对水下信号传播的深入理解。通过利用水下声学知识,包括长混响时间和频率相关衰减的影响,可以定制算法以有效增强水下信号。在特征提取过程中考虑环境因素可确保在各种水下场景中实现稳健的性能。这些增强功能使算法能够从水声信号中提取有意义的特征,为在水下环境中通过无线网络改进通信和传感能力铺平了道路。

8.应用空间傅里叶变换和具有角度依赖性曲折度的 Johnson-Champoux-Allard 模型研究声波在多孔刚性材料中的传播

Applied Acoustics 

Pub Date  : 2024-12-06

DOI : 10.1016/j.apacoust.2024.110464

Haydar Aygün

文章摘要:

针对包含嵌入环氧树脂芯矩阵中的回收聚氨酯玻璃珠的材料的声学特性进行了理论、计算和实验研究,以评估其在建筑行业以及嘈杂环境中的适用性。空间傅里叶变换方法基于确定两个平行表面上的复杂压力分布,并通过使用二维空间傅里叶变换将它们分解为平面波分量,以便将其用于分离入射波和反射平面波分量。这将有助于确定吸收系数和反射系数,这是了解材料存储声能能力的两个重要参数。

采用启发式角度依赖性曲折度的 Johnson-Champoux-Allard 模型预测材料的有效密度和体积模量,用于计算波数和特性阻抗。最终,用这些参数来确定多孔材料在斜入射角下的吸收系数和反射系数。

在全消声室中对两个回收结构样品进行了实验,以测量它们的吸声系数。运用多孔基体模型,并结合“压力声学”和“固体力学”模块,使用 COMSOL Multiphysics 软件进行计算仿真,以计算材料的吸声系数和反射系数。对从 COMSOL 仿真、测量和解析解中获得的结果进行了比较。来自三个理论、数据和计算研究中获得的结果非常一致。

9.气泡雾化器喷雾声学特性分析与研究

Physics of Fluids 

Pub Date  : 2024-12-05

DOI : 10.1063/5.0239429

Jun Xie, Liansheng Liu, Yuhui Li, Xinpeng Huo, Xuanchen Liu, Ziyue Wang

文章摘要:

雾化器喷孔下游的气泡膨胀和破裂现象是液体雾化成液滴的主要原因。然而,由于高流量密度、高流速、微小气泡尺寸和气泡寿命短等带来的挑战,用实验验证气泡雾化机制一直难以实现。

在这项研究中,进行了理论和实验分析,以研究气体射流、液体射流和气液两相喷雾的远场声学特性。使用噪声分析仪来测量这三种配置产生的声发射:气体射流、液体射流和气液混合射流(即泡腾雾化)。基于声学模态域内的全局噪声特性建立了流态模型。理论分析包括量化雾化器出口下游的气泡群,以及汇总气泡簇破裂产生的噪音。

结果表明,气泡雾化产生的噪声随着混合室压力的增加而增加,但随着气体空隙率的增加而降低。同时,该噪声会随着内部两相流型的变化而出现波动。研究证实了在喷孔下游存在大量微气泡破裂的情况。值得注意的是,两相喷雾产生的噪声并不仅仅是气体和液体射流噪声的叠加;相反,它是多个来源的复合叠加,包括气体射流噪声、液体射流噪声和气泡破裂噪声。本研究为气泡雾化领域提供了重要的理论见解和实践意义。

10.利用虚拟声学评估空间生态声学监测技术

Methods in Ecology and Evolution  

Pub Date  : 2024-12-05

DOI : 10.1111/2041-210x.14405

Neel P. Le Penru, Becky E. Heath, Jamie Dunning, Lorenzo Picinali, Robert M. Ewers, Sarab S. Sethi

文章摘要:

小型麦克风阵列和声源定位算法在生态系统的被动声学监测 (PAM) 中日益普及。这些技术能够分析自然声景的空间特征,为生物多样性和生态系统健康状况提供更多见解。虽然其中许多技术已经在实地进行了评估,但缺乏可控、可重复的测试方法。

我们开发了一种 Ambisonics 虚拟声音环境 (VSE),用于模拟真实的自然声景,以评估空间 PAM 技术。我们使用带有六个麦克风阵列的 PAM 记录器验证了这种新方法,从中提取了一套典型的生态声学指标,包括声学指数,以及分别通过 BirdNET 和 HARKBird 软件所做的鸟类物种预测和定位。

我们首先通过对比实地录音和基于 VSE 的录音在这些指标上的情况,来验证 VSE 是否能够很好地复制自然声景以测试 PAM 技术。为了将 VSE 作为测试 PAM 硬件的环境进行试点,我们使用同一套指标,来比较阵列在不同俯仰角下录制的 VSE 音频,从而评估了方向对六麦克风阵列性能的影响。最后,我们将虚拟声音环境作为被动声学监测软件的测试平台进行试点,研究 BirdNET 和 HARKBird 软件在添加到虚拟声音环境所复现声景中的鸟叫声上的表现情况。

虽然 VSE 和实地录音在某些指标(如频谱组成和 BirdNET 预测)上具有相似性,但 Ambisonics 的感知偏差和对空间混叠的敏感性限制了可开展的空间分析。不过,我们的试验表明,设备方向会影响 HARKBird 的性能和某些生态声学指标的性能,而 BirdNET 和 HARKBird 在更响亮、更有方向性的鸟叫声中表现最好。

我们的结果证明了这种方法的潜力,但也凸显了使用基于 Ambisonics 的 VSE 的局限性。因此,我们为此类系统的使用和改进提供了指南,以实现更标准化、更可控的 PAM 技术基准测试,使从业者能够在使用这些重要工具时做出更明智的决策。

11.MoD-ART:声辐射传递的模态分解

arXiv - EE - Systems and Control

Pub Date  : 2024-12-05

DOI : arxiv-2412.04534

Matteo Scerbo, Sebastian J. Schlecht, Randall Ali, Lauri Savioja, Enzo De Sena

文章摘要:
当同一环境中存在多个声源和听众时,以交互速度对后期混响进行建模是一项极具挑战性的任务。当环境在几何结构上较为复杂和/或具有不均匀的能量吸收(例如耦合体积)时,这尤其成问题,因为在这种情况下,后期混响取决于声源和听者的位置,因此必须实时适应它们的移动。

我们提出了一种新颖的应对该任务的方法,称为声辐射传输的模态分解MoD-ART),它可以有效地处理高度复杂的场景。该方法基于 Acoustic Radiance Transfer 的几何声学方法,我们从中提取一组能量衰减模式及其与声源和听者的位置关系。

在本文中,我们描述了 MoD-ART 的物理和数学意义,强调了其优势和在不同场景中的适用性。通过对该方法的计算复杂性的分析,表明了它与光线追踪相比非常有利。我们还提供了仿真结果,表明 MoD-ART 可以捕获多重衰减斜率和颤动回声。

信息源于:X-MOL


  关于我们  


21dB声学人是中国科学院声学研究所苏州电声产业化基地旗下科技媒体,专注于声学新技术、音频测试与分析、声学市场调研、声学创业孵化、知识产权服务等。

  合作推广  


稿件投稿 | 创业支持 | 知产服务 | 技术转化
请发送需求至以下邮箱,我们将派专人与您联系
21db@ioasonic.com

  版权声明  

文中所有图片和文字版权归21dB声学人所有

如需转载或媒体合作,请与我们联系


21dB声学人
中国科学院声学研究所苏州电声产业化基地旗下科技媒体,专注声学技术创新与产业化发展,为十万声学人提供声学相关资讯与技术交流合作。
 最新文章