研究 | 创新的声学交通监测技术,解决数据稀缺难题,精准识别车辆信息

科技   2025-01-03 18:32   江苏  




在城市交通管理中,准确掌握车辆信息对优化交通流量、保障道路安全至关重要。但传统监测方法面临诸多挑战。由于真实交通音频数据标记稀缺,且应用场景复杂多样,以往基于单传感器的监测系统在车辆方向检测方面存在局限,而麦克风阵列虽能采集多通道信号改善方向检测,却受数据不足困扰。

DCASE 2024 挑战赛Task10:Acoustic-based Traffic Monitoring 聚焦此难题,推动学界探索创新解决方案。

数据协同团队智能信号处理组(GISP@HEU)领衔,萨里大学、悉尼科技大学及哈尔滨工业大学(深圳)合作参赛队伍所提交的系统,图增强双流特征融合网络(GEDF - Net)在众多顶尖声学研究团队中脱颖而出,荣获国际第一名。

GEDF - Net是一种基于预训练模型的图增强双流特征融合网络,主要由图增强双流特征提取(GDFE)模块、帧级融合模块和类别计数预测器组成。


在车辆类型特征提取(VTFE)分支,研究团队巧妙利用在 AudioSet 上预训练的 PANNs 模型,有效缓解数据稀缺问题,增强车辆类型特征表示。同时,引入图注意力机制,精准捕捉音频事件的时间关系,突出重要音频事件,进一步细化特征。例如,在处理复杂交通音频时,能更好地识别不同车辆类型独有的声音特征。

车辆方向特征提取(VDFE)分支则采用 GCC - PHAT 进行时间延迟估计来提取方向特征,并引入平均池化操作挖掘关键方向信息,便于后续特征融合。

帧级融合模块将提取的车辆类型和方向特征在时间帧上进行组合,形成兼顾两者的细粒度表示,为精准监测提供有力支持。

类别计数预测器最终依据这些融合特征,准确估计不同类型车辆(汽车或商用车)在不同行驶方向(左右向)的数量。

在实验环节,团队在 DCASE 2024 挑战赛任务 10 开发数据集上展开深入研究。对比实验表明,GEDF - Net 全面超越基线方法,在不同交通场景下均展现出卓越性能。在样本稀少的区域,如 loc2 和 loc4,借助预训练模型引入的外部知识,GEDF - Net 优势明显;在相对简单的 loc5 场景,其性能也十分稳定。与其他先进系统相比,GEDF - Net 同样表现出色,充分证明了图增强细粒度特征表示与预训练模型结合的有效性。


“我们的研究不仅提高了声学交通监控的准确性,还为处理现实世界中稀缺和复杂数据提供了新的思路。”该团队的负责人关键教授表示,“我们很高兴能够在DCASE挑战赛中展示我们技术的实力,并期待将这些研究成果应用到实际的交通监控系统中。”

更多信息:Shitong Fan, Feiyang Xiao, Wenbo Wang, Shuhan Qi, Qiaoxi Zhu, Wenwu Wang, Jian Guan. Graph-Enhanced Dual-Stream Feature Fusion with Pre-Trained Model for Acoustic Traffic Monitoring[J]. arXiv:2412.19078v1 [eess.AS], 2024.

   点击【阅读原文】,查看论文


  关于我们  


21dB声学人是中国科学院声学研究所苏州电声产业化基地旗下科技媒体,专注于声学新技术、音频测试与分析、声学市场调研、声学创业孵化、知识产权服务等。

  合作推广  


稿件投稿 | 创业支持 | 知产服务 | 技术转化
请发送需求至以下邮箱,我们将派专人与您联系
21db@ioasonic.com

  版权声明  

文中所有图片和文字版权归21dB声学人所有

如需转载或媒体合作,请与我们联系


21dB声学人
中国科学院声学研究所苏州电声产业化基地旗下科技媒体,专注声学技术创新与产业化发展,为十万声学人提供声学相关资讯与技术交流合作。
 最新文章