研究 | 创新的声学交通监测技术，解决数据稀缺难题，精准识别车辆信息

科技 2025-01-03 18:32 江苏

在城市交通管理中，准确掌握车辆信息对优化交通流量、保障道路安全至关重要。但传统监测方法面临诸多挑战。由于真实交通音频数据标记稀缺，且应用场景复杂多样，以往基于单传感器的监测系统在车辆方向检测方面存在局限，而麦克风阵列虽能采集多通道信号改善方向检测，却受数据不足困扰。

DCASE 2024 挑战赛Task10：Acoustic-based Traffic Monitoring 聚焦此难题，推动学界探索创新解决方案。

数据协同团队智能信号处理组（GISP@HEU）领衔，萨里大学、悉尼科技大学及哈尔滨工业大学（深圳）合作参赛队伍所提交的系统，图增强双流特征融合网络（GEDF - Net）在众多顶尖声学研究团队中脱颖而出，荣获国际第一名。

GEDF - Net是一种基于预训练模型的图增强双流特征融合网络，主要由图增强双流特征提取（GDFE）模块、帧级融合模块和类别计数预测器组成。

在车辆类型特征提取（VTFE）分支，研究团队巧妙利用在 AudioSet 上预训练的 PANNs 模型，有效缓解数据稀缺问题，增强车辆类型特征表示。同时，引入图注意力机制，精准捕捉音频事件的时间关系，突出重要音频事件，进一步细化特征。例如，在处理复杂交通音频时，能更好地识别不同车辆类型独有的声音特征。

车辆方向特征提取（VDFE）分支则采用 GCC - PHAT 进行时间延迟估计来提取方向特征，并引入平均池化操作挖掘关键方向信息，便于后续特征融合。

帧级融合模块将提取的车辆类型和方向特征在时间帧上进行组合，形成兼顾两者的细粒度表示，为精准监测提供有力支持。

类别计数预测器最终依据这些融合特征，准确估计不同类型车辆（汽车或商用车）在不同行驶方向（左右向）的数量。

在实验环节，团队在 DCASE 2024 挑战赛任务 10 开发数据集上展开深入研究。对比实验表明，GEDF - Net 全面超越基线方法，在不同交通场景下均展现出卓越性能。在样本稀少的区域，如 loc2 和 loc4，借助预训练模型引入的外部知识，GEDF - Net 优势明显；在相对简单的 loc5 场景，其性能也十分稳定。与其他先进系统相比，GEDF - Net 同样表现出色，充分证明了图增强细粒度特征表示与预训练模型结合的有效性。

“我们的研究不仅提高了声学交通监控的准确性，还为处理现实世界中稀缺和复杂数据提供了新的思路。”该团队的负责人关键教授表示，“我们很高兴能够在DCASE挑战赛中展示我们技术的实力，并期待将这些研究成果应用到实际的交通监控系统中。”

更多信息：Shitong Fan, Feiyang Xiao, Wenbo Wang, Shuhan Qi, Qiaoxi Zhu, Wenwu Wang, Jian Guan. Graph-Enhanced Dual-Stream Feature Fusion with Pre-Trained Model for Acoustic Traffic Monitoring[J]. arXiv:2412.19078v1 [eess.AS], 2024.

▼ ▼ ▼ 点击【阅读原文】，查看论文

关于我们

21dB声学人是中国科学院声学研究所苏州电声产业化基地旗下科技媒体，专注于声学新技术、音频测试与分析、声学市场调研、声学创业孵化、知识产权服务等。

合作推广

稿件投稿｜创业支持｜知产服务｜技术转化

请发送需求至以下邮箱，我们将派专人与您联系

21db@ioasonic.com

文中所有图片和文字版权归21dB声学人所有

如需转载或媒体合作，请与我们联系

21dB声学人

中国科学院声学研究所苏州电声产业化基地旗下科技媒体，专注声学技术创新与产业化发展，为十万声学人提供声学相关资讯与技术交流合作。

最新文章

网络研讨会 | 1月7日模态测试、分析与仿真，点击立刻报名

研究 | 创新的声学交通监测技术，解决数据稀缺难题，精准识别车辆信息

独特的回声：岩石艺术遗址的声学研究

研究 | 新模型改善低资源条件下的声学场景分类

研究 | 通过流匹配实现高效、高质量的文本转音频生成

讨厌噪音？你可能是个天才：叔本华论噪音

属于21dB声学人的2024年终总结

研究 | 创新无线声学传感网络助力城市环境噪声监测

直播回放 | 声学专利对话：聊聊知识产权那些事

研究 | 高噪声环境下的语音增强技术，在极低信噪比条件下显著提升目标语音的质量

动物间谍：情报机构眼中的 “秘密武器”

声学专利对话 | 直播预告：“聊聊知识产权那些事”主题分享周日开播

研究 | 基于模板模式匹配的声学定位模型实现高精度室内声源定位

研究 | 基因调控因子或可帮助失聪患者的听觉细胞再生，逆转耳聋

研究 | 一种基于深度学习的声源定位新方法，显著减少训练数据需求

专利 | 苹果新专利：通过手势激活耳机的隐私模式

专利 | 一种作为耳机扬声器单元的微型换能器

企业推介 | 中科声知知识产权：创新价值的守护与赋能者

研究 | 生物声学研究发现豹子可以通过其独特的吼叫声来识别

研究 | 低功率声学增强紧凑型热交换器，为电子设备的高效冷却提供新方案

从铃铛到唱诗班，独属于圣诞节的音色

前沿 | 近期【声学】相关学术论文整理

研究 | 西安交通大学研究出一种具有低噪声振荡读出电路的 MEMS 石英谐振加速度计

科普 | 太阳会发出噪音吗？

专利 | 带有噪声过滤功能的婴儿监视系统

降噪耳机能做什么和不能做什么

心灵之耳与内心之声：探究大脑的听觉想象力

专利 | 一种主动降噪音响系统

研究 | 为深基坑爆破开发的噪声与振动冲击模拟器

研究 | 贝多芬如何创作音乐？声音和振动在大脑中汇聚以增强感官体验

专利 | Verasonics 获超声波收发器设计专利，实现低失真和实时信号监控

前沿丨基于“虚拟透镜”的水下超分辨率声学成像

如何处理轴承的噪声与振动

推广：网络研讨会 | HBK与立讯 - MEMS扬声器的电声学测试，点击立刻报名

研究 | 深度神经网络与多流架构在助听器中的性能比较：噪声环境中的语音处理

研究 | 增强双模成像：新型换能器同时提供超声和光声成像

专利 | 一种减少压缩机噪声（特别是气动噪声）的消声器装置

研究 | 利用微金属透镜进行超声波成像以实现先进材料诊断

格力新专利：双层隔音棉结构实现宽频降噪

AirPods Pro 2 作为助听器效果如何？测评人员对其进行了测试

研究 | 脑图谱促进对精神分裂症患者语言和幻觉的理解

研究 | 增材制造吸声超材料综述

研究 | 微型机器人通过精准药物输送瞄准肿瘤

森海塞尔麦克风以沉浸式音频捕捉SpaceX星舰试飞

研究 | 多目标非侵入式助听器语音评估模型：HASA-Net+的提出与应用

研究 | 超声引导的微观“花”颗粒在靶向药物输送中显示出良好的前景

噪声增强 CAM（连续自回归模型）：推进实时音频生成

专利 | 格力新风降噪技术：为健康室内空气质量保驾护航

巴黎圣母院重新开放,大教堂内的声学效果有无改变？

研究 | 灵长类动物研究揭示了大脑中分离信号和噪声的神经机制

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉