Arxiv:https://arxiv.org/pdf/2403.10521
本期概述
哈喽大家好!属于是失踪人口回归了。。近期版本赶发布,连续两天干到两点钟。。不过别担心~失误只会发生一次!李小毛以后多备点存稿!
本期介绍一个高效的感知模型:P-MapNet:由 SDMap 和 HDMap 先验增强的具有远见的地图生成器。主要研究了在自动驾驶领域中通过利用先验地图信息来增强高精度地图(HDMap)生成的方法。该网络通过结合标准定义地图(SDMap)和高精度地图(HDMap)的先验知识来提高地图生成的性能和精度。主要创新点如下:
结合SDMap和HDMap的先验知识:提出了同时利用SDMap和HDMap先验信息的创新方法,通过多头交叉注意力机制实现了SDMap和BEV特征的有效融合。使用MAE进行HDMap先验的捕捉和应用,从而提高生成地图的结构化程度和真实性
适应远距离感知的地图生成:P-MapNet被设计为一种“远视”解决方案,特别是在车辆前方较远距离的地图生成中表现优异,适用于感知距离超过100米的场景。通过结合先验信息,模型能够在远距离的交叉路口和车道中提供更准确的地图预测。
灵活的推理模式:P-MapNet支持不同的推理模式,如仅使用SDMap先验(S模式)或结合SDMap和HDMap先验(S+H模式)。
PipeLine
P-MapNet Pipeline主要由三个部分组成:BEV特征提取、SDMap特征提取和HDMap先验精细化。BEV特征提取:图像通过神经视图变换进行处理,以获取鸟瞰图(BEV)特征,同时使用PointNet框架处理LiDAR数据以获得空间特征。进一步通过卷积神经网络(CNN)进行处理。SDMap特征提取模块:从OpenStreetMap中SDMap,经过卷积神经网络处理生成SDMap先验特征。最后采用多头注意力机制(包括自注意力和交叉注意力)来对齐并融合BEV特征和SDMap先验特征。HDMap先验精细化:通过预训练的掩码自动编码器(MAE)对HDMap先验进行精细化处理。利用ViT模型和分割头,该模块对初始HDMap预测进行精细化,生成最终的高精度地图预测。
1. SDMap先验模块(SDMap Prior Module):主要目标是解决车载传感器固有的挑战(如远距离道路不可见性和恶劣天气条件),进而提供一个稳定一致的环境轮廓。
为了解决BEV特征与SDMap特征无法解决空间上的错位问题,采用了多头交叉注意力模块来优化SDMap先验和BEV 特征的对齐。
2. HDMap先验模块(SDMap Prior Module):旨在生成更精确和真实的远视高精度地图(HDMap)。该模块通过自监督学习预训练的掩码自动编码器(MAE)来捕捉 HDMap的分布特征,从而提高地图生成的连续性和真实性。
输入:初始HDMap预测 、掩码后的HDMap真值。
输出:最终HDMap预测。
2.1.MAE模块:采用了一种Vision Transformer模型和全卷积分割头。通过在数据集的训练集中对 HDMap的真实值进行掩码处理,并使用ViT模型对其进行编码,从而生成掩码后的HDMap。分割头用于将掩码后的HDMap还原为其原始的HDMap真实值,这一过程通过像素级交叉熵损失进行自监督
2.2HDMap掩码:该模块尝试了两种不同的掩码策略来预训练模块,分别是网格掩码和随机掩码。网格掩码策略采用固定的掩码块大小,而随机掩码策略则从—组候选中随机选择掩码块大小和掩码比例,以减轻预训练期间的过拟合问题。随机掩码策略随机选择掩码补丁大小和掩码比率,以增加数据多样性,从而更好地捕捉HDMap的先验信息。