百度智驾 | 跨模态匹配算法实现厘米级高精定位！

文摘 2024-08-19 23:44 上海

Arxiv：https://arxiv.org/pdf/2307.08991

本期概述

哈喽大家晚上好~

最近接到端到端高精定位的任务，刚好做了一些文献调研~我们今天来学习一篇百度自动驾驶团队的研究：EgoVM: Achieving Precise Ego-Localization using Lightweight Vectorized Maps。

EgoVM将矢量地图元素与BEV感知元素进行匹配，最终实现厘米级的定位精度!主要的创新点如下：

使用轻量化的矢量地图实现高精定位
设计了一种新的跨模态匹配模块

PipeLine

EgoVM网络的架构，分为三个主要模块：BEV特征提取、跨模态匹配和姿态求解。BEV特征提取模块，对相机图像和3D LiDAR点云分别进行卷积，然后使用Transformer解码器进行融合。跨模态匹配模块将矢量化地图元素和BEV感知特征输入到Transformer解码器中进行跨模态匹配。姿态求解模块通过姿态采样生成多个候选姿态，并通过双线性插值获取输出位姿。

（1）BEV特征提取：对相机图像和3D LiDAR点云分别进行卷积，然后使用BEV-Former解码器进行融合。

图像编码器：使用ResNet或VoVNet提取图像特征。该部分不再赘述

LiDAR编码器：将三维点云打平到二维图像上，再使用PointPillars提取特征。该部分不再赘述。

BEV融合：利用BEV-Former解码器将相机特征和LiDAR特征融合，使用了自注意力和交叉注意力机制。

BEV-Former：https://arxiv.org/abs/2203.17270

（2）跨模态匹配：首先对局部矢量地图进行语义和位置编码处理，然后将地图特征和感知特征进行匹配。

语义编码：使用一个语义分割模型，对每一个地图要素匹配一个语义嵌入，以进行后续的匹配处理。

位置编码：将每个地图元素的位置编码为一个与其语义嵌入相结合的高维特征向量。具体操作如下：

其中，是初始位置坐标，是 BEV 空间的尺度范围。语义嵌入和位置编码嵌入表示为:

自注意力模块：地图查询输入多头自注意力，以捕捉地图元素之间的关系。具体公式为:

其中，表示注意力头的数量，和是可学习的投影矩阵，表示地图查询和之间的注意力权重。

交叉注意力模块：将地图查询与BEV特征进行匹配。使用了可变形注意力 (deformable attention) 机制。

其中，是通过将地图元素的端点投影到 BEV 空间上得到的参考点，是 BEV 特征，是 BEV空间的二维位置编码。

（3）姿态求解：基于直方图的姿态求解器来估计最优的姿态偏移量。包括三个步骤：候选姿态生成、最优姿态偏移估计。

候选姿态生成：对和航向角这三个维度进行网格搜索，生成一系列候选姿态。每个候选姿态都表示为:

最优姿态偏移估计：将矢量化地图元素投影到鸟瞰视角(BEV)平面上，并通过双线性插值在BEV特征图上获取相应的特征。计算感知特征与地图嵌入的相似度得分：

其中，是根据候选姿态投影得到的BEV特征，是对应的地图嵌入，是共享的多层感知器。通过Softmax归一化所有候选姿态的相似度得分，得到后验概率，其中代表BEV特征和地图嵌入的集合。姿态偏移和协方差通过以下公式计算得到:

通过离散化搜索空间来寻找姿态偏移最优解。

Experiments

EgoVM模型（包括结合LiDAR数据和仅视觉输入的版本）在纵向、横向和航向上的定位精度都是最高。

EgoVM的多模态融合表现，能够生成更清晰、可信的BEV特征图

本期结语

李小毛其实最关注的是运行效率，不过在实验部分没有展示？

路口的车道级高精定位确实是一个比较重要，并且复杂的问题。传统的方法通常会使用感知要素和高精地图矢量要素进行拓扑匹配。但是这种方法通常受限于感知信息和地图信息的同步性。本文的方法似乎也没有进行讨论？

往期回顾

中科院&加州大学 | GenAD：生成式端到端自动驾驶框架

理想汽车自动驾驶方案 | DriveVLM：自动驾驶与大型视觉语言模型的融合方法

强推收藏！使用大语言模型的自动驾驶方案研究综述

PAMI 2024 | 端到端自动驾驶的主流方案汇总(1)

提前过年？20.99万元起！2025款极氪001、007上市！

如果对你的开发、科研有帮助，拜托拜托关注我们，我们将持续奉上优秀的端到端自动驾驶领域研究的分享干货！

温馨提示：点赞＝学会，收藏＝精通

点击在看，我们一起充电！

端到端自动驾驶

关注AD（Autonomous Driving）行业最前沿的人工智能解决方案，致力于打造为一个自动驾驶从业者及相关科研学者们的课外充电，技术分享，以及社区交流的服务平台！

最新文章

DeepSeek预测：2030年将实现完全自动驾驶

草履虫都能看懂的误差状态卡尔曼滤波器（附实验）

transformer手绘图解（注意力机制的本质）

研究方向分享(1)：冷门但不偏门～业界急需...

卡尔曼滤波器图解（细节&全局理解的船新版本！！！）

最新研究 | V2X-VLM：E2E协同自动驾驶框架

西湖大学&理想汽车 | Delphi：基于扩散模型的长视频生成方法

大语言模型&多模态模型在自动驾驶中的应用综述（2）

被连续举报的第五天 | 自动驾驶基础模型的综述

理想汽车&中科院 | PlanAgent：使用MLLM的自动驾驶闭环运动规划

理想汽车：UA-Track，3D多目标跟踪（MOT）框架

CVPR 2024 | 理想汽车方案：场景数据检索方法处理长尾问题

Co-Driver：使用Qwen-VL（通义千问）实现辅助驾驶

ECCV 2024 | 弃用低精地图？EP-BEV：跨视角地图定位方案

ECCV 2024 | GeMap：矢量化高精地图在线构建

FastBEV 作者首次公开解读---《中低算力平台友好的环视特征融合方案》完整视频版

在端到端的浪潮下，感知&规划(模型)方向是否还会单独存在？

百度智驾 | 跨模态匹配算法实现厘米级高精定位！

中科院&加州大学 | GenAD：生成式端到端自动驾驶框架

理想汽车自动驾驶方案 | DriveVLM：自动驾驶与大型视觉语言模型的融合方法

强推收藏！使用大语言模型的自动驾驶方案研究综述

PAMI 2024 | 端到端自动驾驶的主流方案汇总(1)

提前过年？20.99万元起！2025款极氪001、007上市！

秦通新作 | CS-NeRF：通过NeRF模型重建众包地图

CVPR 2024 | BEVSee：无需相机标定的BEV感知

CVPR2024 | 通过大语言模型实现可编辑逼真3D驾驶场景的仿真

CVPR自动驾驶公开赛冠军！Hydra-MDP: 端到端多模态规划与多目标 Hydra 蒸馏

哈工大&杭电 | MVPbev：BEV到透视图的端到端转换框架

IROS2024 | ParkingE2E：端到端自动泊车模型

39.98万起！享界S9上市！

港大&华为诺亚 | DriveGPT4：可解释的端到端自动驾驶！

GigaAI 和清华大学联合发布 | DriveDreamer：真实世界驾驶场景的开创性世界模型

深度解读｜U-BEV：自动驾驶场景的重建和定位

深度解读 | P-MapNet：结合SDMap和HDMap先验的地图生成器！

小鹏汽车AI智驾技术发布会小鹏汽车XNGP史上最大更新！智驾体验全面升级

高度提炼 | Fast-BEV：高效的BEV感知框架

无需模块化和 3D 手动标注的端到端自动驾驶，UAD框架解析(1)

GaussianBEV：首次将3D Gaussian引入BEV感知应用

高度提炼 | DreamCar？？严肃！这个可不是魅族汽车！在moving-froward场景中的3D车辆重建！

ICML 2024 | Best Paper新鲜出炉！AIGC持续霸榜中... ...

CVPR 2024 | LMDrive：使用大语言模型的闭环端到端自动驾驶模块实现

CVPR 2024 | LMDrive：使用大语言模型的闭环端到端自动驾驶 Pipeline详解

CVPR 2024 | 华为诺亚：注入BEV视角的多模态大模型

深度聚焦｜最强落地端到端自动驾驶算法！Tesla FSD v12公开模型分享！

高度提炼｜自动驾驶算法船新框架？CVPR 2023 Best PaperUniAD代码解析(2)

高度提炼｜自动驾驶算法船新框架？CVPR 2023 Best PaperUniAD框架解析(1)

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉