克服LiDAR固定分辨率的限制！LiV-GS：首个大规模室外场景对齐离散点云与高斯地图的方法

文摘 2024-11-22 07:00 上海

点击下方卡片，关注“3D视觉之心”公众号

第一时间获取3D视觉干货

室外场景的挑战

SLAM是大规模场景重建的关键技术，通过精确定位重建观测到的场景。激光雷达和相机作为场景重建中常用的两类传感器，推动了SLAM技术的发展。传统的激光雷达SLAM利用点云中的几何特征和精确的深度信息，实现高精度定位。近年来，神经辐射场（NeRFs）和3D高斯投影（3DGS）的兴起，为视觉SLAM提供了更为细致的环境表示。然而，传统的地图表示方法（如点云、体素和表面元素）在建图中存在分辨率受限的问题，而隐式神经场则需要高昂的计算资源。相比之下，3DGS使用高斯椭球作为一种高效地图表示方法，不仅支持自适应的空间特征表示，还能实现快速渲染。结合对高精度SLAM和真实感场景重建的需求，3D高斯投影展现出了激光雷达和相机传感器结合的强大潜力。

室外SLAM和场景重建面临独特的挑战，如光照变化和深度范围无限等问题，使得基于RGBD的室内解决方案在室外应用中显得不足。尽管激光雷达在室外环境中能够精确测量距离，但由于点云稀疏且不连续，不同视图之间的像素匹配依然是一个挑战。现有方法（如手持建图）依赖重复测量来增强图像深度，这对仅能从相机视角捕获单视图的移动机器人平台而言并不现实。

为了解决上述问题，LiV-GS[1]是一种基于3D高斯空间表示的SLAM框架，能够无缝集成激光雷达和相机图像。通过将高斯协方差从渲染中与当前观测对齐来估计机器人位姿，并通过后端纠正漂移并更新高斯地图。为了解决在无限场景中视觉与激光雷达深度的连续性问题，基于激光雷达点云提出了一种高斯分裂方法，确保地图更新中的分布约束。

主要贡献如下：

提出了一种基于3D高斯表示的统一激光雷达-相机室外SLAM框架，能够在高精度定位的过程中实现增量建图和高质量的新视图合成
提出了有效的高斯-激光雷达对齐方法，包括用于稳定追踪的法向方向约束和基于密度与法向一致性的加权机制，用于评估不同高斯的可靠性
提出了一种条件高斯分布约束，用于地图更新，即使在激光雷达点不可用的区域，也能利用激光雷达先验传播可靠的高斯，表示整个场景

具体方法

系统概述

如图1所示，LiV-GS系统由四个模块组成：数据预处理、前端追踪、后端优化和地图更新。多模态传感器数据（包括激光雷达和视觉传感器）在数据预处理模块中进行集成，随后输入前端追踪模块。在前端，系统将从上一时刻渲染的高斯椭球与当前点云结合，用于帧到地图的匹配。关键帧通过可视区域的共视性评估进行选择，并被加入高斯地图中。包含关键帧参数的高斯地图随后在后端进行位姿优化和地图更新。通过最小化损失函数，高斯地图会连续更新其参数，同时进行高斯的分裂与裁剪操作。

在所提系统中，数据输入包括相机图像和激光雷达点云。这些数据通过已校准的外参进行融合，将时间对齐的激光雷达点云转换为深度图像。转换方程如下：

其中，表示激光雷达点云中的点，和分别为从激光雷达到相机坐标系的旋转矩阵和平移向量，为相机内参矩阵。该转换实现了激光雷达数据与视觉数据的对齐，从而在RGB视角下统一深度感知。

前端追踪

前端追踪的主要挑战在于如何将由颜色监督生成的高斯与具有固定分辨率的激光雷达点云对齐。我们采用协方差作为桥梁，这是点云和高斯的共享属性。在确定每个激光雷达点的法向方向后，我们将其与高斯的最短轴对齐。为了进一步提高追踪的稳定性，我们引入了一种权重函数，用以区分仅由颜色监督生成的高斯和那些结合了激光雷达深度信息生成的高斯，并在点云与高斯匹配的误差计算中考虑其权重。

点云与高斯的匹配

我们首先维护一个滑动窗口，从最近的10帧中筛选出高斯，同时屏蔽掉其余的高斯。这个选择过程确保在关注的子地图内匹配的高斯具有相关性。随后，我们通过一个增量误差最小化函数来确保点云与高斯之间的精确匹配，公式如下：

其中，表示激光雷达点云中的一个点，是从前一时刻到世界坐标系的当前位姿估计，是最接近的高斯中心，是的法向量，是高斯点的置信权重。

为了进一步提高稳定性和精度，引入了一个正则化项，用来衡量法向之间的方向误差，其公式如下：

正则化项通过一个超参数进行调节，进一步强化了法向对齐的效果。

权重函数的构建

点云的可靠权重与其密度密切相关。我们首先确定局部球形区域中的所有高斯分布中心，其中是球的中心，是半径。通过最小化点与每个高斯中心的距离，确定这些高斯分布中心。密度函数定义如下：

其中，是通过以下公式重新构造的协方差矩阵：

在优化过程中，由于高斯法向长度难以控制，我们引入了对点云和高斯的法向长度归一化，以确保法向方向的稳定性，从而提高算法的鲁棒性。

此外，为了加速匹配过程中密度函数的计算，我们对上述公式进行了简化，使得计算更加高效。

共视性评估

我们通过评估当前帧与上一关键帧之间的高斯函数重叠程度来衡量共视性。如果共视性低于设定的阈值，则将当前帧标记为关键帧。为了确保快速追踪在前视角下能持续匹配当前点云与足够的高斯椭球，关键帧中的点云直接被添加到高斯地图中，并通过沿射线传播方向扩展点云协方差进行初始化。随后，后端通过与先前关键帧的视角比较优化高斯地图，从而实现高斯地图的增量更新。

后端优化

后端优化模块通过处理关键帧及其参数进行两轮优化。第一轮针对滑动窗口中的关键帧位姿进行优化，第二轮则用于更新高斯地图。

深度和颜色渲染

高斯地图的深度渲染和颜色渲染过程如下所示：

深度渲染公式：

颜色渲染公式：

其中：

表示高斯集合中的单个高斯；
和分别表示高斯沿摄像机射线的距离和颜色；
是高斯的不透明度。

损失函数设计

为了优化高斯的参数，我们设计了如下损失函数：

损失函数的组成部分包括：

光度误差： 表示视觉真实值与渲染图像之间的差异；
几何误差： 衡量激光雷达深度输入与渲染深度图之间的差异；
法向误差： 表示高斯在法向方向上的平均方差的范数：

在室外场景中，高斯通常稀疏且分布较大。为了使高斯与物体表面更紧密对齐，我们引入法向误差来优化法向的稳定性和长度。优化后的高斯法向更短、更稳定，从而显著提升渲染质量。

优化流程

在优化过程中：

关键帧位姿优化： 限制在滑动窗口内的关键帧位姿进行调整，确保局部精度。
高斯地图更新： 利用优化后的关键帧位姿对高斯地图进行全局更新。

优化效果

图3显示了引入法向误差后，高斯地图的结构更加稳定，渲染质量显著提升。特别是在细节丰富的场景中（如建筑物表面和地面纹理），优化后的高斯地图更能精确反映场景的几何特征。

地图更新

为处理无限场景中的天空区域表示，我们在场景外初始化一个包含10万个高斯原语的天空盒，并随着高斯地图的增量构建动态更新。在地图初始化和更新过程中，高斯主要分为两类：由颜色监督生成的高斯和由激光雷达测量生成的高斯。

条件高斯约束 (Conditional Gaussian Constraint, CGC)

我们提出了一种条件高斯约束（CGC），通过调整损失函数对颜色监督生成的高斯的位置进行优化和调整。对于通过颜色监督生成的每个点，我们从激光雷达测量的高斯集合中选择最近的高斯。假设给定，点服从以下高斯分布：

其中：

：表示从高斯的正态分布中采样分裂出的新高斯的中心；
：为高斯的协方差矩阵。

条件高斯约束通过调整新高斯的均值和协方差，使其更接近于最近的可靠高斯。在后端优化完成后，从可靠高斯分裂出的新高斯被认为是可靠的高斯，优化过程会持续迭代，直到所有高斯都变为可靠高斯。

地图增量更新

为了更新地图：

分裂与裁剪： 在地图更新过程中，系统动态对高斯进行分裂与裁剪操作，以确保地图表示的稠密性和有效性。
区域适应： 对于激光雷达数据缺失的区域（如天空或其他未被激光雷达扫描的场景），利用条件高斯约束指导高斯的分裂和位置调整，使这些区域的高斯分布与最近的可靠区域保持一致。

优化效果

如图4所示，在复杂形状或具有显著表面特征的区域，通过CGC生成的新高斯严格遵循现有可靠点的分布模式。此方法显著提升了地图在稀疏区域的表达能力，确保了高斯地图在整个场景中的一致性和可靠性。

实验效果

总结一下

LiV-GS是一种新颖的室外SLAM系统，利用3D高斯作为空间表示，集成了激光雷达-相机数据。该系统通过协方差将激光雷达点云与高斯地图紧密结合，用于追踪，并利用视觉信息优化全局高斯分布。引入条件高斯约束指导高斯椭球的分裂，特别是针对缺乏几何约束（如激光雷达深度不可用）的高斯椭球。这一方法利用视觉纹理的连续性和激光雷达的可靠性，构造出具有一致深度约束的椭球。

实验验证了该系统能够实现稳健而精确的定位，并渲染出清晰的场景图像。据我们所知，这也是首次成功在室外环境中利用3D高斯地图实现跨模态雷达-激光雷达定位，标志着室外3D高斯SPLAM系统在定位与建图中的显著潜力和广泛应用前景。

参考

[1] LiV-GS: LiDAR-Vision Integration for 3D Gaussian Splatting SLAM in Outdoor Environments

本文仅做学术分享，论文汇总于『3D视觉之心知识星球』，欢迎加入交流！

【3D视觉之心】技术交流群

3D视觉之心是面向3D视觉感知方向相关的交流社区，由业内顶尖的3D视觉团队创办！聚焦三维重建、Nerf、点云处理、视觉SLAM、激光SLAM、多传感器标定、多传感器融合、深度估计、摄影几何、求职交流等方向。扫码添加小助理微信邀请入群，备注：学校/公司+方向+昵称（快速入群方式）

扫码添加小助理进群

【3D视觉之心】知识星球

3D视觉之心知识星球主打3D感知全技术栈学习，星球内部形成了视觉/激光/多传感器融合SLAM、传感器标定、点云处理与重建、视觉三维重建、NeRF与Gaussian Splatting、结构光、工业视觉、高精地图等近15个全栈学习路线，每天分享干货、代码与论文，星球内嘉宾日常答疑解惑，交流工作与职场问题。

http://mp.weixin.qq.com/s?__biz=MzkyMDY0OTc1NA==&mid=2247517262&idx=1&sn=4958616fd5c273b88ffb59c8278e5a1f

3D视觉之心

3D视觉与SLAM、点云相关内容分享

最新文章

如何创立一家惯性导航公司

融合神经辐射场和视觉同时定位与地图构建的混合场景表示方法

宝可梦GO「偷家」李飞飞空间智能？全球最强3D地图诞生，150万亿参数解锁现实边界

克服LiDAR固定分辨率的限制！LiV-GS：首个大规模室外场景对齐离散点云与高斯地图的方法

MVSplat360：从稀疏视图到360°全景合成的前馈方法

Siggraph Asia 2024 | Adobe发布MagicClay：可通过文字引导对3D模型特定部分进行雕刻！

谷歌2024博士奖学金名单公布

首个基于高斯点云建图的动态SLAM框架！DGS-SLAM：解决动态物体引起的光度和几何不一致

无需视频流实现全景分割与深度估计MGNiceNet：统一的单目几何场景理解

ECCV 2024 | PARE-Net：用于鲁棒点云配准的位置感知旋转等变网络

NeurIPS 2024高中赛道开卷！人大附中、北师大实验中学等摘得3篇Spotlight

加州大学 | 基于视觉语言模型的端到端导航：零样本，无需数据训练！

港大DEIO：首个学习与传统非线性图优化结合的单目事件惯性里程计

基于语义似然与高精度地图匹配的智能车辆同时定位与检测

钻石冷却的GPU即将问世：温度能降20度，超频空间增加25%

超越现有3DGS网格重建方法！DyGASR：速度提高25%、内存使用量减少30%

复旦&蔚来开源DG-SLAM：第一个动态环境下的鲁棒GS SLAM！

身处相机内外参之间（EG3D/NeRF/3D Gaussian Splatting）

NeurIPS 2024 | 无需训练，一个框架搞定开放式目标检测、实例分割

突破多场景训练方法限制！ETH开源SplatFormer：首个专门设计用于在3DGS上运行的点变换器模型

【清华大学】RINO：基于非迭代估计的精确、鲁棒雷达惯性里程计

论文分享｜无监督点云语义分割

传说中Ilya Sutskever精选论文清单：AI领域40大论文完整版「破解」完成

丰田研究院综述「机器人领域中的神经场」

顶刊TGRS | 使用端到端深度神经网络从高分辨率遥感图像和数字表面模型中提取3D建筑实例

让纸片人动起来! DrawingSpinUp：从单个绘图生成高质量3D动画

浙大西湖大学开源MBA-SLAM！解决NeRF、3DGS中的运动模糊问题！

这三家国内机构合作成果，斩获EMNLP 2024最佳论文奖，主办方：明年苏州见！

ICP还能玩出什么花样？RA-L'24全新GenZ-ICP：根据环境几何特性自适应，解决依赖单一误差度量

英伟达最新！SCube：仅用三张图，就能实现即时大规模三维场景重建

更高轨迹精度、建图质量！基于NeRF轨迹平滑约束的SLAM优化

15 个改变世界的开源项目：塑造现代技术的先锋力量

多实例点云配准新SOTA！3DFMNet：简单而有效的3D聚焦与匹配网络(NeurIPS'24)

LidaRefer：户外3D视觉定位的创新框架

腾讯发布HunYuan-3D，支持文本到3D和图像到3D，10秒即可生成高分辨率细3D模型

Scaling Laws终结，量化无用，AI大佬都在审视这篇论文

新国立联合微软共同打造：3D和4D场景均可生成的GenXD来了！

MVDrag3D：灵活强大的拖拽式多视图3D编辑技术

基于单目视觉惯性的同步定位与地图构建方法综述

实现LiDAR和多视角摄像头数据的对齐、可控X-DRIVE：用于驾驶场景的跨模态一致多传感器数据合成

不用encoder也能重建点云？PCP-MAE：基于中心预测的点云MAE自监督新框架（NeurIPS'24 Spotlight）

商汤&浙大SfM新工作！LiVisSfM：利用激光雷达和视觉线索，获得精确鲁棒的三维重建

slam相关开源数据集资源汇总（KITTI、CODD、MAOMaps）

3D激光雷达分辨率对基于图的SLAM方法究竟有何影响？

3DV 2024 | 基于超点图聚类的可扩展三维全视分割

突发！OpenAI七年元老、安全副总裁Lilian Weng官宣离职！北大本科，决定专心写博客

倘若能有一场时空对话，我将告诉曾经的我如何做vslam

2024年图像匹配挑战赛：银牌解决方案！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉