哈工大发布LiV-GS：户外环境3D高斯泼溅LiDAR-视觉集成SLAM系统

科技 2024-11-23 19:58 上海

点击“计算机视觉life”，选择“星标”

机器人AI干货第一时间送达

本文转载自 3D视觉之心

论文名称：LiV-GS: LiDAR-Vision Integration for 3D Gaussian Splatting SLAM in Outdoor Environments

室外场景的挑战

SLAM是大规模场景重建的关键技术，通过精确定位重建观测到的场景。激光雷达和相机作为场景重建中常用的两类传感器，推动了SLAM技术的发展。传统的激光雷达SLAM利用点云中的几何特征和精确的深度信息，实现高精度定位。近年来，神经辐射场（NeRFs）和3D高斯投影（3DGS）的兴起，为视觉SLAM提供了更为细致的环境表示。然而，传统的地图表示方法（如点云、体素和表面元素）在建图中存在分辨率受限的问题，而隐式神经场则需要高昂的计算资源。相比之下，3DGS使用高斯椭球作为一种高效地图表示方法，不仅支持自适应的空间特征表示，还能实现快速渲染。结合对高精度SLAM和真实感场景重建的需求，3D高斯投影展现出了激光雷达和相机传感器结合的强大潜力。

室外SLAM和场景重建面临独特的挑战，如光照变化和深度范围无限等问题，使得基于RGBD的室内解决方案在室外应用中显得不足。尽管激光雷达在室外环境中能够精确测量距离，但由于点云稀疏且不连续，不同视图之间的像素匹配依然是一个挑战。现有方法（如手持建图）依赖重复测量来增强图像深度，这对仅能从相机视角捕获单视图的移动机器人平台而言并不现实。

为了解决上述问题，LiV-GS[1]是一种基于3D高斯空间表示的SLAM框架，能够无缝集成激光雷达和相机图像。通过将高斯协方差从渲染中与当前观测对齐来估计机器人位姿，并通过后端纠正漂移并更新高斯地图。为了解决在无限场景中视觉与激光雷达深度的连续性问题，基于激光雷达点云提出了一种高斯分裂方法，确保地图更新中的分布约束。

主要贡献如下：

提出了一种基于3D高斯表示的统一激光雷达-相机室外SLAM框架，能够在高精度定位的过程中实现增量建图和高质量的新视图合成
提出了有效的高斯-激光雷达对齐方法，包括用于稳定追踪的法向方向约束和基于密度与法向一致性的加权机制，用于评估不同高斯的可靠性
提出了一种条件高斯分布约束，用于地图更新，即使在激光雷达点不可用的区域，也能利用激光雷达先验传播可靠的高斯，表示整个场景

具体方法

系统概述

如图1所示，LiV-GS系统由四个模块组成：数据预处理、前端追踪、后端优化和地图更新。多模态传感器数据（包括激光雷达和视觉传感器）在数据预处理模块中进行集成，随后输入前端追踪模块。在前端，系统将从上一时刻渲染的高斯椭球与当前点云结合，用于帧到地图的匹配。关键帧通过可视区域的共视性评估进行选择，并被加入高斯地图中。包含关键帧参数的高斯地图随后在后端进行位姿优化和地图更新。通过最小化损失函数，高斯地图会连续更新其参数，同时进行高斯的分裂与裁剪操作。

在所提系统中，数据输入包括相机图像和激光雷达点云。这些数据通过已校准的外参进行融合，将时间对齐的激光雷达点云转换为深度图像。转换方程如下：

其中，表示激光雷达点云中的点，和分别为从激光雷达到相机坐标系的旋转矩阵和平移向量，为相机内参矩阵。该转换实现了激光雷达数据与视觉数据的对齐，从而在RGB视角下统一深度感知。

前端追踪

前端追踪的主要挑战在于如何将由颜色监督生成的高斯与具有固定分辨率的激光雷达点云对齐。我们采用协方差作为桥梁，这是点云和高斯的共享属性。在确定每个激光雷达点的法向方向后，我们将其与高斯的最短轴对齐。为了进一步提高追踪的稳定性，我们引入了一种权重函数，用以区分仅由颜色监督生成的高斯和那些结合了激光雷达深度信息生成的高斯，并在点云与高斯匹配的误差计算中考虑其权重。

点云与高斯的匹配

我们首先维护一个滑动窗口，从最近的10帧中筛选出高斯，同时屏蔽掉其余的高斯。这个选择过程确保在关注的子地图内匹配的高斯具有相关性。随后，我们通过一个增量误差最小化函数来确保点云与高斯之间的精确匹配，公式如下：

其中，表示激光雷达点云中的一个点，是从前一时刻到世界坐标系的当前位姿估计，是最接近的高斯中心，是的法向量，是高斯点的置信权重。

为了进一步提高稳定性和精度，引入了一个正则化项，用来衡量法向之间的方向误差，其公式如下：

正则化项通过一个超参数进行调节，进一步强化了法向对齐的效果。

权重函数的构建

点云的可靠权重与其密度密切相关。我们首先确定局部球形区域中的所有高斯分布中心，其中是球的中心，是半径。通过最小化点与每个高斯中心的距离，确定这些高斯分布中心。密度函数定义如下：

其中，是通过以下公式重新构造的协方差矩阵：

在优化过程中，由于高斯法向长度难以控制，我们引入了对点云和高斯的法向长度归一化，以确保法向方向的稳定性，从而提高算法的鲁棒性。

此外，为了加速匹配过程中密度函数的计算，我们对上述公式进行了简化，使得计算更加高效。

共视性评估

我们通过评估当前帧与上一关键帧之间的高斯函数重叠程度来衡量共视性。如果共视性低于设定的阈值，则将当前帧标记为关键帧。为了确保快速追踪在前视角下能持续匹配当前点云与足够的高斯椭球，关键帧中的点云直接被添加到高斯地图中，并通过沿射线传播方向扩展点云协方差进行初始化。随后，后端通过与先前关键帧的视角比较优化高斯地图，从而实现高斯地图的增量更新。

后端优化

后端优化模块通过处理关键帧及其参数进行两轮优化。第一轮针对滑动窗口中的关键帧位姿进行优化，第二轮则用于更新高斯地图。

深度和颜色渲染

高斯地图的深度渲染和颜色渲染过程如下所示：

深度渲染公式：

颜色渲染公式：

其中：

表示高斯集合中的单个高斯；
和分别表示高斯沿摄像机射线的距离和颜色；
是高斯的不透明度。

损失函数设计

为了优化高斯的参数，我们设计了如下损失函数：

损失函数的组成部分包括：

光度误差： 表示视觉真实值与渲染图像之间的差异；
几何误差： 衡量激光雷达深度输入与渲染深度图之间的差异；
法向误差： 表示高斯在法向方向上的平均方差的范数：

在室外场景中，高斯通常稀疏且分布较大。为了使高斯与物体表面更紧密对齐，我们引入法向误差来优化法向的稳定性和长度。优化后的高斯法向更短、更稳定，从而显著提升渲染质量。

优化流程

在优化过程中：

关键帧位姿优化： 限制在滑动窗口内的关键帧位姿进行调整，确保局部精度。
高斯地图更新： 利用优化后的关键帧位姿对高斯地图进行全局更新。

优化效果

图3显示了引入法向误差后，高斯地图的结构更加稳定，渲染质量显著提升。特别是在细节丰富的场景中（如建筑物表面和地面纹理），优化后的高斯地图更能精确反映场景的几何特征。

地图更新

为处理无限场景中的天空区域表示，我们在场景外初始化一个包含10万个高斯原语的天空盒，并随着高斯地图的增量构建动态更新。在地图初始化和更新过程中，高斯主要分为两类：由颜色监督生成的高斯和由激光雷达测量生成的高斯。

条件高斯约束 (Conditional Gaussian Constraint, CGC)

我们提出了一种条件高斯约束（CGC），通过调整损失函数对颜色监督生成的高斯的位置进行优化和调整。对于通过颜色监督生成的每个点，我们从激光雷达测量的高斯集合中选择最近的高斯。假设给定，点服从以下高斯分布：

其中：

：表示从高斯的正态分布中采样分裂出的新高斯的中心；
：为高斯的协方差矩阵。

条件高斯约束通过调整新高斯的均值和协方差，使其更接近于最近的可靠高斯。在后端优化完成后，从可靠高斯分裂出的新高斯被认为是可靠的高斯，优化过程会持续迭代，直到所有高斯都变为可靠高斯。

地图增量更新

为了更新地图：

分裂与裁剪： 在地图更新过程中，系统动态对高斯进行分裂与裁剪操作，以确保地图表示的稠密性和有效性。
区域适应： 对于激光雷达数据缺失的区域（如天空或其他未被激光雷达扫描的场景），利用条件高斯约束指导高斯的分裂和位置调整，使这些区域的高斯分布与最近的可靠区域保持一致。

优化效果

如图4所示，在复杂形状或具有显著表面特征的区域，通过CGC生成的新高斯严格遵循现有可靠点的分布模式。此方法显著提升了地图在稀疏区域的表达能力，确保了高斯地图在整个场景中的一致性和可靠性。

实验效果

总结一下

LiV-GS是一种新颖的室外SLAM系统，利用3D高斯作为空间表示，集成了激光雷达-相机数据。该系统通过协方差将激光雷达点云与高斯地图紧密结合，用于追踪，并利用视觉信息优化全局高斯分布。引入条件高斯约束指导高斯椭球的分裂，特别是针对缺乏几何约束（如激光雷达深度不可用）的高斯椭球。这一方法利用视觉纹理的连续性和激光雷达的可靠性，构造出具有一致深度约束的椭球。

实验验证了该系统能够实现稳健而精确的定位，并渲染出清晰的场景图像。据我们所知，这也是首次成功在室外环境中利用3D高斯地图实现跨模态雷达-激光雷达定位，标志着室外3D高斯SPLAM系统在定位与建图中的显著潜力和广泛应用前景。

参考

[1] LiV-GS: LiDAR-Vision Integration for 3D Gaussian Splatting SLAM in Outdoor Environments

「小六的机器人AI圈」为机器人AI行业从业者提供从入门、学习、交流、求职、线下链接、合作、、创业、行业内幕、咨询、答疑等一系列的服务。快人一步，步步领先！

扫码立减 30元加入！送上千页独家答疑电子书！加入3天内不满意无条件退款。付款后务必联系客服领取权益~

最新文章

MVSplat360：从稀疏视图到360°全景合成的前馈方法

三维机器视觉行业，代沟太大了！

哈工大发布LiV-GS：户外环境3D高斯泼溅LiDAR-视觉集成SLAM系统

周日（11月24日）上海，深圳，线下体验试用~

今晚内部直播交流：扫描仪+机器人实时SLAM及二次开发！

周日（11月24日）上海，深圳，线下体验试用~

BOM成本仅2535元全球最小开源端到端人形机器人Zeroth 01 Bot来了！

【文末赠书】一文读懂基于大模型的具身智能技术

谷歌2024博士奖学金名单公布

上海周边，深圳，本周末线下体验试用~

IROS 2024最新接收的NeRF/3DGS前沿研究成果汇总

三维空间扫描仪化身机器人感知定位利器！用于机器人自主定位导航、实景三维重建！

报名！线下体验试用~

浙大等联合发布“HVOFusion: 使用混合体素八叉树进行增量网格重建”

周六聊天

这些机器人AI技术企业里都在用！逐行代码保姆级解析！

三维空间扫描仪化身机器人感知定位利器！用于机器人自主定位导航、实景三维重建！

国防科技大学发布“TD-NeRF：联合相机位姿和神经辐射场优化的新型截断深度先验”

浙大西湖大学开源MBA-SLAM！解决NeRF、3DGS中的运动模糊问题！

这周日，成都、哈尔滨，不见不散！

最强助攻！让你的机器人轻松实现自主SLAM并重建稠密彩色点云!

这周日，成都、哈尔滨，不见不散！

纯Lidar SLAM如何优化解决Z轴方向的偏移？

最后一天！

没想到3DGS在这个领域是刚需！

成都、哈尔滨，我们来啦！

详解 | 各车企智驾“无图”方案

SLAM面试题：DBoW的构建和使用

cvlife的双十一！

商汤&浙大SfM新工作！LiVisSfM：利用激光雷达和视觉线索，获得精确鲁棒的三维重建

成都、哈尔滨，我们来啦！

SLAM挑战：有光无光切换，自由穿梭小黑屋！

cvlife年度最大优惠来了

保就业的AI算法工程师课程来啦！

章国锋团队重磅开源！XRDSLAM：基于深度学习的模块化SLAM！灵活组合不同算法！（商汤&浙大）

招募：3D Gaussian Splatting方向项目合作/实习生（可远程）

【万字长文】采访3DGS创业者康总：畅谈3D高斯泼溅技术在移动端的创新应用与未来展望

这些机器人AI技术企业里都在用！

港科大待开源“BeautyMap：二进制编码的自适应矩阵，用于全局地图中动态点的移除”

MIT发布“Clio：实时任务驱动的Open-Set 3D场景图”

湖南大学开源数据集及代码！ESVO2：事件相机的双目VIO系统，CPU实时运行！

西安，明天见！

采访西安灵视探索创业者业全：低空飞行器与卫星SLAM应用探索、行业现状与未来展望

ETH发布“轮腿式机器人的鲁棒自主导航与运动学习”

南京见了几个客户，应用场景需求和难题，探讨解决思路

西安、苏州，我们来啦！

国内外有哪些不错的3D Vision的组或实验室？

被裁员是怎样的一种体验？

西安、苏州，我们来啦！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉