点击“计算机视觉life”,选择“星标”
机器人AI干货第一时间送达
背景介绍
在自动驾驶、无人机、增强现实、机器人导航等领域的技术栈中,即时定位和建图(SLAM)是其中的核心技术之一。SLAM中所涉及到的传感器有相机、激光雷达、IMU、GPS、轮速计等,面对不同的平台和传感器配置,如何选择适合自己的技术方案呢?建议直接去我们cvlife.net官网查看
3D Gaussian Splatting是最近几个月热度极高的突破性工作,对应论文“3D Gaussian Splatting for Real-Time Radiance Field Rendering”是2023年SIGGRAPH最佳论文,在短短的几个月内席卷三维视觉和SLAM领域。
2020年提出的NeRF等辐射场方法彻底改变了多张照片或视频主导的场景新视角合成的算法生态,但训练、渲染的速度与质量仍存在瓶颈。Gaussian Splatting引入了三个关键元素,在保持有竞争力的训练时间的同时实现最先进的视觉质量,重要的是允许在1080p分辨率下实现高质量的实时(≥30 fps)的新视图合成。
基于3D Gaussian Splatting的SLAM不仅全面继承了NeRF-based SLAM方法的优点,而且全面补足了其短板(渲染速度慢、图像质量不高、定位精度欠佳等),实现了更好的实时性、更好的渲染质量、更精确的定位精度。
3D Gaussian Splatting对比之前的NeRF算法
3D Gaussian Splatting简介
计算机视觉life的《基于3D Gaussian Splatting SLAM:理论与源码解析》汪博士的直播见:
3D Gaussian Splatting最为学术和工程前景兼具的技术,发展非常快,即将迎来大爆发!在新技术领域,先来的吃肉,后来的喝汤,因此我们邀请了哈工大汪博士,开启了“先锋计划”,爆肝备课,针对3D Gaussian Splatting SLAM 目前大佬发表的论文,以及目前唯一开源的代码SplaTAM,全网首发,全网独家最早最新的《基于3D Gaussian Splatting SLAM:理论与源码解析》课程来啦,帮助各位研究者第一时间抢占学术制高点,第一时间抓住落地机会。
目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
《基于3D Gaussian Splatting SLAM:理论与源码解析》
Autoware自动驾驶框架已经在20多个国家、30多种车型、500多个公司使用。当前各大自动驾驶公司几乎都进行了借鉴和使用,且自动驾驶和机器人行业的企业对求职者技术知识系统性理解和实践经验非常重视,Autoware框架是理解自动驾驶系统知识最好的学习模板之一,同时利用仿真工具实现功能复现和整机联调也是增长实践经验的良好手段。
Autoware框架的复杂程度较高,自学很难入手。基于此,计算机视觉life联合天宇老师推出了“自动驾驶开源框架Autoware源码解析与项目实战”课程。
全网第一款针对自动驾驶整个数据链路进行深度讲解的实用入门课程; 是一款培养项目工程思维和解决实际问题能力的实践类课程; 也是一款基于ros机器人操作系统的实践进阶课程; 更是一款基于C++高阶开发的实战应用课程;
天宇老师,世界500强科技公司智能驾驶部门技术专家、核心技术方向负责人。在自动驾驶和机器人领域有丰富的项目经验,主导多个自动驾驶项目落地量产。所设计并主讲的自动驾驶系列课程已经在全网为300多名来自各大知名企业和高校的学员提供技术服务,深受学员好评。天宇老师的直播回放见:
该课程将通过长时间系列学习和项目实践,让您对Autoware(包括ai和auto两个版本)乃至整个自动驾驶技术的各个模块有较为深入的了解,将来无论是从事自动驾驶还是移动机器人行业,解决实际工程问题时,都能够从Autoware框架中找到灵感。熟悉Autoware框架将是求职简历上的一项耀眼的优势!
课程内容覆盖了自动驾驶所有关键技术模块:建图、定位、感知、规划和运动控制。除了讲解细致的视频课程以外,还加入了丰富的项目实战环节,让您体会到基于Autoware框架去解决实际工程问题的乐趣,真正意义上的达到学以致用的目的。
下面是课程中的demo演示,是课程讲解中重要的部分,会大大提高大家理解课程内容的效率。所有demo演示都会对其原理进行细致的讲解,并对学员完全开放代码,帮助大家能够在自己的电脑上面跑起来。
全网最详细的Autoware 系统教程,扫描加入!目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
《自动驾驶开源框架Autoware源码解析与项目实战》
SuperPoint是AR公司——magicleap的工作, SuperGlue是magicleap和苏黎世联邦理工学院(ETH)一起合作的,在2020年附近,SuperPoint+SuperGlue在特征点提取和匹配上有很好的效果,可以达到世界第一的水平。
SuperPoint的demo
源码网址:
https://github.com/magicleap/SuperPointPretrainedNetwork
SuperGlue的demo
源码网址:
https://github.com/magicleap/SuperGluePretrainedNetwork
计算机视觉life经过周密准备,邀请了黄老师联合制作国内首个《快速上手SuperPoint、SuperGlue:理论与源码解析》教程。黄老师简介:
985硕士,研究方向是视觉SLAM算法及专用硬件加速器设计,设计过SuperPoint的专用硬件加速器,对SuperPoint和SuperGlue的数据流和网络结构有过深入研究,发表相关论文4篇,授权专利2项。
黄老师录制的SuperPoint、SuperGlue简介
黄老师的直播回放
目前所有17讲视频全部上线!国内首个SuperPoint/Glue系统教程!目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
《快速上手SuperPoint、SuperGlue:理论与源码解析》
全网首发!《快速上手基于NeRF的SLAM:理论与实践》
NeRF这几年太火了!席卷计算机视觉领域,几大顶会顶刊每年有大量的文章发表,不仅在深度学习方面大展身影,在传统几何为主的SLAM(同时定位与建图)和三维重建领域也是横扫四方。
计算机视觉life联和哈尔滨工业大学汪寿安博士,经过周密准备,推出了全网首个理论+实践的NeRF SLAM课程《快速上手基于NeRF的SLAM:理论与实践》。
汪博士研究方向为神经隐式SLAM,多传感器融合SLAM。有两年自动驾驶从业经历,对以上提到的开源框架进行了详细的原理讲解和代码解读。下面是他对课程的介绍视频。
目前有立减100 优惠券,私信客服还有赠品,扫描抢购!,详情见 基于NeRF的SLAM是不是未来?
扫描查看课程大纲,开始学习
多传感器融合SLAM:LVI-SAM
LVI-SAM是MIT团队的TixiaoShan等人开源的一个紧耦合的激光雷达视觉惯导SLAM系统,可以实时高精度鲁棒的进行状态估计和建图。
为什么要学习LVI-SAM?
1、与其他开源框架相比,有更好的算法鲁棒性,有更优越的算法精度
2、是目前最先进的开源LVIO框架之一
3、涵盖IMU预积分、特征提取、视觉滑窗、因子图优化、回环检测等多方位内容
4、学会LVI-SAM算法有助于理解其他多传感器融合框架
5、代码有注释,讲师带读。代码注释地址 https://github.com/electech6/LVI-SAM_detailed_comments
6、为统一环境调试代码,我们做了docker镜像;为LVI-SAM算法录制了校园数数据集。
目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
快速入门激光雷达惯性SLAM-FastLio2
香港大学开源的这个激光雷达惯性SLAM太强啦!没错,就是FAST-LIO2。看看它 是如何碾压其他算法的!
FAST-LIO2是香港大学火星实验室(MARS)发表在IEEE-RAL和IEEE-TRO的两篇论文,是一种具有高计算效率、高鲁棒性的雷达惯性里程计(LIO)。它通过紧耦合误差状态卡尔曼滤波器实现IMU和激光雷达融合的状态估计,是目前最先进的开源LIO框架之一。
目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
视觉SLAM基础
ORB-SLAM2是业内最知名、应用最广泛的视觉SLAM开源代码之一。它有如下优点:
支持单目,双目和RGB-D相机的完整开源SLAM方案,能够实现地图重用、回环检测和重新定位的功能。 支持轻量级定位模式,可以达到零漂移,此时不使用局部建图和回环检测的线程,可以用视觉里程计来跟踪未建图区域。 采用ORB特征,具有旋转不变性、光照不变性、尺度不变性,匹配速度快,适合实时应用。无论是在室内的小型手持设备,还是到工厂环境的无人机和城市里驾驶的汽车,ORB-SLAM2都能够在CPU上进行实时工作。 跟踪、局部地图、闭环、重定位等所有的任务都采用相同的ORB特征,使得系统内数据交互更高效、稳定可靠。 单目初始化和应用场景解耦,不管是平面还是非平面场景,都可以自动初始化,无需人工干预。 地图点和关键帧创建比较宽松,但后续会进行严格筛选,剔除冗余关键帧和误差大的地图点,增加建图过程的弹性,在大旋转、快速运动、纹理不足等恶劣情况下可以提高跟踪的鲁棒性。 采用共视图,使得跟踪和建图控制在局部共视区域,与全局地图大小无关,可以在大场景下运行。 使用本质图(Essential Graph)来优化位姿实现回环检测,耗时少精度高 。 相比于直接法,可以用于宽基线特征匹配,更适合于对深度精度要求较高的场景,比如三维重建。 定位精度高,可达厘米级,是特征点法SLAM的经典代表作品。 代码可读性强,包含很多工程化技巧,非常实用。
ORB-SLAM2 用于室内三维重建
ORB-SLAM2详细注释的代码持续更新,网址:
https://github.com/electech6/ORB_SLAM2_detailed_comments
目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
视觉惯性SLAM技术
ORB-SLAM3系统教程
ORB-SLAM3是在ORB-SLAM2的基础上开发的视觉惯性SLAM技术,于2020年7月
发布。它在定位精度和效果上几乎碾压了同类的开源算法,受到极大关注。
它有如下特点:
1、 第一个可以运行视觉、视觉惯性和多地图,支持单目、双目和RGB-D相机,且支持针孔和鱼眼镜头模型的SLAM系统。
2、该算法可以在不同大小,室内和室外环境中鲁棒、实时的运行,精度上相比于以前的方法提升了2~5倍。
3、 多地图系统可以让系统在视觉信息缺乏的场景下长时间运行。比如当跟踪丢失的时候,它会重新建立新的地图,并在重新访问之前的地图时,无缝地与之前的地图合并。
4、实验结果证明,双目惯性模式下,该算法在无人机数据集EuRoC上可以达到平均3.6cm的定位精度,在手持设备快速移动的室内数据集TUM-VI上达到了9mm的定位精度。
从室内到室外,丝滑闭环
全网最详细ORB-SLAM3代码注释地址:
https://github.com/electech6/ORB_SLAM3_detailed_comments
目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
滤波SLAM之MSCKF原理解析与源码详解
详情:滤波SLAM之MSCKF-VIO,视觉惯性SLAM的半边天!
MSCKF全称Multi-State Constraint Kalman Filter(多状态约束卡尔曼滤波器),是一种基于滤波的VIO算法,2007年由Mourikis在《A Multi-State Constraint Kalman Filter for Vision-aided Inertial Navigation》中首次提出。MSCKF在EKF框架下融合IMU和视觉信息,相较于单纯的VO算法,MSCKF能够适应更剧烈的运动、一定时间的纹理缺失等,具有更高的鲁棒性;相较于基于优化的VIO算法,MSCKF精度相当,速度更快,适合在计算资源有限的嵌入式平台运行。在机器人、无人机、AR/VR领域,MSCKF都有较为广泛的运用,如Google Project Tango就用了MSCKF进行位姿估计。
计算机视觉life已经推出了ORB-SLAM3、VINS:Mono+Fusion等基于优化的VIO算法,经过精心准备,我们推出了基于滤波的算法课程《滤波SLAM之MSCKF原理解析与源码详解》, 并对开源代码进行详细的中文注释,是国内唯一系统讲解MSCKF原理及代码实战的课程
目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
VINS-Mono/Fusion原理解析与源码详解
VINS即Visual-Inertial navigation Systems,是视觉惯性导航系统的统称,不过我们平时所说的一般是指VINS-Mono/Fusion。香港科技大学飞行机器人实验室(沈邵劼团队)在2018年开源了VINS-Mono算法。第一作者秦通(2019华为天才少年),该论文获2018年机器人顶级期刊IEEE Transactions on Robotics最佳论文奖。它用一个单目相机+惯性测量单元(Inertial Measurement Unit,简称IMU)实现了紧耦合的视觉和惯性联合状态估计,在保证高精度里程计效果的同时,还可以同时估计出传感器外参,IMU零偏以及传感器时延。2019年该团队开源了VINS-Mono的升级版VINS-Fusion,它支持多种视觉惯性传感器类型,包括单目+IMU,双目+IMU,以及纯双目。VINS-Mono和VINS-Fusion在当年一骑绝尘,是非常经典且优秀的VIO框架。
以下是VINS-Fusion在汽车SLAM上的效果:
以下是讲师详细注释的代码地址:
https://github.com/xieqi1/VINS-Mono-noted
https://github.com/xieqi1/VINS-Fusion-noted
目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
基于LiDAR的多传感器融合技术
LOAM是Ji Zhang早期开源的多线LiDAR SLAM算法。该代码可读性很差,作者后来将其闭源。 A-LOAM是港科大秦通博士(VINS-Mono一作)在LOAM原有代码基础上,使用Ceres-solver和Eigen库对其进行重构和优化,在保持原有算法原理的基础上,使其可读性大大增加,作为入门多线激光slam最好选择。 LeGO-LOAM 是Tixiao Shan在原有LOAM基础上,做了一些改进包括:1、对前端里程计的前量化改造,提取地面点更适配水平安装的LiDAR; 2、使用SLAM中的Keyframe概念以及回环检测位姿图优化的方式对后端进行重构。
LIO-SAM 是Tixiao Shan在LeGO-LOAM的扩展,添加了IMU预积分因子和GPS因子:前端使用紧耦合的IMU融合方式,替代原有的帧间里程计,使得前端更轻量;后端沿用LeGO-LOAM,在此基础上融入了GPS观测。同时前端后端相互耦合,提高系统精度。
视觉几何三维重建技术
三维重建是指用相机拍摄真实世界的物体、场景,并通过计算机视觉技术进行处理,从而得到物体的三维模型。英文术语:3D Reconstruction。 涉及的主要技术有:多视图立体几何、深度图估计、点云处理、网格重建和优化、纹理贴图、马尔科夫随机场、图割等。 是增强现实(AR)、混合现实(MR)、机器人导航、自动驾驶等领域的核心技术之一。 三维重建结果
长按或扫描查看视觉几何三维重建大纲,目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
C++编程入门基础
很多初学SLAM的小伙伴都有个疑问:号称宇宙第一语言的Python,简单好用,包又多,功能又强大,为啥SLAM算法里很少使用呢?
SLAM知识星球嘉宾刘国庆在知乎做了回答
这里再补充几点:
C++具有极高的性能和运行效率,很多语言都是在C/C++基础上封装的,比如Python。就这一点足以秒杀众多的高级语言。 C++发展了三十多年一直是编程常青树,一直使用,一直在发展,C++岗位需求会越来越旺盛,只增不减。 C++能够操控底层,非常适合和硬件打交道。
很多小伙伴都是机械、自动化、通信等非计算机专业,也没有经历过系统的C++训练,而在具体的项目中,比如SLAM算法框架中,通常的代码并不是我们在书上看到的那样简单直白。很多同学在学习SLAM的过程中感觉C++是一座难以跨越的大山,学习过程漫长而痛苦,项目开发遇到bug也不会调试,书看完了代码还是不会写,代码一改就错,一错就懵。
长按或扫描查看系统教程大纲,目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
C++编程进阶与提升
很多同学在学习SLAM的过程中感觉C++是一座难以跨越的大山,学习过程漫长而痛苦,项目开发遇到bug也不会调试,书看完了代码还是不会写,代码一改就错,一错就懵。
大家在做工程项目的时候还会遇到很多实际问题,本课程帮你彻底搞懂指针、容器、内存、代码调试、多线程、CMake等。仅整个讲义都有200页左右,是一部超级实用的C++学习手册。
本课程坚持从实践中学习,坚持学以致用,用代码提升学员对知识的掌握。语言开发我们一直倡导学习中“多踩坑”,但是我们是带着学员有目的、方向明确的踩坑,这样能够加深学员对知识的理解,在项目开发中“少踩坑”。
学完本课程,你可以很好的应对C++知识相关的面试,对代码编译、库、链接有一定的认识,对CMake、Eigen能较好的使用,能够对设计模式有一定的理解。
长按或扫描查看系统教程大纲,目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
单目/鱼眼/双目/全景/阵列 相机标定:原理和实战
相机标定是指借助专用的标志物(如棋盘格)来估计相机的图像传感器参数(内参、外参)和镜头参数(畸变系数)。 它是一种计算相机二维图像和三维世界相对映射关系的一种方法。标定相机过程涉及相机成像模型、多视图几何、非线性优化等知识。 相机标定是三维视觉的基础。
毫不夸张的说,相机标定是一切三维视觉的基础。它广泛应用于双目视觉、手眼机械臂、机器人定位建图、图像拼接、三维重建等场景。
长按或扫描查看系统教程大纲,目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
SLAM传感器与算法部署实战
学习SLAM过程中我们会遇到很多坎坷,如果没人指点,可能会花费大量的时间走弯路,尤其是涉及到传感器和算法部署的环节,错误/bug不断,很多同学不知如何下手。课程详情重磅上线!SLAM传感器与算法部署实战
问题主要集中在:
编程能力不足,遇到运行错误,心里慌不知如何解决 不知如何选择传感器型号,参数,更不知道如何使用 传感器跑算法要标定、调bug,问题太多,始终跑不起来 好不容易跑通,效果贼差,不知如何调参 无人交流,更无人指导,瞎摸索,无数次想放弃
基于此,计算机视觉life历时几个月精心准备,开设了首个系统讲解《SLAM传感器及算法部署实战》课程。最终课件预计达上百页。
课程全面细致。涉及常见SLAM传感器的介绍、操作、标定、实测使用,并在目前所有主流的SLAM框架(视觉/视觉惯性/激光惯性/视觉-激光-惯性SLAM)上进行了部署。 大量的实际操作,帮助初学者节省大量环境配置找bug的时间,快速上手。 学员可加入课程专属答疑群交流提问。 组织团购传感器,配套课程实操,学习效果事半功倍。
目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
机器人运动规划
运动规划和SLAM什么关系?
其实在企业里,SLAM算法工程师、运动规划工程师通常是相对独立的岗位,SLAM技术通常可以得到稀疏的定位地图,结合后处理可以得到稠密的三维点云地图。此时我们需要用一定的规则将其转化为栅格化地图,机器人在这个地图的基础上进行运动规划(导航)。SLAM和运动规划是自主机器人的两个核心技术。
简单来说,解决机器人导航问题一般被称为运动规划,就是让机器人可以自主根据传感器获取外部环境信息,在当前环境中找到一条适合机器人行走的最佳路径。这不是一个简单的工作,因为地图可能发生变化,其他运动的物体也是必须要绕过的障碍物,所以常常需要更改自己的规划,如何在这种复杂的环境下高效率地实现最佳路径,就是运动规划的使命。
运动规划在移动机器人的应用
独家注释代码
https://github.com/felderstehost/ros-navigation-noetic
长按或扫描查看系统教程大纲,目前有立减100 优惠券,私信客服还有赠品,扫描抢购!
↓点击“阅读原文”跳转教程官网