点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
S2P3: Self-Supervised Polarimetric Pose Prediction
S2P3:基于偏振光的自监督姿态预测
Patrick RuhkampDaoyi GaoBenjamin Busam
摘要
本文提出了一种新颖的自我监督6D物体姿态预测方法,该方法基于多模态RGB+极化图像。该训练范式包括:(1) 一个物理模型来提取极化光的几何信息,(2) 一种师生知识蒸馏方案,以及(3) 通过可微渲染和可逆物理约束形成的自我监督损失公式。两个网络都利用极化光的物理特性来学习鲁棒的几何表示,通过编码从我们的物理模型派生的形状先验和极化特性。来自教师网络的几何伪标签支持学生网络,无需标注的真实数据。通过可微渲染器获取对象的密集外观和几何信息,与预测的姿态直接耦合进行自我监督。学生网络还具有我们提出的物理形状先验的可逆公式,这使得通过与极化输入图像比较得出的极化特性的物理约束,能够实现端到端的自我监督训练。我们特别关注光度学上具有挑战性的对象,包括无纹理或反射表面和透明材料,这些对象的性能提升最为显著。
1 引言
"要有光,就有了光"。光一直是历史上许多重大科学发现的基础。早期的日晷利用从太阳投射下来的不断变化的影子来测量时间,跨越了几个世纪和全球不同的文明。基于电磁波(EM)恒定速度的原理,通过测量光脉冲发射后反射回来的时间,可以确定物体的距离。然而,由于反射材料、环境光或通过玻璃等透明物体时的内在错误估计等因素,测量会受到多径干扰(MPI)等伪影的影响。这导致对光度学上具有挑战性的对象的深度估计不准确。尽管如此,许多从图像中学习几何任务的方法还是使用这些深度数据中的几何信息。
6D物体姿态估计就是这样一种几何任务,在许多计算机视觉和AR应用中至关重要,范围从机器人技术到安全关键的自动驾驶和医疗应用。最近的方法将几何信息直接作为输入,或者利用它进行自我监督。可靠的几何线索可以提高姿态估计的性能,而不可靠和嘈杂的深度信息会干扰神经网络已经学会提取的信息。
作为一种混合神经物理方法,通过自我监督学习,使用来自多模态数据的几何形状先验的神经编码,学习具有光度学挑战的6D物体姿态预测。 通过在不同光度复杂性的对象上进行广泛的实验,洞察可微渲染与可逆物理模型的相互作用。 一个实例级合成极化图像数据集,用于6D姿态估计,包括PPP-Net和PhoCal中存在的对象。
2 相关工作
2.1 极化成像
2.2 6D物体姿态估计
2.3 几何深度信息
2.4 自我监督
2.5 极化6D姿态预测
3 极化物理模型
3.1 RGB-D的光度学挑战
3.2 从极化中获取表面法线
3.3 图像形成模型
3.4 可逆物理模型
4 方法论
4.1 网络架构
4.1.1 教师网络
4.1.2 学生网络
4.2 物理诱导的自监督训练方案
4.3 损失公式
4.3.1 物理约束
5 实验结果
5.1 合成数据生成
5.2 训练
5.2.1 合成预训练
5.2.2 自监督训练在真实数据上
5.2.2.1 训练细节
5.2.2.2 损失函数的作用
5.3 实施细节
5.4 折射率
5.5 评估指标
5.6 定量结果:基线比较
5.7 消融研究
5.7.1 域偏移消融:的自监督
5.7.2 网络架构消融:交换学生
5.7.3 消融在损失项
5.7.4 模态消融
5.7.5 运行时间分析
6 结论
6.1 局限性
6.2 自监督偏振姿态预测
声明
下载1:OpenCV-Contrib扩展模块中文版教程 在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。 下载2:Python视觉实战项目52讲 在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。 下载3:OpenCV实战项目20讲 在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。 交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~