点击下方“PaperEveryday”,每天获得顶刊论文解读
点击加入论文投稿、写作、阅读分享交流群
论文信息
题目:EPro-PnP: Generalized End-to-End Probabilistic Perspective-N-Points for Monocular Object Pose Estimation
EPro-PnP:面向单目物体姿态估计的广义端到端概率透视n点
作者:Hansheng Chen; Wei Tian; Pichao Wang; Fan Wang; Lu Xiong; Hao Li
源码链接:https://github.com/tjiiv-cprg/EPro-PnP-v2
论文创新点
1 概率PnP层的提出:本文提出了EPro-PnP,这是一个用于通用端到端姿态估计的概率PnP层。该层能够在SE(3)流形上输出具有可微分概率密度的姿态分布,从而克服了传统PnP问题在姿态歧义情况下的非可微分性。 2 端到端学习2D-3D对应关系:EPro-PnP通过将2D-3D坐标和相应的权重视为中间变量,通过最小化预测和目标姿态分布之间的KL散度来学习,实现了从零开始学习整个2D-3D点对应关系集,包括点的权重。 3 半监督训练策略和新数据集FFText-HQ:为了提高模型训练的效果并解决细粒度文本到人脸合成数据不足的问题,本文提出了一种半监督训练策略,并构建了一个新的数据集FFText-HQ,该数据集包含了精细的文本描述和对应的人脸图像。 4 可变形对应网络的设计:本文展示了EPro-PnP的灵活性,通过提出一种新型的可变形对应网络,该网络能够从头开始学习2D-3D对应关系,并在nuScenes 3D物体检测基准测试中实现了最先进的姿态精度。
摘要
关键字
姿态估计 成像几何 概率深度学习 3D视觉 自动驾驶
I. 引言
我们提出了EPro-PnP,这是一个具有可学习2D-3D对应关系的概率PnP层,用于通用端到端姿态估计,能够应对姿态歧义。 我们展示了通过简单地将EPro-PnP插入CDPN[18]框架,它能够轻松达到6DoF姿态估计的顶级性能。 我们通过提出用于准确3D物体检测的可变形对应学习,展示了EPro-PnP的灵活性,其中整个2D-3D对应关系完全从头开始学习。
3 广义端到端概率PnP
3.1 概述
3.1.1 KL损失函数
3.1.2 与基于重投影的方法比较
3.1.3 与隐式微分方法比较
3.2 蒙特卡洛姿态损失
3.2.1 建议分布的选择
3.3 反向传播
3.3.1 平衡不确定性和判别力
3.4 局限性和导数正则化损失
虽然KL散度是概率分布的良好度量,但现有的评估协议都是基于姿态的点估计。因此,对于推理,仍然需要通过求解方程(1)中的PnP问题来定位后验的模式,如果仅用KL损失训练,这可能是次优的。 如果仅在训练网络时施加KL损失,2D-3D对应关系是欠定的。如果网络架构没有经过仔细设计,具有偏好的归纳偏置,学习这些纠缠元素可能会很困难。
4 实现细节
4.1 动态KL损失权重
4.2 自适应Huber核
4.3 初始化
4.3.1 训练模式初始化
5 基于CDPN的6DoF姿态估计
5.1 网络架构
5.2 数据集和指标
5.3 基线
5.4 主要结果和讨论
5.4.1 KL损失与坐标回归训练
5.4.2 KL损失和导数正则化
5.4.3 利用对象3D模型的知识
5.5 与隐式微分和基于重投影损失的比较
5.6 与最新技术的比较
5.7 可视化
6 基于可变形对应网络的3D物体检测
6.1 网络架构
6.1.1 实现细节
6.2 损失函数
6.2.1 对应损失
6.2.2 辅助对应损失(可选)
6.2.3 其他损失函数
基本检测器损失,包括分类的焦点损失[49]和中心度的交叉熵损失。 用于回归2D参考点的平滑L1损失,目标定义为对象可见区域的中心。 用于辅助2D框回归的GIoU损失[50],遵循M2BEV[51]中的2D辅助监督。
3D得分的交叉熵损失。 用于回归3D框大小的平滑L1损失。 用于速度回归的平滑L1损失和属性分类的交叉熵损失。
6.3 数据集和指标
6.4 主要结果和讨论
6.4.1 对应损失函数的比较
6.4.2 与最新技术的比较
6.5 可视化
6.6 推理时间
7 局限性
8 结论
声明
#论 文 推 广#
让你的论文工作被更多人看到
你是否有这样的苦恼:自己辛苦的论文工作,几乎没有任何的引用。为什么会这样?主要是自己的工作没有被更多的人了解。
计算机书童为各位推广自己的论文搭建一个平台,让更多的人了解自己的工作,同时促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 计算机书童 鼓励高校实验室或个人,在我们的平台上分享自己论文的介绍、解读等。
稿件基本要求:
• 文章确系个人论文的解读,未曾在公众号平台标记原创发表,
• 稿件建议以 markdown 格式撰写,文中配图要求图片清晰,无版权问题
投稿通道:
• 添加小编微信协商投稿事宜,备注:姓名-投稿
△长按添加 PaperEveryday 小编