编辑:PaperEveryDay
A Closed-Form, Pairwise Solution to Local Non-Rigid Structure-From-Motion
编辑:PaperEveryDay
题目:局部非刚性运动恢复结构的封闭形式、成对解决方案
作者:Shaifali Parashar; Yuxuan Long; Mathieu Salzmann; Pascal Fua
摘要
非刚性结构从运动(NRSfM)的最新趋势是表达图像对之间的局部微分约束,通过求解一组多项式方程可以获得任意点的表面法线。虽然这种方法比依赖全局约束的对应方法更成功,但这些方法面临两个主要问题:首先,它们制定的方程系统大都是高阶的,必须使用计算上昂贵的多项式求解器来求解。一些方法使用多项式简化策略来简化系统,但这会引入一些幻影解。无论如何,采用额外的机制来选择最佳解决方案,这增加了计算量,并不能保证解决方案的可靠性。其次,这些方法制定图像对之间的约束。即使它们之间有足够的运动,它们也可能受到局部退化的影响,这使得在没有警告机制的情况下得到的估计不可靠。在本文中,我们为等距/共形NRSfM解决了这些问题。我们展示了,在广泛适用的假设下,我们可以推导出一组新的方程,以表面法线为术语,其两个解可以闭合形式获得,并且可以很容易地局部消歧。我们的形式主义还允许我们评估估计的局部法线的可靠性,并在它们不可用时丢弃它们。我们的实验表明,我们的重建,从两个或更多视图中获得,比现有技术的方法显著更准确,同时也更快。
关键词
NRSfM
微分几何
3D重建
可变形对象
I. 引言
从单目图像序列重建变形对象的3D形状被称为非刚性结构从运动(NRSfM),它在从娱乐[35]到医学[26]的各个领域都有应用。早期的方法依赖于表面的低秩表示[4]、[7]、[10]、[12]、[17]、[23]、[25]、[28]、[49],而最近的方法利用局部表面属性来导出约束,并可以处理更大的变形[8]、[9]、[20]、[47]、[50]、[51]。不幸的是,这些约束必须在整个重建点集上共同强制执行。因此,计算成本随着图像数量的增加而呈非线性增长,很快就变得难以承受。此外,通过迭代细化获得全局最优解,这容易陷入局部最小值,并在初始化不接近实际解的情况下增加计算量。最后,这些全局方法大多数不能处理缺失数据。在[13]、[34]中,这是通过迭代更新缺失条目来完成的,这增加了计算复杂性。我们推荐感兴趣的读者阅读[19]中对全局方法的详细回顾。
在我们之前的工作中[37]、[38]、[39],我们已经展示了局部方法构成了一个强大的选择。用微分属性表达等距、共形或等面积约束使得局部变量的数量保持固定。不幸的是,这些计算中出现的方程系统是高阶的二元方程。它们最多可以有五个实数解。从理论上讲,从3幅图像中可以获得一个独特的解决方案,但这需要一个复杂的平方和公式[37]、[38]或增加幻影解的简化方法[36]、[39]。因此,在实践中,需要超过3幅图像来产生可靠的估计。此外,当帧之间的运动太小,系统变得不适定时,估计不可靠,没有任何机制来标记这些情况有问题。
在本文中,我们引入了一种新的方法。我们不是推断深度导数,而是估计表面法线。更具体地说,给定两幅图像之间的2D变形,我们考虑对应点处的切平面。对于每一对点,我们计算连接两个平面的单应性,并将其分解以通过求解局部微分约束[37]、[38]来计算法线。这有两个解,而不是我们早期方法[36]中的五个。对于每个平面,我们通过实施一个易于计算的局部平滑度度量来选择正确的一个。此外,我们的形式主义让我们评估问题的解算条件有多好,因此,可以使用产生的法线。换句话说,我们可以从图像对中导出一组可靠的法线,并丢弃其他的。
我们将在合成和真实数据上证明,我们在计算成本的一小部分上就超越了最先进的局部和全局方法。因此,我们的贡献是一种依赖于闭合形式求解一组关联表面法线的方程的方法。完全是局部的,计算既快速又可靠。虽然我们的解决方案是为等距或共形变形而设计的,但它也对通用变形产生了良好的结果。
III. 形式主义和假设
本节的核心是我们的方法,即给定两幅图像中某点的投影以及它们之间的2D变形,可以在单一假设下计算变形3D表面上该点在两个不同瞬间的法线:局部表面平面性和变形局部线性。在本节中,我们首先介绍在本文其余部分中使用的NRSfM设置,这与[38]中的设置类似。然后,我们解释我们的假设的含义以及为什么它们是广泛适用的。最后,我们制定了我们将用于重建目的的约束。
A. 设置
图1描述了我们仅使用两幅图像I和I',由已校准的相机获取的设置。在每幅图像中,我们将变形表面记为S和S',分别用函数φ, φ: R^2 → R^3表示,将图像点与表面点相关联。假设我们有一个图像配准函数η: R^2 → R^2,将第一幅图像中的点与第二幅图像中的点关联起来。这通常被称为变形。在实践中,可以使用标准的图像匹配技术(如光流[45]、[46]或SIFT[29])计算得出。我们使用B样条[6]对η和φ进行参数化表示,这允许我们准确获得这些函数的一阶和二阶导数。也可以使用有限差分方法。
给定I中的点x = (u, v)及其在S上的对应3D点X = φ(x),我们写φ(x) = [u v 1]^T / β(u,v),其中β代表深度的倒数。φ的雅可比矩阵由下式给出: