单旋转图像-ICP匹配实现高效的三维目标识别外文翻译资料

 2022-08-09 10:08

英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料


单旋转图像-ICP匹配实现高效的三维目标识别

摘要

提出了一种鲁棒高效的非结构化三维点云目标识别方法。该方法首先利用单自旋图像匹配找到目标物体的位置,然后利用迭代最近点(ICP)算法检索匹配的方向和质量。与传统使用自旋图像作为对象描述符相比,不需要顶点表面法线,而是使用场景的全局方向。这种假设提供了一种有效和健壮的方法来检测非结构化点数据中的对象。在我们的实验中,我们证明了我们的旋转匹配方法能够从照片的三维重建中检测汽车。其次,ICP算法的应用使得我们(1)可以在场景中拟合查询模型来检索车辆的方向,(2)利用拟合的残差来区分形状相似和形状不同的车辆。这使我们能够定位和识别不同类型的汽车。

关键词:三维物体识别,自旋图像,迭代最近邻点

1、介绍

今天,有一系列的技术可以从环境中创建3D模型。激光扫描和视觉重建是产生非结构化点数据的例子。提出了获取场景中目标识别的各种方法。在这种情况下,旋转图像被证明是一个强大的描述,以检测目标对象在混乱和闭塞的场景[4]。自旋图像是一种独立于视点的形状描述符,它是通过将三维点映射到二维直方图来创建的。

传统方法的一个缺点是需要匹配的自旋图像数量多,导致计算成本高。另一个缺点是需要在观测点的表面法线。通常这些表面法线在上述的采集方法中是不可用的。解决这个问题的一种方法是通过估计表面法线,然后只创建由一些更便宜的形状相似度过滤步骤[1]选择的对象位置的自旋图像。然而,估计法线绝非易事,其他形状相似度度量常常不能正确处理部分观察到的模型。我们没有添加不同的过滤方法,而是假设场景和目标对象的全局“向上”方向是已知的。这种先验知识可以用来有效地扫描目标物体的场景。

我们遵循[3],首先使用旋转图像来检测目标物体的位置,然后使用迭代最近点(ICP)算法来检索方向。这些方法相辅相成,因为自旋图像可以有效地在更大的场景中找到独立于物体方向的物体,而ICP算法能够重建两个大小相等的物体的方向。此外,由于ICP算法不仅用于确定模型的方向,而且还用于验证匹配的质量,因此这种组合可以安全地优化自旋图像生成的参数,以增强鲁棒性;如果拟合模型与场景对象之间的ICP匹配误差超过预定义的阈值,则放弃匹配。

这是使用自旋图像单独用于对象检测的一个优点。在选择自旋图像的参数时,总是需要在识别能力和鲁棒性之间进行权衡。更小的箱子尺寸产生的描述更适合于匹配更精细的对象细节,而更大的箱子尺寸对噪声的敏感性更低,因此导致更鲁棒性的检测。

这里使用自旋图像的方式与引入[4]的方式不同。通常使用多个自旋图像来表示已知的模型。这里提出的方法只使用一个单一的自旋图像,该图像覆盖了已知模型,原点位于模型的最顶部,且在全局方向上有一个法线(图3)。如前所述,没有考虑每个点的法线向量。“支持角”来确定一个点是否有助于自旋图像,因此也被丢弃。针对这种特殊情况,给出了一种更有效的自旋图像生成方法。

虽然我们假定了一个已知的全局方向,但是通过将点投射到一个平面上,匹配对象并不能简化为一个2D问题。目标物体可以位于不同的高度,当从任意角度看时可以被遮挡。

为了演示我们的方法,我们尝试在人工和真实场景中检测不同类型的汽车。图1显示了两种类型的汽车和其他对象(如树)的人工场景。图8显示了真实的场景。对于这些场景,一个已知的全球“向上”方向的概念显然是有意义的:对于所有的汽车,它认为,汽车的屋顶可能是在其车轮之上。然而,请注意,作为一个结果,汽车出现在现场上下将不会被检测到。

图2:场景中发现的两种车型。分别为:车型1、2

2 、方法

使用单一的自旋图像方向可以显著减少可能的物体姿态的数量,因为只考虑绕z轴旋转。因此,匹配问题从6维(x, y, z, rx, ry, rz)减少到4维(x, y, z, rx, ry, rz)。这是一个现实的假设,即当观测是在已知的条件下进行的时候,全球方向是可用的。然而,当这个全局方向未知时,你也可以尝试找到地平面,然后从这个平面检索全局方向。

在本节的其余部分中,我们假设已知的全局方向为向量(0,0,1)T,即z或“向上”方向,但不失一般性。当一个不同的法向量是首选的,模型和场景点数据都需要旋转

在扫描场景之前,Pscenefor可能出现的一个模型Pmodela旋转图像Pmodelis将被创建。自旋图像定位在pmodelin中z值最大的点上。旋转图像的大小(alpha;maxbeta;min)选择,这样整个模型。每个本rho;的旋转图像的大小类似于旋转图像的分辨率。图3给出了汽车模型1的自旋图像示例

图3:汽车的单旋转图像

给定输入的场景Psceneand已知的模型Pmodel,它们都是非结构化的点云,Pmodelin Psceneare的所有位置T和方向R现在都被找到了。算法1展示了检索T和R的步骤。

在算法1的步骤1中,所有的点 p在被观察的场景Psceneare作为原点/枢轴为自旋图像的创建。如果场景点云比模型点云密度大得多,可以使用点的均匀采样作为起点。一个有效的实现,为创建一个单一的自旋图像在一个给定的起点o减少到算法2时,球方向(0,0,1)的假设。将场景中的每个自旋图像与模型中的自旋图像进行比较。通过确定线性相关系数[3],比较两幅k = nm bin的自旋图像A和B:

在创建旋转图像场景中的点啊~一个线性相关系数大于某一阈值corrthresh,点添加到组检测d。

图4: 旋转图像匹配良好的三角形表示位置。

一般来说,对于单个对象,会有多个与模型匹配得足够好的相邻点。在下一节中描述的实验中,匹配点被发现以车顶为中心。在算法1的步骤2中,可以在单幅自旋图像范围内捕获的检测被认为是一个簇LD,由于场景中目标物体的数量事先不知道,所以并不是所有的聚类算法都是合适的。在我们的方法中,聚类是基于场景点生成的Delaunay镶嵌,即一个连接所有场景点的网格。在这个网所有边缘超过alpha;max被移除,从而产生一组隔离的连接组件。连接组件中的每个点都被分配相同的集群标签l。

在步骤3中,确定每个集群l的重心,这是集群l中点的平均位置。该中心用作每个对象的唯一检测位置。请注意,要使此过程起作用,至少需要对每个对象进行三个相邻的检测。

在步骤4中,从场景中选择检测区域内的点Pcutoutoutin。然后使用ICP算法对这些点进行对齐。对准程序的结果是最终估计位置T,方向R和拟合误差。如果误差小于某个阈值,则将位置和方向添加到最终结果中。更详细地说,在检测到潜在的汽车后,汽车的方向仍然未知,因为自旋图像是旋转不变的。为此,我们采用迭代最近点(ICP)算法来建立目标模型pmodel和部分被扫描场景pcut之间的正确对应关系。由于ICP算法需要初始对准,我们用汽车模型的12个不同方向初始化ICP算法。然后ICP算法优化了场景中汽车模型的每个初始方向和位置,并使用最小均方根(RMS)距离保持ICP细化。我们使用的12个方向是绕上矢量旋转30度的不同方向。我们使用的ICP算法优化了模型顶点与被扫描场景之间的最近点对的RMS距离。

式中,eminis为pmodelp点到Pcutout中最近点的欧氏距离。为了提高时间效率,我们使用Kd-tree的pcutout进行快速最近点对选择,而ICP算法只需15次迭代。在ICP算法中,我们选择80%的最佳匹配点对用于估计最佳位置T和方向r。这些是ICP算法的常见变体,如[5]中所述。假设模型只适合具有相同3D形状属性的扫描对象。当模型和场景之间的ICP残差足够小时,我们就可以对三维形状进行实际的分割。

3、实验

图5:场景中的模型

本节将上述方法应用于不同场景下的车辆检测。该方法的鲁棒性主要体现在两个方面:一是使人工场景更加逼真;二是将其应用于真实世界数据。

3.1 人工数据集

图1所示的场景是使用3D建模软件程序创建的。场景包括模型1的四辆车和模型2的四辆车。然后对整个场景中的所有网格进行均匀采样,创建一个包含250000个点的点云。现场的每辆车大约有6000个点。以同样的方式为汽车模型1创建一个点云,如图2所示,其中包含25,000个点。

创建一个自旋模型的图像分辨率rho;为0.1 m。旋转图像集的半径,这样4.2汽车图像中轻松适合:alpha;max = 2.5 m。旋转照片拍摄的高度要比汽车模型的高度小,为了丢弃在匹配过程:beta;min =minus;1.0 m。旋转图像定位在z值最大的点,即屋顶。图3显示了这种汽车模型的自旋图像。

在匹配过程中,场景中的每一个点都是采样点,在采样点上生成场景自旋图像。在聚类步骤中,我们考虑了所有自旋图像相关系数大于εthresh= 0.6的采样点。阈值参数的几何意义不是很直观,因此在某种程度上是随意选择的。在随后的所有实验中都成功地使用了这个固定值,由此我们可以得出结论,该方法对参数的选择不是很敏感。

模型1的四辆车全部检测成功。图4以黑色显示检测到的车辆。与旋转图像粗设置本rho;= 0.2米,大小足够的细节丢失需要考虑两种车型等同的,在现场检测所有八个汽车。换句话说,这允许对未知模型进行广义搜索。

3.2来自单一视角的数据

作为将该方法应用于真实世界数据集的桥梁,我们预计点云可以从单一的观察方向获得。特别地,我们假设场景是从上面被观察到的,导致从场景中物体的侧面进行稀疏或缺失点采样。拟合模型的表示可以使用这种先验知识,防止模型中不能从那个方向看到的部分出现匹配错误。图6显示了汽车模型的点云在可以从上面看到的人脸上采样。

图6:从上面扫描得到的汽车模型

这个步骤的结果是位于其他物体下面的汽车将会丢失。特别是,这适用于图1中帐篷下最右边的汽车

3.3高斯噪声数据

除了使用投影数据外,还测试了单自旋匹配在噪声数据中的鲁棒性。将不同水平的正态分布噪声添加到包含7辆车的人工数据集中(未计算部分被遮挡的车)。对于每个噪声水平,分析有多少目标检测被发现。结果如图7所示。

图7:噪声对自旋匹配的影响

可以看出,故障点位于噪声水平约为sigma;= 25厘米。这么大的噪音,再也找不到汽车了。此外,还观察到,在低噪声水平时,如果没有汽车存在,就会出现误检。注意,我们的方法的所有参数(包括阈值)在这个实验中都没有改变。

当我们的方法在下一节应用于真实世界数据集时,后续的ICP模型拟合步骤将被详细介绍。

3.4现实数据

为了获得真实的数据集,我们使用Bundler[6]和基于补丁的多视图立体视觉软件(PMVS2)[2]在几个位置上进行了视觉重建。在这篇论文中,我们展示了TNO大楼阳台的结果。阳台高约20米,宽约80米。重建得到的点密度约为1000点/m2(图8)。

图8:Stieltjesweg的视觉重建。从正确的观点看,重建质量的第一印象是好的。然而,插图显示,汽车是嘈杂的和不完整的。

图9:在Stieltjesweg发现的两辆匹配的汽车。紫色和棕色的汽车模型安装在点云

表1:确定场景中每个模型的残差RMS距离(mm)。这些行从左到右代表安装的汽车。在潜在的汽车位置2、6、8、10、13和14,模型适合得很好。这些列显示了不同数量的样本的结果。最后一列显示是否提供了良好的初始化

在这个数据集中,为了检测和拟合汽车,使用了与人工场景相同的汽车模型。场景中有13辆车。使用与之前相同的参数,18个位置由自旋图像匹配器标记,其中12个位置由自旋图像匹配器标记确实是很好的搭配。在这18个地点,ICP算法试图拟合汽车模型。根据剩余的RMS距离,我们确定在潜在的位置是否有一辆与我们的车型相似的车。此外,研究ICP算法中模型样本数量(n)的影响也很重要。

在接下来的实验中,我们改变从汽车模型顶部选取的随机样本n的数量,以确定快速对齐和稳健对齐之间的良好平衡。使用四组样本;100、500、1000、2000组随机样本,也如图12所示。对于这些较小的子集,我们使用ICP算法来获得自旋位置上的最佳对准。表1显示了ICP算法在场景中对每个旋转位置的拟合情况。这些结果与图10所示的从左到右的汽车相对应。这些结果表明,位置2、6、8、10、13和14是模型拟合很好的位置,剩余RMS距离较低。一个重要的观察结果是,对于这6组检测,无论使用500个、1000个还是2000个样本,在这些情况下,残留的RMS距离与其他12个检测有足够的区别。100个样本的结果似乎不那么有区别。然而,这意味着,这一特定类型的汽车分割可以非常有效地完成,只需使用500个表面样本和rms阈值115mm。图11显示了接受的汽车分段。

图10:ICP算法中用于检测车辆方向的所选样本集。

图11:所选旋转位置的拟合结果(n=500)。一些探测有错误的位置和方向。注意,对于可视化,使用的是原始的3D模型

图12:根据RMS阈值选择的拟合结果(n=500)

4、结论与未来工作

该方法成功地利用了先验知识和全局场景定位,有效地识别了场景中的目标。假设有一个已知的全局方向,并因此找到具有5而不是6个自由度的对象是否现实,这取决于应用程序域。正如所演示的,户外场景就是这样的一个例子。

与传统的自旋图像匹配方法

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[239559],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。