基于SURF的图像配准与拼接技术外文翻译资料

 2022-07-25 02:07

英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料


毕业设计

(英文资料翻译)

英文题目:SURF: Speeded Up Robust Features

中文题目:SURF:具有快速鲁棒特性的特征检测算法

学院 (系):

自动化学院

专业班级:

自动化zy1302班

学生姓名:

杨明东

指导教师:

张素文

SURF:具有快速鲁棒特性的特征检测算法

摘要

在这篇论文中,提出了一种新型的尺度和旋转不变的特征点检测算子和描述子,称为SURF算法。SURF不仅在可重复性、鉴别性和鲁棒性方面都接近甚至优于以往提出的方案,而且在计算和比较方面的速度将更快。

这依赖于使用了积分图像进行图像卷积、使用现有的最好的检测子和描述子(特别是,使用了一个基于Hessian矩阵方法的检测子,和基于分布的描述子)、以及简化这些算法到了极致。最终实现了新的检测、描述和匹配过程的结合。本文介绍了基于一个标准的评估集上的实验结果,以及在现实生活中的物体识别应用的背景下获得的图像,这些都表明了SURF的健壮的性能。

1.介绍

在两幅具有相似场景或目标的图片中找到像素点的匹配关系,是许多计算机视觉应用中的一项任务。图像配准,摄像头校准,3D重建,目标识别,只是其中的一部分。

寻找离散像素点之间的匹配的任务可以分为三步。第一,选出兴趣点并分别标注在图像上,例如拐角、斑块和T型连接处。兴趣点检测子最有价值的特性是可重复性。可重复性展现的是检测子在不同视觉条件下找到相同真实兴趣点的能力。第二,用特征向量描述兴趣点的邻域。这个描述子应该有鉴别性,同时对噪声、测量误差、几何和光照变换具有鲁棒性。第三,在不同的图片之间匹配特征向量。这种匹配基于向量间的马氏或者欧氏距离。描述子的维度对于计算效率有直接影响,而对于快速兴趣点匹配,较小的维度是较好的。

我们的目标是开发新的检测子和描述子,相对于现有的特征检测算法来说,计算速度更快,同时又不牺牲性能。为了达成这一目标,我们必须在二者之间达到一个平衡,例如,在降低描述子的维数和复杂度的同时,仍然能保持有效的鉴别能力。

在相关文献[1-6]中,已经提出了大量的检测子和描述子。同时,基于基准数据库的详细的对于和评估也已经在文献[7-9]中进行过。当构建我们的快速检测器和描述符时,我们建立了从以前的工作中获得的见解,以获得什么是有助于性能方面的感觉。它建立在前人的成就上。在我们对基准数据库的实验上,SURF检测子和描述子不止更快,而且可重复性更好,同时鉴别力更高。

当使用局部特征时,需要解决的第一个问题是不变性所需的水平。显然,这取决于预期的几何和光度的变形,这反过来又取决于环境条件的变化。在这里,我们专注于尺度和图像旋转不变的检测器和描述符。对于常见的光学畸变,这似乎在特征复杂性和鲁棒性之间达到了妥协。歪倾斜,各向异质性,缩放和透视效应被认为是次要影响,在一定程度上可以被描述子的鲁棒性修复。正如Lowe在第[ 2 ]篇参考文献中说明的一样,全仿射不变特征的额外复杂性往往对其鲁棒性存在负面影响,除非比起预期会有很大的视点变化。在一些情况下,甚至旋转不变性可以被省略,这导致我们的描述符只有尺度不变特性,我们称为“竖直SURF”(U-SURF)。事实上,在相当多的应用中,例如移动机器人导航或视觉游览引导,相机通常仅围绕垂直轴旋转。在这种情况下,避免旋转不变性的过度使用的好处不仅是增加了速度,而且还增加了辨别能力。关于光度变形,我们假设具有比例因子和偏移的简单线性模型。注意我们的检测器和描述符不使用颜色。

本文内容组织如下:第2节描述了我们的研究成果所依据的相关工作。第3节描述兴趣点检测方案。在第4节,提出了新的描述符。最后,第5节展示实验结果,第6节得出结论。

  1. 相关工作

兴趣点检测 最常用的检测子是1988年提出的基于二阶矩矩阵的Harris角点检测子[10]。然而,Harris角点不是尺度不变的。Lindeberg[1]介绍了自动尺度选择的概念,可以根据兴趣点的特征尺寸检测兴趣点。他用Hessian矩阵和Laplacian矩阵的秩(以及Hessian的迹)检测类似斑块的结构。Mikolajczyk and Schmid[11]提炼了这种方法,创造了鲁棒性好,尺度不变,高重复性的特征检测子,称为Harris-Laplace和Hessian-Laplace。他们使用(适应尺度的)Harris方法或者Hessian矩阵行列式来选择位置,使用Laplacian选择尺度。为了提高速度,Lowe[12]提出了用Laplacian of Gaussians (LoG)来近似Difference of Gaussians (DoG)的方法。

此外还有其他尺度不变检测子,例如Kadir and Brady[13]提出的显著区域检测子,这种检测子将一个区域内的熵最大化,另外还有Jurie and Schmid[14]的基于边缘的检测子。这些算法不易优化,尽管几个放射不变特征检测子已经被提出用来应对宽视角变化,然而这些超出了本文的范围。

在文献[15,8]中,通过公开资料对现有检测子的对比,我们能得出结论,基于Hessian矩阵的检测子比基于Harris的更稳定和可重复。另外,Hessian矩阵行列式也比迹有优势,因为它对于拖尾的,局部错误的结构误警更少。我们同样观察到,它的DoG近似能在损失精确度的情况下提高速度。

兴趣点描述 特征描述子有很多种,例如高斯导数[16]、不变矩[17]、复合特征[18,19]、可控滤波[20]、基于相位的局部特征[21]等。描述子代表兴趣点附近的小范围特征分布。Lowe发明的基于相位局部特征[2]已经被证明优于其他的方法[7]。这是因为其获取了大量空间强度信息,同时对小范围变形和局部错误有稳健性。文献[2]中的SIFT描述子计算兴趣点附近的方向梯度柱状图,存储为128维向量(八个方向数据,每个方向含4x4个分量)。

这种基本方法的优化版本有很多。Ke and Sukthankar[4]把PCA加入到兴趣点附近的梯度图。PCA-SIFT输出36D描述子,匹配更快,但是Mikolajczyk 在一篇对比论文中[8]指出,其鉴别度低于SIFT,并且PCA计算低于SIFT。在同篇论文中[8],作者提出了一种SIFT的变种,叫做GLOH,它的鉴别度比SIFT高,但是计算量更高,因为这种算法也使用PCA提取数据。

实际应用中,SIFT描述子描述子仍然是最吸引人,也是最常用的描述子。它的鉴别度和速度对于即时应用很关键。最近,Se 等人在文献[22]中,在Field FPGA上实现了SIFT算法,速度提高了一个数量级。他们达到了和我们相同的速度(虽然特征描述的速度是固定的),但是是以降低SIFT的质量为代价的。概况的说,描述子的高维度是SIFT在匹配阶段的缺点。对于普通PC上的即时应用来说,这三个阶段(检测、描述、匹配)都要快。Lowe为了加快匹配步骤,提出了一个最佳优先选择方法[2],但是这导致较低的精度。

我们的方法 在本文中,我们提出一种新的检测器描述符方案,叫SURF(加速鲁棒特性)算法。检测器基于Hessian矩阵[11,1],但是使用的是基本的近似矩阵形式,正如DoG [2]是非常基本的基于拉普拉斯的检测器。它依赖于积分图像来减少计算时间,因此我们称之为“快 - 粗糙”检测器。另一方面,描述符描述了在兴趣点邻域内的Haar小波响应的分布。然后,我们利用积分图像来提升速度。此外,仅使用了64个维度,减少了特征计算和匹配的时间,并且同时增加了鲁棒性。我们还提出了一个基于拉普拉斯算子的符号的新的索引步骤,这不仅增加了匹配速度,而且增加了描述符的鲁棒性。

为了使这篇文章更加充实,我们简洁地讨论了积分图像的概念,如[23]所定义的。它们允许快速地实现盒式卷积滤波器。在像素处的积分图像表示由点x和原点形成的矩形区域的输入图像I中的所有像素的总和,即。 用计算,只需要四次加减法运算,就可以计算出在任意位置的矩形区域上的强度之和,而与其大小无关。

  1. 快速Hessian检测器

我们的检测器基于Hessian矩阵,因为它在计算时间和精度方面具有良好的性能。然而,它不是使用不同的度量来选择位置和尺度(如在Hessian-Laplace检测器[11]中所做的),我们依赖于Hessian的行列式。给定图像 I 中的某点 x=(x, y),在该点 x 处,尺度为 sigma; 的 Hessian 矩阵 H(x, sigma;)定义为:

(1)

其中,是高斯二阶微分在点 x=(x, y)处与图像 I 的卷积, 和 具有相似的含义。

高斯是尺度空间分析的最佳选择,如[24]所示。 然而,在实践中,高斯需要被离散和裁剪(图1左半部分),并且即使对于高斯滤波器,一旦对所得到的图像进行子采样,就仍然会发生混叠。并且,在没有新结构可能出现时,虽然降低分辨率的属性已经在1D情况下证明,但不适用于相关的2D情况[25]。 因此,高斯的重要性似乎在这方面有点过分,在这里我们测试一个更简单的方法。由于高斯滤波器在任何情况下都是不理想的,并且由于Lowe在LoG上近似的成功,我们使用盒状滤波器作近一步近似(图1右半部分)。这些近似的二阶高斯导数,可以使用积分图像非常快速地估计,与大小尺寸无关。正如结果部分所示,近似后的性能与使用离散和裁剪的高斯函数的性能相当。

图1.从左到右:y方向和xy方向的(离散和裁剪)高斯二阶偏导数,以及我们使用盒状滤波器的近似。其中灰色区域等于零。

图1中的9times;9盒状滤波器。是尺度为sigma;= 1.2的高斯二阶导数的近似值,并且表示我们的最低尺度(即最高空间分辨率)。我们用Dxx,Dyy和Dxy表示我们的近似结果。为了计算简单,我们将方形区域的权重设为固定值,但是我们需要进一步平衡用于Hessian的行列式的表达式中的相对权重:,其中是Frobenius范数。因此,

(2)

此外,滤波器响应根据尺度进行了归一化,这保证了对于不同尺寸有等量的Frobenius范数。

尺度空间通常实现为图像金字塔。图像用高斯滤波器反复平滑并随后进行子采样以便实现更高级别的金字塔。由于使用盒状滤波器和积分图像,我们不需要将同样的滤波器迭代应用在上次输出的图层上,而是使用任意尺度的方形滤波器,甚至并行(虽然后者没有在这里使用)。因此,尺度空间是使用放大的滤波器尺度,而不是迭代减小图像大小。上述9times;9滤波器的输出被认为是初始尺度层,我们将其称为尺度s = 1.2(对应于sigma;= 1.2的高斯导数)。考虑到积分图像的离散性质和我们的滤波器的具体结构,可以通过用逐渐增大的掩模过滤图像获得以下层。具体来说,尺寸为9times;9,15times;15,21times;21,27times;27等的滤波器。在较大尺度,连续滤波器尺寸之间的步长也应相应地缩放。因此,对于每个新的组,滤波器大小增加是双倍的(从6到12到24)。同时,用于提取兴趣点的采样间隔也是双倍增加的。

由于滤波器布局的比率在缩放之后保持恒定,因此近似的高斯导数也相应地缩放。因此,例如,我们的27times;27滤波器对应于sigma;= 3times;1.2 = 3.6 = s。 此外,由于它们已经被规模归一化[26],因此,Frobenius范数对于我们的滤波器保持不变。

为了在图像及不同尺度中定位兴趣点,我们用了3x3x3邻域非最大化抑制。Hessian矩阵行列式的最大值在尺度和图像空间被插值,依据Brown et al.[27]提出的方法。

尺度空间内插值在我们的方法中尤其重要,因为每组的第一个滤波器的尺度差异比较大。图.2显示了用我们的快速Hessian检测子检测到的兴趣点。

图2. 左:为向日葵区域检测到的兴趣点。这种场景清楚地显示了基于Hessian的检测器的特征的性质。中间:用于SURF的Haar小波类型。右:涂鸦场景的细节,显示不同尺度的描述符窗口的大小。

4. SURF特征描述符

与其他描述符相比,SIFT的良好性能是显着的[8]。 它混合了粗糙的局部化信息和梯度相关特征的分布,产生良好的独特能力,同时消除了尺度或空间方面的定位误差的影响。使用梯度的相对强度和取向减小了光度变化的影响。

本文提出的SURF描述符基于类似的性质,其中复杂度进一步降低。 第一步包括基于来自围绕兴趣点的圆形区域的信息固定可再现定向。然后,我们构造与所选取向对准的正方形区域,并从其中提取SURF描述符。现在依次解释这两个步骤。此外,我们还提出了一个直立版本的描述符(U-SURF),对于图像的旋转是可变的,因此更快地计算和更好地适用于相机保持或多或少水平的应用程序。

4.1描述符方向分配

为了做到对图像旋转不变,需要对兴趣点确定一个可重现的方向。为此,我们在兴趣点半径6s的圆形邻域内计算x和y方向的Haar小波响应,如图2,s是兴趣点所

全文共12736字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[144958],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。