用于图像匹配和对象的光照不变颜色模型识别外文翻译资料

 2021-11-06 05:11

用于图像匹配和对象的光照不变颜色模型识别

摘要

本文提出了一种新的照明方法用于图像匹配和对象的不变颜色模型识别。颜色模型定义为相邻像素之间的颜色差异每种颜色组件。基于二色的反射光颜色模型的建立,表明本文提出的方法是可行的颜色模型不受光照几何的影响,照明颜色,反射性和漫射照明。实验结果表明,该方法具有较强的鲁棒性使用新的颜色模型对物体进行识别在不同的光照颜色下被照亮和照明几何。

1.介绍

颜色是图像匹配的一个重要特征和对象识别。Swain和Ballard[1]提议一种简单有效的基于图像匹配的方法在颜色直方图。颜色直方图已经广泛应用于许多视觉应用,如目标识别[2],图像匹配[3],图像检索[4,5]。然而,对象颜色是敏感的照明几何和照明。的柱状图同一场景的两幅不同的图片光照条件差别很大,因此影响识别精度。经费和Finlayson[6]扩展了颜色索引方法来减少通过索引照明对照明的敏感度基于颜色比例的不变表面描述符在邻近的像素。他们的方法假设相邻像素具有相似的表面法线。Gevers而Smeulders[2]提出了一种基于导数的颜色不变量,对变量的变化具有鲁棒性光源的颜色和照明几何形状。这项工作是

后来扩展到图像的导数结构并导致基于边缘的颜色恒常性[7,8]。他们的然而,方法仍然是不同的镜面反射(亮点)。

本文提出了一种新的颜色模型不受光照几何,光照颜色,反射和漫射光。这篇论文是组织如下。在第二部分,基本颜色定义了反射模型,并在此基础上进行了假设阐述了反射模型的基本原理。在第三节,各种常用的颜色模型和它们对成像参数的依赖关系是讨论了一种新的光照不变颜色模型是派生的。第4节包含实验结果和结论载于第5节。

  1. 颜色反射模型

在本节中,我们将介绍颜色反射模型需要对颜色模型进行推导。假设一个场景由非齐次组成介质对象,并由光源照明e(lambda;),wherelambda;is波长。测量的红色,其中的绿色、蓝色传感器值C={R, G, B}相机光谱敏感性fc(lambda;)从一个对物体上的极小曲面块进行建模[9]:

式(1)中的第一项是物体反射描述与光相互作用后所反射的光地表反照率b(lambda;)。第二项表示表面反射组件,s(lambda;)表示菲涅耳反射。术语mb和ms表示身体和表面的几何关系分别反映组件。n是曲面补片法线,s为光照方向源,v是观察者的方向。

假设中性界面反射(NIR)模型,即菲涅耳反射率为独立的波长lambda;。因此,我们将进一步省略年代(lambda;)方程。环境或扩散光不是由式1所模拟的。在室内设置中,漫反射光线来自墙壁和天花板的反射。Shafer[9]用第三项来模拟漫射光,

假设传感器敏感fc(lambda;)彩色照相机是窄带和光谱照相机响应可以近似为函数[10],然后将反射模型简化为:

为了简单起见,我们将删除mb的参数以及进一步方程中的质谱。

3.颜色模型

在下面,我们将检验不同的影响eq. 3中定义的各种颜色的成像参数我们得到了一个新的颜色模型不受光照几何,光照颜色,反射和漫射光。

首先,我们考虑白色照明的情况= eG = eB = e),无镜面反射率(ms = 0,哑光),没有漫射光(ac = 0),则式3就变成:

对于这种情况,规范化的rgb颜色模型可以是被认为是数学上不变的光照几何和光照强度,

归一化g和b也有类似的方程在这种情况下,规范化的rgb颜色只依赖于表面反射率。

表面反射率(msne;0,击球表面),

对手的颜色模型可以显示为由于,

从式7可以看出,对手的颜色模型仍然是变化的反对照明几何和照明强度变化。HSI颜色模型的色相成分,另一方面,对于几何是不变的,如上图所示的是投机和光照强度下面,

几何项(mb和ms)和光照项(e)被提出。

用于彩色照明的情况下与no镜面反射,无漫射照明,式3就变成:

在本例中,Gevers和Smeulders[2]提出了一个不受光照影响的不变颜色模型颜色和照明几何。他们定义了颜色模型为相邻两个颜色的比值图像像素x1和x2,

如果光照是局部恒定的相邻像素(c c c ex1 = ex2 = e), m1m2m3与照明颜色和照明有关的不变量如下图所示,

对物体几何形状和光照的依赖被提出来,因此m1只依赖于表面反照率。m2也有类似的推导和m3。

颜色型号m1m2m3不考虑投机和漫射照明(ms和ac)。在接下来我们推导出一个新的不变颜色模型对于式3中定义的所有成像参数。我们假设局部光照不变,如[2]。

此外,我们还假定了曲面的方向相邻的两个像素之间没有变化显著(b b b mx1 = mx2 = m)。类似的假设在[6]中使用。在假设下,差值两个相邻像素之间的颜色分量x1和x2对镜面反射率不变漫射照明,

表面反射率和漫射光项分别为取消了。我们定义了新的颜色模型p1p2p3,由于颜色的比例不同,两者之间的差异每个颜色组件的相邻像素:

由式15-17可以看出,新的颜色模型是否只依赖于差的比值表面反射率。理论上,p1p2p3在a上为零均匀着色区域,像素为非零两个区域之间有明显表面的边缘地表反射率。

颜色模型依赖关系的摘要各种成像条件见表1。

4. 实验

我们评估了提出的颜色的性能基于阿姆斯特丹的图像匹配模型对象图像库(ALOI)数据库[11],其中是彩色对象的图像数据库。我们也将所提出的颜色模型与实验结果进行了比较的其他颜色模型的结果最后一节。

表1。颜色模型概述及它们对各种成像条件的不变性。“x”表示不变。

4.1实验装置

ALOI图像数据库包含的图像物体在不同的光照颜色和照明的方向。图1显示了a的图像在不同光照颜色下采样对象图2显示了在下面拍摄的另一个对象的图像四个不同的照明方向。请参考[11]详细描述成像设置。为评估目的,我们选择100个不同的对象表面属性,从粗糙,零表面到光滑,攀爬的表面。表面光亮的物体属性可用来测试颜色模型高光。

图1所示。来自ALOI[11]的样本图像不同光照下的彩色物体颜色。

图2。来自ALOI[11]的样本图像不同光照下的彩色物体的方向。

不同颜色模型的直方图是不同的为每个图像构造。对于颜色模型rgb,采用m1m2m3、p1p2p3三维彩色直方图,色调采用一维直方图。为了避免与计算颜色有关的不稳定性模型,像素有低饱和度和低强度值被丢弃。对于m1m2m3和p1p2p3,首先对图像进行高斯平滑处理抑制颜色比对噪声的敏感性。直方图轴以均匀的间隔分割。确定了轴的适当分辨率经验。在实验中,每个轴的料仓尺寸为32用于创建rgb, m1m2m3的三维直方图,和p1p2p3。箱子的大小是64用来创建1-D对颜色直方图。所有的直方图都被归一化用直方图中的每个条目除以总数直方图中的元素。

图像匹配是通过匹配颜色来完成的直方图。两个直方图相似度,H(I)H(Irsquo;)用直方图相交[1]表示,

大的值表示这两个直方图是相似的。

实验中进行了两组实验。在第一个实验中,100个物体的图像在照明颜色I110下照明作为参考图像(图1a)。的直方图各种颜色的模型为参考图像构造和存储。测试图像是同样的100个物体在三种不同的光线下被照亮光照颜色(图1b~1d)。对于每个测试图像,它的颜色直方图与直方图相匹配使用eq. 18得到100幅参考图像。正确的如果测试图像与最相似,则声明匹配参考图像是同一对象的图像。在第二个实验,100个物体的图像照明方向为L8C1

作为参考图像(图2a),与图像的同样的100个物体在其他不同的光线下被照亮采用光照方向(图2b~2d)作为测试图像。

4.2实验结果

在表2中,正确匹配的百分比为各种颜色下的模型有三种不同显示照明颜色。从表中我们可以看到rgb和色调对光照非常敏感颜色。他们的正确匹配率非常低,特别是对于光照颜色I250,这是最多的与参考颜色不同。另一方面,颜色模型m1m2m3和p1p2p3对其敏感性较低照明的变化。改变光照颜色从I110到I250不会降低它们的正确匹配率显著,尤其是p1p2p3。很明显表1表明,p1p2p3模型性能较好比m1m2m3的颜色模型,这可以用一些测试对象包含smooth的事实表面光滑,且p1p2p3模型不变尊重投机和漫射照明,但m1m2m3模型没有。

表2。匹配项的正确匹配百分比各种颜色的模型下三种不同照明的颜色。参考照明颜色是I110。

表3显示了正确匹配的百分比适用于各种颜色下的三种不同型号照明的方向。结果表明:与其他颜色模型相比,本文提出了p1p2p3颜色模型对颜色的变化不太敏感照明的方向。其中p1p2p3型号的效果最好整体表现,正确率超过87%三个不同的照明方向的速率。在另一方面,m1m2m3模型在处理光照方向时整体性能最差变化。

表3。匹配项的正确匹配百分比各种颜色的模型下三种不同照明的方向。参考照明方向是L8C1。

5.结论

我们提出了一种新的颜色模型不受光照几何,光照颜色,反射性,漫射光。颜色模型是定义为色差之间的比值每个颜色组件有两个相邻像素。根据这个定义和二色反射颜色模型中,它显示了依赖关系成像参数,如光照几何,推测和光照颜色可以被分解出去了。我们已经测试了新的配色模型在不同光照下被照亮的物体颜色和照明方向。的性能提出的颜色模型优于其他模型。未来的研究将包括评估不同对象下颜色模型的性能视点和宽基线立体。

用于图像识别的变形模型

摘要

介绍了不同非线性图像变形模型在图像识别任务中的应用。变形模型特别适合于局部变化,因为它们经常出现在图像对象变化的情况下。我们表明,在在讨论模型时,有一种方法结合了实现的简单性,低计算复杂性和高度各种真实世界图像识别任务的竞争表现。我们通过实验证明该模型表现非常好用于四种不同的手写数字识别任务和医学图像的分类,因此显示出高度概括容量。特别是,实现了MNIST基准测试的错误率为0.54%,以及报告的最低错误率,特别是12.6%,在2005年国际ImageCLEF医学图像分类评估中。

索引术语 - 图像匹配,图像对齐,字符识别,医学图像分类。

1.引言

图像匹配是许多图像中的重要步骤识别任务。 特别是在高位的存在图像可变性,通过灵活匹配进行分类给定参考的图像是最有希望的之一实现低错误率的方法。 在本文中,我们讨论和比较几种图像匹配模型承认的背景和表明他们导致跨越不同任务的出色结果。

众多不同复杂度的变形模型已经在文献中讨论过,但它们通常都是没有直接比较。 第二,第一和第零的模型订单存在。 但是,大量的问题都没有然而,特别是:

什么是算法复杂性之间的权衡和分类表现?

像素上下文在匹配中的作用是什么算法?

真正的2D方法有多重要?

在这里,我们提供一致的性能比较在现实世界的任务和比较计算复杂性。 我们用顺序2表示那些模型像素的位移取决于像素的位移它在二维的两个方向上的相邻像素图像网格。 类似地,我们说模型是如果此依赖关系减少到邻居,则为1如果不存在这种依赖,则一维和0阶。从真正的二维模型开始,我们继续讨论伪二维模型(一阶)和零阶变形模型。 过去,目前尚不清楚复杂模型在多大程度上受到许多限制匹配对于良好的识别结果是必要的。 它

是预期的,并将通过实验确认对于所调查的任务 - 复杂的模型不是必要; 一个简单的模型,包含一个合适的表示本地图像上下文就足够了。

本文的主要目标是:

为了表明概念上简单的非线性模型图像变化导致始终如一在几个真实世界的图像识别中的表现任务,因此可能被视为基准各种识别任务的方法。

为了表明外表的直截了当的范例 - 基于适当的图像分类可变性模型导致非常有竞争力的结果在手写字符识别领域。

直接比较不同的非线性模型和以实验证实使用较少图像中的限制性二维约束匹配可以通过使用本地图像来补偿像素级的上下文。

在本文中,我们将分配一个的过程称为K类标签用于图像识别或分类。 一个图像的变形是二维的应用图像平面的变换,例如小旋转或者移动一小部分图像。 匹配两个图像包括从一组中找到最佳变形在导致变形的意义上

原文和译文剩余内容已隐藏,您需要先支付 20元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。