稠密描述符和泽尼克矩的变体作为基于精确形状的图像检索的特征外文翻译资料

 2022-05-14 07:05

英语原文共 17 页,剩余内容已隐藏,支付完成后下载完整资料


稠密描述符和泽尼克矩的变体作为基于精确形状的图像检索的特征

Anjali Goyal · Ekta Walia

1.摘要:

形状作为物体的重要组成部分,在基于形状的图像检索(SBIR)领域有着特殊的地位。为了检索最合适的图像,在SbIR的泽尼克矩(ZMS)、复杂的泽尼克矩(CZM)等中应用了各种描述器,尽管ZMS/CZM在SBIR是好的,但是它们能够仅提取图像的全局细节,因此,除此之外,还需要一些IMP。研究了SBIR系统的性能。本文介绍了基于像素的稠密描述符的实验分析,如局部二值模式(LBP)、局部方向模式(LDP)及其变体。这些描述符被用作局部特征以及ZMS全局特征,从而在SBIR系统中获得更高和准确的检索率。我们已经分析了这些变体的LBP / LDP与图像上的各种相似性措施。在ZMS的情况下,使用Migiess分量作为全局特征。这些方法分别在合适的形状数据库上进行测试。文中所使用的各种数据库是基于MPEG-7 CE-2区域数据库、MPEG-7 CE-1轮廓数据库和商标数据库。从实验结果可以看出,LDP与ZMs的性能优于单独的ZMS和ZMS以及LBP和LDP的其他变体。

关键词:基于形状的图像检索(SBIR)·全局特征·泽尼克矩(ZMS)·局部二值模式(LBP)·局部方向图(LDP)

介绍:数字时代为信息检索提供了新的维度。如今,用户只想在一小部分时间内获取有关图像和视频的相关信息。该搜索可能与放射学领域有关,以寻找类似的诊断图像,或其他领域,如股票,商标,标志在Adver DISCE等领域中使用。编目是在地质、艺术和时尚领域进行的。传统的基于文本的图像检索系统是利用一些文本或关键字来映射图像的概念。但是这个系统的主要缺点是它没有存储关于图像的足够细节。为了克服这一局限性,基于内容的图像检索(CBIR)的概念进入了图像〔1—3〕。在CBIR系统中,图像是借助图像的视觉内容而不是用图像注释的关键字[4—6 ]来检索的。

CBIR在低层次的特征,如形状,纹理,颜色和空间位置。高级语义被添加到低级特征以改进其工作[7 ]。一般来说,带有关键词的图像的手动注释可能容易出错,因此,自动注释可以通过某些特征的支持来描述图像。这些特征可以是局部的、全局的或两种类型的特征的组合。某些技术,如基于图形的学习框架工作也增强图像的表示[8,9]。CBIR系统的成功依赖于特征提取、特征匹配过程和特征存储过程。CBIR系统面临如此多的挑战,为了达到更好的精度,应该加以解决[10 ]。形状特征的相关性可以很好地理解,因为人类感知是基于物体的形状;因此,物体在形状的基础上更好地分类,而不是纹理、颜色等[11,12]。从商业发展的系统,如QBIC,皮克塞克,形状特征的意义可以理解。

大体上,形状定义轮廓以及图像的整个区域。形状描述技术分为两组,即基于轮廓的和基于区域的(13—15)。基于CONTURE的描述仅集中在边界线上,因此,它们不适合于在自然场景中由多个不相交区域组成的复杂形状,如剪贴画、徽章、商标或各种形状。基于区域的方法考虑对象的整个区域,并且最适合于复杂形状[16 ]。通常,基于区域的方法使用矩描述来描述形状。正则矩存储冗余信息。低阶矩不能准确地描述形状,因此,高阶矩是可取的,但更容易产生噪声[17 ]。有不同的基于区域的描述符,如通用傅立叶描述符(GFD),勒让德矩(LMS),泽尼克矩(ZMS)等[18,19]。ZMS具有某些期望的特性,如旋转不变性、对噪声的鲁棒性、每个矩阶的快速计算〔16〕。

ZMS被称为全局描述符,因此,它们不关注图像的局部细节。为了捕获图像的局部细节,局部描述符是可取的。尽管在SBIR领域中实现了许多里程碑,但是由于图像的形状可以具有任何类型的复杂结构,尤其是对于商标或基于标志的图像(18—25)的情况,检索精度要求更大的改进。只有全局特征可能不能满足有效SBIR的要求,因此,从图像中提取局部和全局特征,以提高检索精度。

一般来说,局部特征是用这些方法提取的:一个是使用稀疏描述符,另一个是使用稠密描述符。使用第一种方法,即稀疏描述符,在兴趣点周围提取特征,而不是在密集描述符的情况下对每个像素进行特征提取。例如,Harris Cor NER检测器,Harris仿射区域检测器,最大STAR极值区域(MSER)检测器都是区域检测器。然后,围绕兴趣点/拐角/关键点,形成局部补丁或区域来收集局部细节。中心对称局部二值模式(CS-LBP)、尺度不变特征变换(SIFT)、梯度位置和方向直方图(GLUH)、主成分分析和SIFT(PCA-SIFT)描述符是著名的稀疏描述符[26,27 ]。

第二种方法利用稠密描述符,其中局部细节在整个图像上逐像素地捕获。Gabor小波和局部二值模式(LBP)是两个著名的稠密描述子。还有许多其他的方法被用来捕捉图像的局部细节[20—24 ]。奥贾拉等人提出的局部二元模式(LBP)。[28,29 ]主要用于纹理分类和面部图像的设计。

分析〔30—32〕。LBP的多种变体或LBP特征与其他描述相结合的实验已经进行了[31 ]。JabID等人提出的局部方向图(LDP)。〔33〕是另一种密集的描述器,其变体已被用于SBIR领域。这些描述符没有被用于以前的研究工作中。为了获得更好的和有意义的检索结果,我们将ZMS与LBP/LDP的变体相结合,以提取图像的局部和全局特征。不同的相似性度量,如欧几里德距离,曼哈顿距离,改变曼哈顿距离,Chi平方距离也适用于不同数据库的特征集,以检查这些措施的适用性。

在本文中,我们提出了在SBIR系统中的ZMS作为全局特征的效用分析。在SBIR系统的背景下,进一步分析了全局和局部特征相结合的有效性。还应用各种相似性度量来提取局部和全局描述符的最佳检索精度。在ZMs中已经描述了全局特征提取方法。2。针对局部特征提取,本文讨论了基于稠密描述子的各种技术。三。第4节说明了所提出的算法。第5节展示了利用局部特征和全局特征(即稠密描述符和ZMS)进行实验的结果。第6节介绍了基于实验的研究结果。结论展示在第7段。

2利用全局特征的 SBIR

全局特征是从图像的所有重要像素捕获信息的特征。基于矩的方法解决了提取图像全局细节的目的。ZMs,GFDs,LMS是正交矩,其中每个矩阶捕获没有任何冗余的唯一信息。这里使用ZMS作为捕获图像全局细节的描述符〔19〕。

泽尼克矩

ZMS在模式识别、字符识别、图像检索、图像重建、车辆识别等方面具有良好的描述性,[15,16,34 - 39 ]。ZMS也被选择为MPEG-7数据库(16)中最好的基于区域的描述符。每个泽尼克矩有两个分量,即幅度和相位分量。ZMS的大小是旋转不变的。在本文中,我们只使用一个分量,即ZMS的大小。

在笛卡尔坐标的情况下,计算ZMs的方法的缺点是边界边界周围的信息由于边界点而丢失,从而导致几何误差。为了克服这一问题,将整个图像映射到单位磁盘内,使所有图像像素成为ZMS计算的一部分。用这种方法计算精确的ZMS,消除了数值误差。

3.具有局部特征描述符的SBIR

本文对稠密描述子进行了实验,LBP是最常用的描述子之一,主要用于纹理分类,但已被应用于人脸图像分析、签名验证、唐氏综合征识别、目标检测等。另一类稠密描述符是LDP [33,44,445 ]。

3.1局部二元模式(LBP)

LBP是一种基于像素的灰度纹理度量方法,它返回稠密特征集。原始LBP使用每个像素的3times;3邻域和阈值与CCE-TRAL像素的值来标记图像的像素,其结果被称为LBP代码的二进制模式。3times;3邻域生成256个容器,每个容器存储对应于该容器的像素频率。在灰度图像上应用LBP之前,图像最好被分解成不同的窗口/区域。之后,对每个区域进行直方图。基于区域的Tog图可以在连接到组合直方图(30)之前归一化。LBP码可以从公式(6)中获得,其中NC表示中心像素的强度,NK对应于相邻罩像素的强度。对于N邻域,可以为任意(XC,YC)像素生成2n个二进制PAT或LBP码中的任一个。

3.1.1均匀LBP(ULBP)

将原始LBP算子推广到给出统一的PATTN(29)。LBP代码被描述为均匀模式,如果二进制模式最多由两个比特转换从0到1,反之亦然,假定位模式顺时针或逆时针。例如,10100001和11100101不是均匀图案,而1000001和00000000是均匀图案。这就降低了256个箱子到59个箱子的要求。在256个箱中,58个附着在所述条件下的图案称为均匀图案,其余198个非均匀图案被放置在第五十九个容器中。

3.1.2局部二值模式直方图傅立叶(LBP-HF)描述符

原始LBP代码不是旋转不变的。这意味着,如果图像旋转,那么LBP模式将被改变。在该描述符中,使用58个均匀LBP(ULBP)箱生成直方图,其中两个容器为00000000和11111111,其余56个容器用作7times;8(取向)箱。均匀图案以7行排列,这可以从图2中理解。在8位模式中,精确的单1的均匀二值模式具有8个方向;Simi LyLy,两个连续1个的模式也将导致8个方向,从而达到7个连续1的模式。快速傅立叶变换(FFT)应用于7行中的每一个的8个方向(即,一个连续1个,两个连续1个

ULBP模式分别连续七次1次。FFT本质上是对称的,因此只有[0到N/2 ]=5个BIs是产生n=8的旋转不变特征集的必要条件。基于FFT的技术将使用5个桶的7行减少56个均匀图案到35个均匀图案。每一个包含非均匀图案和两个均匀图案(即00000000和11111111)的容器,该描述符的特征集将变为38。这个描述符被称为局部二进制模式直方图傅立叶描述符(LBP-HF)〔49〕。

研究正在进行,以提供另一种变体ULBP,即郭等人提出的均匀LBP方差。〔48〕。在[48 ]中所示的结果减少了特征集并改进了图像的分类,其中仅使用一个bin来对应对应于均匀LBP PATN的行的八个bin。这是郭台铭等人观察到的。随着行数的减少,分类率下降,随着行数的增加,分类率逐渐增加,因此建议最佳归约。

3.1.3中心对称LBP(CS-LBP)

在CS-LBP [27,50]的情况下,仅对那些相邻像素进行比较,它们属于同一直径的圆。在LBP中,将所有相邻像素与中心像素进行比较,从而对3times;3邻域产生256个Bin,而在CS-LBP中,只有4个比较发生,导致16个BIN。这种努力将容器的数量从256减少到16。

3.1.4 Haar小波和LBP(HLBP)

LBP是一种良好的基于像素的目标检测和识别方法。我们已经探索了它的形状图像检索的背景下,结合它与Haar小波。Haar小波沿水平方向、垂直方向和对角方向捕获特征。仅使用角度或方向,而不考虑幅度[47,51]。与LBP,模式的数量是256,但Haar和LBP(HLBP)的组合仅产生16种模式。除了这个优点之外,HLBP还提供了更有意义的结果。在HLBP的情况下,选择3times;3邻域,其中NC是中心像素。该模式取决于阈值T的选择,该阈值T已经设置为本实验组的15。

3.2局部方向图(LDP)

就像LBP一样,LDP致力于基于像素的方法。在随机噪声和非单调变化的存在性方面LBP是不太有效的。由于LDP是基于边缘的,因此,与LBP不同,它对噪声和噪声的影响较小。

非单调变化。LDP计算边缘对每个像素在八个方向上的响应,根据相对强度大小计算代码。用这些大小,突出的角落,边界和边缘突出显示。

4.提出算法

在本文中,我们已经实现了各种技术的方法3,以提高检索精度。ZMS是基于区域的描述符;因此,它们具有IDEN的能力。用查询图像处理全局图像的全局相似度。利用所提出的技术,首先,整个图像数据库作为输入并提取ZMs并将其离线存储。特征数据库D1。为此选择的ZMS顺序纸是10(36个特征)。同样地,局部稠密之一。SCECT中描述的描述符。3应用于图像,以及这些特征存储在数据库DB2中,之后,COM-引用局部描述符和全局描述符的特征。用于相似性度量测试。当给出查询图像时,它的特点是使用10阶的ZMS和用于离线数据库的同一局部稠密描述符。一次数据中的查询图像和所有其他图像的特征计算基础,查询图像和图像的相似度从数据库使用任何相似性度量计算。这个最后检索的图像显示的检索性能提出的算法。

实现局部和全局结合的步骤

特征描述符如下:应用步骤(1)来获得;全局特征和步骤(2)用于提取局部特征。

5实验分析

为了检验SBIR系统的检索精度,通过选择合适的数据集、SIM性度量和性能测量标准进行实验。

5.1实验装置

在实验中使用了各种数据集。所有这些实验都是在Visual C 6的微软Windows环境下对机器的2 GHz CPU和1 GB的RAM。

5.1.1数据集

为了将ZMS作为全局描述符和LBP/LDP作为局部基于像素的描述符单独或组合地进行影响,在MPEG-7等各种数据集上进行实验。MPEG-7提供了两种不同形状的DAT abayes,即基于轮廓的形状的CE-1数据库,基于区域的形状的CE-2数据库。我们正在使用这两种类型的数据库进行实验。本文采用MPEG-7 CE-2数据库的图像集,由3621个商标形状组成。在实验中也使用了基于区域的形状的另一个商标图像数据集。

5.1.2相似性度量

图像数据库中查询图像与图像匹配的方法有很多种。为了找到图像之间的相似性,使用一种方法代替平均形状分类方法[23 ]。

Euclidean距离

欧几里得距离(L2范数)是任意两点之间的直线距离,用作相似度度量。欧氏距离是用等式(13)计算的,以匹配查询和数据库图像的两个直方图,其中AI和AQ分别是数据库和查询图像的直方图,I和Q,N是直方图中的桶的数目。

<p

全文共5904字,剩余内容已隐藏,支付完成后下载完整资料</p


资料编号:[12431],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。