利用局部特征的基于内容的图像检索 描述符和视觉词汇袋外文翻译资料

 2022-08-10 05:08

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


利用局部特征的基于内容的图像检索 描述符和视觉词汇袋

摘要——图像检索仍然是计算机视觉领域。现有几种技术可以从大型数据库中检索可视化数据。视觉词汇袋是一个可以使用的视觉特征描述符成功(CBIR)申请。在本文中,我们提出了一个图像检索系统,该系统使用局部特征描述符和BoVW模型从标准数据库中高效准确地检索相似的图像。所提出的系统使用SIFT和SURF技术作为局部描述符来产生对旋转和缩放不变的图像签名。此外,它使用K-Means作为聚类算法,为从局部描述符技术中获得的特征描述符建立视觉词汇。为了有效地检索更多与查询相关的图像,使用了SVM算法。通过计算查准率和查全率来评估该系统的性能。实验结果表明,该系统在两个不同的标准数据集上表现良好。

关键词——基于内容的图像检索(CBIR);规模不变特征变换;加速鲁棒特征 (SURF);均值算法;支持向量机(SVM);视觉词汇袋。

一.摘要

图像检索是研究的领域从中查找、浏览和恢复数字图像庞大的数据库。CBIR被认为是一个充满活力和敏捷的人推进图像检索领域的研究。这是一个通过相似性从集合中检索图像的技术。基于自动提取特征的检索 从图像本身。许多CBIR系统基于特征描述符,被构建和开发。

特征被定义为捕获某个视觉属性一幅图像。描述符以如下方式编码图像允许将其与其他图像进行比较和匹配。一般来说,图像特征描述符可以是全局的,也可以是本地的。全局特征描述符描述视觉内容而局部特征描述了的图像(即一小组像素)内的补片图像内容。全局描述符的优越性提取是特征提取和计算相似度。然而,全球特征仍然过于僵硬代表一个图像。尤其是,他们可能会对位置,因此无法识别重要的视觉特征。

与全局特征相比,局部特征方法在解决视觉问题方面提供了更好的检索效果和更强的辨别能力。然而,为每个图像提取的局部特征的数量可能是巨大的,尤其是在大的图像数据集中。因此,波维提出了通过将描述符量化为“视觉单词”来解决这个问题的方法

基于上述事实,本研究提出了一个基于局部特征的图像检索系统。该系统试图通过选择使用两个主要的本地描述符(SIFT,SURF)来带来更高的准确性。

本文的其余部分组织如下。第二部分概述了包法维模型、K-Means和SVM。第3节讨论了两个最常用的局部特征描述符。第4节回顾了在图像检索中使用BoVW模型的一些相关工作。在第五节中,提出了我们的图像检索系统的架构,这是基于介绍。我们的实验结果在第6节中进行了处理。最后,第7节包含结论和我们未来的工作

二.视觉词汇袋模型

BoVW模型是将图像表示为局部特征集合的最广泛使用的方法之一。出于这个原因,一些研究人员倾向于将其命名为特征包。这些局部特征通常由局部描述符组成。为每个图像提取的局部描述符的总数可能是巨大的。此外,在图像查询中搜索每个本地描述符的最近邻居需要很长时间。因此,提出了通过将描述符量化为“视觉单词”来解决这个问题的方法,该方法减少了描述符的总和很大。因此,BoVW使描述符对变化更加健壮。该模型非常接近于信息检索中文本的传统描述,但它被认为是用于图像检索的。BoVW是用于检索和识别的图像特征的事实上的标准。它由三个主要阶段组成,如下所示

A.关键点检测

BoVW模型的第一步是检测局部兴趣点。对于兴趣点的特征提取,它们在预定义的位置计算,并缩放。在www.ijacsa.thesai.org 212中,特征提取是一个独立于特征表示的过程。在研究中使用了许多关键点检测器,如哈里斯-拉普拉斯、高斯差分(DoG)、黑森拉普拉斯和最大稳定极值区域(MSER)。

B.特征描述符

根据其内容,关键点被描述为多维数值向量[6]。换句话说,特征描述符用于确定如何表示局部关键点[附近的像素邻域。在BoVW模型中最有效的特征描述符是SIFT和SURF。

C.建立词汇

在前一阶段,提取的特征描述符总数很大。为了解决这个问题,通过应用聚类算法,例如K-均值技术对特征描述符进行聚类,以生成视觉词汇。每个聚类都被视为词汇表中一个不同的视觉单词,由它们各自的聚类中心表示。使用聚类算法来确定词汇表的大小。此外,它还取决于数据集的大小和类型。

BOW模型可以表述如下。首先,BoVW通常将训练数据集定义为包括由S=s1,s2,hellip;,sn表示的图像的S,其中S是提取的视觉特征。之后,使用像K-Means这样的聚类算法,该算法基于对由W=w1,w2,...,wv,其中v是簇号。然后,数据被汇总在计数为Nij=n(wi,sj)的Vtimes;N出现表中,其中n(wi,sj)表示单词wi在图像sj中出现的频率。

另一方面,K-Means是最无监督的学习算法,它解决了众所周知的聚类问题。它基于从图像本身提取的特征来定义K个聚类的大小。它用于计算点和聚类中心的最近邻居。它通常利用近似最近邻法的计算方法。通过使用近似最近邻法,该方法可以被缩放到类似的大词汇量。

SVM监督机器学习技术。它将图像数据库显示为高维或无限维空间中的两组向量。它依赖于一个基本原则,即所谓的最大边际分类器。最大边缘分类器是一个超平面,它以相等的距离分隔两个点的“云”。超平面和云之间的边界最大。SVM建立了一个或一组超平面,增加了与查询相关和不相关的图像之间的余量。SVM分类技术的目标是找到一个理想的超平面,通过最大化两个类之间的边界大小来分离不相关和相关的向量。

图像分类是一种机器学习技术。这是用于在大规模数据库中加速图像检索的步骤,并且用于提高检索精度。同样,在没有标记数据的情况下,无监督聚类有助于提高检索速度和检索精度。基于相似性度量的图像聚类,而图像分类已经使用不需要使用相似性度量的不同技术来执行。

三.局部特征描述符

在计算机视觉中,局部特征技术包含两部分:特征检测器和特征描述符。特征检测器确定图像中具有独特内容的区域,如角落。特征检测用于在图像中找到保持局部不变的兴趣点(关键点)。因此,它甚至可以在出现刻度变化或旋转时检测到它们。然而,特征描述符涉及计算局部描述符,这通常在以检测到的兴趣点为中心的区域上完成。局部描述符依赖于图像处理来将局部像素邻域转换成紧凑的矢量表示。

另一方面,局部描述符在许多计算机视觉研究中被广泛使用,例如鲁棒匹配、图像检索、目标检测和分类。此外,使用局部描述符使得计算机视觉算法能够强有力地处理旋转、遮挡和尺度变化。

局部特征算法依赖于确定图像中的一些兴趣点并对其进行局部分析的想法,而不是将图像视为一个整体。有许多描述局部图像区域的算法,例如SIFT和SURF。SIFT和SURF描述符依赖于局部梯度计算。下面的小节将简要讨论SIFT和SURF算法。

A.尺度不变特征变换

Lowe开发了SIFT,作为他以前在不变特征检测方面工作的继续。它有四个计算阶段:(a)极值检测,(b)关键点定位,(c)方向分配,和(d)关键点描述。

第一阶段在不同的八度音阶和音阶下检查图像,以分离图像中不同于周围环境的点。这些被称为极值的点是图像特征的潜在候选者。在关键点定位阶段,选择一些极值点作为关键点。通过拒绝由边缘和低对比度点引起的极值点来细化候选关键点。在方向分配阶段,它使用幅度和方向将每个关键点和相邻点表示为一组矢量。在最后一个阶段,它收集每个关键点附近的向量,并将这些信息与一组称为描述符的八个向量组合在一起。邻域被分成4times;4个区域,在每个区域中,矢量被组织成8个箱。SIFT提供了关键点描述符的128个元素。

B.加速鲁棒特征(SURF)

Bay等人([4)引入SURF算法作为尺度和旋转不变的兴趣点检测器和描述符。SURF算法是粗略定位信息和相关梯度分布的混合。SURF算法类似于SIFT算法,但它在计算和匹配方面要简单得多,速度也快得多。

(IJACSA)国际高级计算机科学与应用杂志,第6卷,第9期,2015 SURF算法依赖于黑森矩阵来检测关键点。它使用关键点邻域的哈尔小波响应分布。通过连接所有子区域的特征向量获得最终描述符,并用64个元素表示。

SIFT和SURF算法是当今计算机视觉领域中应用最广泛的基于特征的技术。这些算法已经在不变特征定位(对图像旋转、缩放和光照变化不变中证明了它们的效率和鲁棒性。

四.相关著作

文献中对图像检索的主题进行了深入的讨论。使用BoVW模型的成功也有助于增加研究人员和研究的数量。例如,恰基尔等人[21]用包法维模型研究了CBIR。他们讨论了BoVW如何将图像视为文档,通过使用矢量量化使用的K均值。

Zhang等为提出了一袋图像方案。他们认为图像集是由图像包组成的,而不是独立的单个图像。它们包含一些具有相同感知意义的相关图像。图像包是在图像检索之前构建的。此外,用户的查询是一个图像包,命名为查询图像包。在这种情况下,图像集合中的所有图像包将根据它们与查询图像包的相似性进行排序。假设这种新思想可以增强图像检索过程。然而,这项工作需要开发更有效的方法来测量两个图像包之间的差异。

Ponitz等人试图解决在大规模图像数据库中检测图像限制的问题。他们决定通过改进图像签名之间的距离度量来增强BoVW的方法,以避免模糊特征的出现。他们利用SIFT算法获取局部视觉特征。所有图像中只有60%是随机选择的,它们的特征用于聚类。这些特征然后被量化。选择100个随机图像作为输入图像。图像随着安装变形而改变,以测试应用程序的健壮性。它需要更多的实际图像描述的区分力。

Liu评述了图像检索系统中的BoVW模型。他提供了关于BoVW模型的细节,并解释了基于该模型的不同构建策略。首先,他提出了几种可以在BoVW模型中采用的程序。然后,他解释了一些流行的关键点检测器和描述符。最后,他研究了生成词汇和进行搜索的策略和库。

Alfanindya等人,提出了一种方法,CBIR通过使用与波伏瓦冲浪。首先,他们使用SURF来计算兴趣点和描述符。然后,他们为COREL数据库中的每个组创建了一个可视化词典。他们总结了他们的方法 他们的实验在准确性方面超过了其他一些方法。他们工作中的主要挑战是所提出的方法受到高度监督。这意味着他们在进行分类之前不需要确定组的数量。

本文的主要目的是设计一个基于局部特征描述符的图像检索系统。以前大多数使用BoVW系统的图像检索只使用一个局部描述符。然而,我们提出的系统同时使用了SIFT和SURF描述符。它提供了在图像检索领域中这些局部描述符与BoVW的实际性能的比较。

五.系统结构

我们提出了一个基于BoVW模型提取局部特征的图像检索系统。该系统使用SIFT或SURF技术来提取关键点并计算这些关键点的描述符。K-Means算法用于获取视觉词汇。如图1所示,建议的系统由两个阶段组成:训练阶段和测试阶段。在培训阶段,建议的系统如下所示:

(1)对于数据集中的每个图像:

·将图像转换为灰度。

·将图像大小调整为(300,300像素)以获得一致的结果。

·提取图像特征并将这些特征与局部描述符相关联。

·使用K-均值算法对这些袋的数量的局部描述符集合进行聚类,以构建K个聚类的词汇表。

(2)对于图像中的每个特征描述符:

·使用基于L2距离的匹配,从词汇表中为每个特征向量找到最近的视觉单词。

·计算单词袋图像描述符,作为图像中遇到的词汇的归一化直方图。

·保存所有图像的单词袋描述符。 在测试阶段,建议的系统如下所示每个输入图像

·针对关键点对图像进行预处理

·本地描述符是从预处理的输入图像。

·用上面定义的算法计算单词包向量。

·在匹配步骤中,通过SVM分类获得最佳结果

A.再生

预处理步骤包括将图像转换为灰度和调整大小的过程。由于局部描述符算法只处理密度信息,图像被转换为灰度。之后,图像被调整到300times;300像素以使结果正常化。

B.关键点检测和描述

该系统最重要的一步是从处理后的图像中提取局部描述符。有许多关键点描述技术,如哈里斯,SIFT和冲浪。本文选择SIFT和SURF描述来测试该系统的性能。从图像中提取关键点后,系统会计算每个关键点的局部描述,如图2所示。

C.BoVW描述符

在这一步中,使用BoVW模型来创建词汇表。首先,我们使用暴力匹配方法计算最接近特征向量的词汇质心。然后,我们计算质心和特征向量之间的差值。最后,我们计算单词袋图像描述符作为词汇单词的归一化直方图。

D.匹配和分类

在这个阶段,描述符查询用于匹配数据库中的BoVW描述符。最近邻方法用于检索相似的图像。最后,利用SVM分类器获取与图像查询最相似的最佳结果。

六.绩效评估及结果

A.资料组

(IJACSA)国际高级计算机科学与应用杂志,数据集Flickr标志该系统通过使用两种不同的标准和数据集进行评估:阿姆斯特丹对象图像图书馆(ALOI)数据集。Flickr Logos 27数据集是从Flickr下载的带注释的徽标数据集,它由三个图像集合/集合组

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[238053],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。