图像特征提取——概述外文翻译资料

 2022-10-22 04:10

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


图像特征提取——概述

摘要——这篇文章列出了许多不同的特征提取技术的简短的概述。特征提取在图像处理和对象识别中是一个非常重要的领域。展现两个不同层次的特征提取也解释了他们之间的联系。

关键词——特征提取,概述,图像处理

I.介绍

图像处理领域在日常生活中已经变得非常重要。有越来越多的关于开发计算机视觉系统的言论说他们能够识别道路危险,熟悉的面孔或照片中的场景。因为在这个领域中许多不同的方法和技术已经被开发,本文的目的是简要介绍一些在这一领域中关于对象识别和图像检索的最常用的技术。

特征提取的过程可以分为几个步骤。在第一步必须描述对象及其边缘(通常借助于分割技术)。然后通过使用在第五章中描述的技术利用这些收集的信息可以执行进一步的特征提取。

II. 特征分类

特征分类取决于实现系统的类别。图像处理中最常使用的分类可分为颜色,形状和纹理特征。

  1. 颜色特征

当使用颜色特征时,图像被处理成像素矩阵。这些代表了可以在图像上找到相应的位置在图像亮度和颜色级别。在这一领域中,任何像素之间的联系都是无关紧要的,因为我们对形状和轮廓不感兴趣。使用这种特征处理的优点是他们是独立的图像大小和编码变形。

最基本的颜色特性类型是色彩空间,那些我们感兴趣的整个图像的颜色分布。一个用于提取该信息的基本技术是色彩直方图,它代表了颜色通道的强度的联合概率。这种技术的一个改良版本是累积颜色直方图,它被开发用来减少噪声敏感。因为颜色直方图对量化噪声非常敏感,所以开发了额外的技术来纠正这个问题。这些技术的例子有颜色矩和颜色集[3]。第五章中描述一个更先进的技术,是利用傅里叶描述子。

除了这些基本的技术,也发展了其他的用来将图像分割成更小的部分的技术,届时特征提取技术会在每部分上分别进行。

  1. 形状特征

在图像处理中面临的最基本问题之一是识别形状。虽然对人类很容易找到图像里的形状,但是当前系统需要大量的工作来实现同样的效果。因此,许多基于不同的形状的特性被开发来协助这一过程。结果表明,将这些特性分为两组是非常重要的。在第一组中是一些平移,旋转,缩放不变的特征,而在另一组中是没有这些品质的特性。来自第一组的特性通常是简单的提取,需要简单的程序。

提取这些特征的程序也可以分为两组,第一组代表基于边界的只专注于提取形状的外边界的程序。另一组代表基于区域的适用于将整个形状作为对象的程序。第一组的典型的程序是利用傅里叶描述子,而在基于区域的程序中,最常使用的是不变矩。

  1. 纹理特征

纹理特征涉及那些不是仅仅由一个颜色或强度造成的同质性的性质的视觉模式,这些特性包含关于表面的结构安排和及其与周围环境的关系的重要信息。

  1. 分割

尽管分割并不代表一个特征类型,但是它应该在这一章解释以便理解后来的技术描述。

分割是一个非常重要的技术,使相同技术能在许多不同的类型和大小的图像上使用。其背后的基本思想将每一幅图像被分为预设大小区域。然后分别在每一个区域上使用该技术。因为每个基于分割的技术在处理那些总是相同大小的区域是最优化的,所以能将每一幅图像被分为所需的大小区域是很重要的。不同大小的图像之间唯一的区别是它划分的区域数量,这些区域是将整幅图像通过要的步骤处理得到的。分割还提供了更好的计算结果,因为程序使用更少的时间,他们使用较小的数据量。

III. 定位对象边缘

特征提取的第一步是定义在图像中可以发现的边缘,然后尝试把这些和假定为在图像的对象和形状相结合。

边的基本定义是,他们代表了邻近像素的亮度水平的变化。最简单的方法来检测这种变化是使用第一和二阶导数。衍生品只提供了这个信息:使用梯度变化水平被证明是更有效的,因为他们也提供了发生改变的方向。使用这种方法有可能检测所有像素并找出可以认为代表对象边缘的像素点。在第一阶段所有像素梯度值大于0会被记下当作边缘像素。第一个过程的结果是大量可以表示边缘的像素。处理所有这些像素会非常费时,所以额外的方法是减少可能的像素数量。

第一种方法是使用一个简单的阈值,减少了组群,只留下那些梯度值超过设定的阈值的像素。这是一个非常简单的实现方法,但生产结果的也是最粗糙的。

第二种方法是比较相邻的每个像素的值,然后使用一个特殊的运算符,相应地调整其梯度值。最后这个过程的所有剩余的梯度值比零大的像素点被当作边缘像素。

最后的方法是第二种方法的变体,而于第二种方法中处理图像的方法不同,这个方法是通过一个迭代的过程实现。第一步是创建一个子图像,子图像中所有潜在的边缘像素的梯度值设置为1,其他的设置为0。使用多种运算,这张图片是处理过的。这个过程又比较像素和相邻像素的值来确定它的值是保持为1或如果它必须被设置为0。只要探测到改变,这个过程就要重复进行。主图像和子图像对比而没有进一步的变化时,所有的子图像像素值设置为1保持不变而其余梯度值设置为0。

IV.边缘连接成形状

一旦确定边缘像素,他们可以结合成形状来检测图像中的对象。用于这个目的技术可以分为两个不同的组[4]。第一组中包含的技术只处理本地的像素,也就是那些当前像素的邻居像素。另一组处理整幅图像,并在当试图确定的形状的位置时使用所有像素。

A. Nevati and Babu 的技术

这种技术属于第一组。对这种技术的实现需要知道每个像素的梯度值和方向。第一步,将每个像素与之相邻的像素进行对比。在这组中那个最相似的梯度方向的像素被选作当前边缘的下一个像素点。为了防止有很多的像素点有同样的梯度方向,那个被选取像素点有最大的梯度值。

在第二步中,像素点被组合成的形状。如果当前像素的梯度值大于设定阈值,而且这个像素尚未分配一个形状值,它被标记为一个新的边缘的开始。从这个角度看,下一个像素的方向的过程仍在继续,就像在第一步中被标记的那样。然后重复这个过程,直到下一个像素已经属于边缘之一。第二步结束时每个像素分配给一个边缘,边缘的数量也对应图像里形状的数量。

B. 迟滞性阈值

这种方法比较所有像素,因此属于第二组。它是基于使用两种不同的阈值来确定一个像素是否属于任何一个已知的边缘。第一阈值ts确定哪些像素梯度值足够高,甚至被认为是任意边缘的一部分。第二阈值tz进一步细化这个选择。

应用阈值后,这个方法实现了一个比较邻近像素的迭代过程,并使用两个子图片。使用这个过程,可能的像素的集合减少到只包括那些外部边缘的一部分,因此代表了在图像中找到了真正的形状。

C. 形状模型

这种方法非常的专业,因为它只检测到这些形状与系统之间的关系。为了实现这一目标,它基于形状模型定义什么样的梯度值和方向是相关的。形状模型可以用线,椭圆、圆和类似的形状表示。检测像素是否是期望的形状的最好方法是霍夫变换。

检测的基本方法包括解决方程,方程y = ax b为每个可能的像素对,其中x和y代表每个像素点的空间坐标,而a和b是未知参数。方程表示的形状是安放在当前像素。这个拟合的成功需要正确计算参数a和b的值。这是一个非常耗时的过程,因为它需要解决非常大量的方程。

霍夫变换是基于转换方程b = -xa y。利用这组方程,这个系统从笛卡尔坐标系转变成参数坐标系。整个系统分为很多胞腔,每个子胞腔部分代表了参数a和b的可能值区间。每个部分的值被设置为0。这种转换的优点是,每个像素对应于新系统中的一条线。为了这其中的每条线,需要解决方程b = -xa y来确定参数a和b(知道那些,他们必须在amin到amax和bmin到 bmax之间)。一旦方程解决了,对应的胞腔的值(即包含生成的参数a和b在其范围)就增加了一个。

这个过程结束时,胞腔的值显示了多少可能的边缘像素实际上是这条线的部分(例如,如果胞腔对应a= l和b = 3的值为5,这意味着在给定方程y = x 3表示的线上可以找到5个像素点)。胞腔的数量越多,相应的线实际上代表了图像的形状的可能性就越大。这种方法的主要优势是,它只需要解决每个边缘像素的方程而不是寻找每一对这样的像素的解决方案。因此计算时间大大减少。

D. canny的程序

这种技术实际上代表了一种形状和边缘检测的组合,可以由一个独立的系统实现[4]。

在第一阶段,整个图像用高斯滤波器过滤。取决于所选的参数,可以或多或少地平滑图像。

在接下来的阶段为每个像素计算梯度值和方向。这个阶段后,使用第三章中描述的方法之一选出可能的边缘像素。然后使用迟滞阈值检测其形状。

因此这种技术代表了一个优化的用于描述形状的解决方案,使用方法在之前的章节描述过。

E. Deriche 的程序

Deriche进一步改进了Canny的方法,使它对噪音的敏感程度降低,并提高了计算性能。Deriche用自己的过滤器代替高斯滤波器来实现,其优点是用一个简单的递归过程实现,因此计算机算法实现起来非常简单。

V.其他特征提取技术

当形状和边缘被识别时,它们以一个非常笨拙的格式存储。由此,很难执行对象分析,由于需将大量的数据进行分类。另一个层面的特征提取因此被引入来更紧凑的描述图像和数据库中的对象。

因此,先进的特征提取技术为对象识别启用更简单的接口。这些技术可以分为两个不同组,启发式的和最优的。启发式的技术很专业,并在使用指定的领域时提供最好的结果。然而如果它们用于不同的领域,通常他们提供的结果更糟。最优的技术另一方面提供恒定的不错的结果,但不是最好的。本文专注于来自第一组的图像处理的专业技术。

A.颜色直方图

颜色直方图是最基本的图像特征提取技术。这个技术是基于有多少确定的颜色存在于当前的直方图中。为了使用这种技术,需要进行必要的图像分割处理。该技术的主要优势是它经过翻转、旋转、缩放后是不变的,因此更可靠。因为这个也可以使用这种技术来识别三维物体。

技术包含计算图像中选取的对象的直方图,然后将直方图与已知的对象数据库进行比较。用这个数据库最近的匹配直方图来识别图像中的对象。这个技术也开始忽略背景像素,虽然在当背景与当前对象是类似的颜色时可能发生错误。

B.傅里叶系数

傅里叶系数并不代表一个新的特征提取技术,而是,而现在从图像中提取特征与数据库来识别图像中的对象的比较简单的方法。

使用这种技术同样需要分割图像。使用这种技术的第一步是将边缘像素转换成复杂的空间,然后对这些值进行傅里叶变换。这种方法的缺点是对噪声,对象位置和旋转非常敏感。为了补救,发展了另一种傅里叶系数的定义。

过程分析图像分为三个步骤,第一步是图像分割和边缘检测,使用第3章中所述的技术。第二步,利用离散傅里叶变换进行边缘像素检测。在最后一步中,转换得到的结果与在图像数据库中找到的来识别图像中的对象进行对比。这个比较使用距离度量函数实现。

因为使用了离散变换,这种技术在用于对象识别时效果很好,但由于离散化噪声的存在,精确重建的图像是不可能的。

C.形态学特征

可以在图像中找到的对象,也可以使用他们的形态学特征来描述,而不是计算他们的特征。当使用这种类型的特征,每个对象可以只使用两个特性来描述,即紧密性和延伸率。

紧密性代表对象的圆度,1是一个真正的圆,0是一条直线。延伸率定义最小的可以装下对象的矩形的面积。计算延伸率时,矩形可以与空间轴对齐,也可以是与对象的主矢对齐。第一个版本更容易实现,但是在对象被强烈旋转时不可靠。第二个版本纠正这种缺点,但是计算更困难。

D.主成分分析

这种技术被开发来实现两个目标,以减少图像重建和对象识别所需的数据量。

这种方法背后的基本思想是将每个对象表示为n维空间中的一个点,每一个n轴代表一个系统感兴趣的特征。为实现对象识别,首先需要使用能够代表能被系统识别的对象的典型值的训练集的对象训练系统。后来证明,如果在空间中由于训练系统而产生点被作为主矢,那么可以进一步减少必要的信息。每当有两个点之间有关联时,它们在太空可以替换为一个向量。在这种转换之后,整个系统可以用一个简单的包含所有这些向量的矩阵代替。重建图像时处理整个矩阵时,可以实现几乎无损的重建。这个矩阵的另一个好处是,它是不变的,一旦训练阶段结束,它可用于识别图像中发现的任何对象。结果的质量完全取决于训练阶段,如果训练集包括足够的不同样本,识别会更好。

这种技术还非常快速和可靠的,但是有个刚性问题,因为每次添加一个新的对象时,识别矩阵都必须重新计算。

E.最大弯曲点

对象可以以一种非常简洁的方式来描述,但仍为成功的识别和重建提供足够的信息,通过使用最大弯曲,这些点作为插值点来图像重建。这些点被编写为(a,x,y),其中x和y是空间坐标,点可以在空间中被找到,曲线的类型也在那个点中。

F.对象签名

对象签名表示为一个对象边缘的一维函数。函数可以被描述为alpha-axis与对象轮廓的每个点间的角度。这种技术的弱点是它依赖于轮廓的大小和计算的起点。这可以通过标准化轮廓和起点来解决。用于创建对象签名的函数在任意情况下都可以自由选择和匹配,只要重建时知道参数。

G.小波函数

类似于使用傅里叶变换进行特征提取,小波函数也可以。这项技术需要几个步骤。第一步,分析图像和标记系统感兴趣的特征(如颜色和边缘)。然后分割图像,如果系统需要的话。下一步,前两个步骤的数据使用小波变换转换。这一步的结果已经是一个特征向量,通常是非常高的维度。为了简化这个,在最

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[152057],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。