一种用于人脸识别的计算方法外文翻译资料

 2022-12-04 02:12

英语原文共 15 页,剩余内容已隐藏,支付完成后下载完整资料


毕业论文(设计)

英文翻译

原文标题 A CONNECTIONIST COMPUTATIONAL METHOD FOR FACE RECOGNITION

译文标题 一种用于人脸识别的计算方法

一种用于人脸识别的计算方法

FRANCISCO A. PUJOL a, HIGINIO MORA a,lowast;, JOSEacute; A. GIRONA-SELVA a

计算机技术系

阿利坎特大学,03690,San Vicente del Raspeig,Alicante,西班牙电子邮件:{fpujol,hmora}@dtic.ua.es,jags 20@alu.ua.es

本文介绍了一种改进的弹性束图匹配(EBGM)人脸识别算法。首先,利用基于rgb的模糊皮肤检测器对人脸进行检测。 或者空间。然后,根据边缘检测结果调整点网格,自动提取人脸图像的基准点。在那之后,节点的位置,它们的关系 计算了与邻域和Gabor喷流有关的特征向量,得到了定义每个面的特征向量。随后显示了一个自组织映射(SOM)框架.。因此,计算 对于获胜神经元和识别过程,使用了一个考虑到人脸图形的几何和纹理信息的相似函数。一套经验 通过对SOM-EBGM方法的实际应用,表明了与其它先进方法相比,我们的建议是准确的。

关键字:模式识别,面部识别,神经网络;自组织地图。

  1. 介绍

近年来,对开发涉及生物特征的复杂安全系统进行了深入的研究。自动生物识别系统正被广泛应用于监视、数字图书馆、法医工作、执法、人机智能交互和银行业务等领域。 对于需要高度安全的应用程序,生物识别技术可以与其他身份验证手段(如智能卡和密码)相结合。与此相关的是,人脸识别是一个新兴的研究领域,在未来几年中,它将被广泛应用于人类自动识别系统中的许多应用中。 目前最流行的人脸识别方法之一是Wiskott等人提出的弹性图束匹配(EBGM)方法。(1997年)。这种方法是所谓的动态链接体系结构(DLA)的一个演变(Kotrooulos和Pitas,1997年)。弹性图匹配的主要思想是从一组参考点或基准点开始表示人脸,称为地标。这些基准点具有空间相干性,因为它们是用图结构连接的。因此,EBGM将人脸表示为面部图形,在这些面部标志上有节点(如眼睛、鼻尖等)。考虑到这些节点,可以提取几何信息,并相应地定义距离和角度度量。

该算法考虑到人脸图像具有许多非线性特征(光照、姿态和表情的变化),而线性分析方法通常不考虑这些特征,,如线性判别分析(LDA)或主成分分析(PCA)(Shin and Park,2011年)。此外,当出现平面外旋转时,它特别健壮.。然而,该方法的主要缺点是需要对基准点进行准确的定位。

人工神经网络是解决人工智能问题最常用的范式之一(Balsquo;nka等人,2014年;Kayarvizhy等人,2014年;Tran等人,2014年;Kumar和K) umar, 2015). 摘要自组织映射(SOM)在ANN的各种方法中,具有关联和模式分类的特点(Kohonen,2001),是目前最流行的神经网络之一。 这种技术适用于需要解决的问题不准确或缺乏形式化的情况。在这些情况下,输入模式之间的关系没有精确的数学公式(Azorlsquo;n-L-Opez等人,2014年)。

SOM利用了一种无监督的学习方法在没有任何类信息的情况下学习一组模式分布的过程(Loderer等人,2014年)。这个网络能够模拟人脑利用神经元邻域将输入数据投射到地图上的位置的能力(EN-Naimani等人,2014年)。也就是说,如果训练样本的维数小于训练样本数,则训练样本的地形顺序可以找到聚类。神经元的邻域可以将相似的特征映射到特征图中的附近位置。当应用于一组面部标志时,这一事实尤其有用,例如EBGM方法。

因此,在本文中,我们将使用一个连接论模型来提高EBGM算法的效率。为此,在自适应学习过程中,将SOM应用于人脸图形库的构建。首先,自动提取基准点,然后将人脸分组(或聚类)成M类,每个类对应于不同的人。我们的主要贡献可概括如下:

  1. 介绍了一种改进的EBGM方法。在本工作中,使用边缘检测器自动获得基准点。相似函数由加权地质体组成。 测量和纹理距离。
  2. 提出了一种用于识别过程的自组织映射框架.。SOM将处理从特征提取过程中获得的面部图,并将相似的人脸图从特征提取过程中聚类出来。 m训练集,然后从测试数据库中识别新的输入图像。以前没有将EBGM与SOM框架相结合的工作。
  3. 将RGB模糊皮肤检测器应用于人脸检测过程。每个颜色平面采用模糊集建模。该检测器具有很好的检测率,是一种适用于不同环境条件下皮肤分割的技术。

本文的结构如下。第二节介绍了EBGM方法,并对相关工作进行了总结。第三节介绍了一种RGB模糊人脸检测系统的设计。第4节解释 提出了一种基于EBGM的人脸识别方法的改进方案,并给出了该方法的形式化框架。第五节介绍了基于自组织映射的神经网络识别方法。科蒂奥 N6描述了所做的实验。最后,在第七节中讨论了结论和今后的工作。

  1. EBGM算法及相关工作

在这一节中,我们对EBGM算法进行了描述,并对最近的一些相关工作进行了讨论。

2.1弹性束图匹配法

弹性束图匹配是一种基于特征的人脸识别方法. 它为每个训练图像导出了一组喷射器,并使用这些喷射器来表示图节点。为了形成一束图,一组面部图像被标记为头部定义位置的节点位置。这些节点的位置被称为地标,是通过半自动的过程得到的. 当将束图与图像匹配时,将从图像中提取的射流与与束图相对应的束中的所有射流进行比较,并选择最佳匹配的射流。

喷流定义为地标位置的Gabor系数,该系数是通过将Gabor小波滤波器集合在每个地标位置上计算出来的。所有训练图像的射流都是以一种称为束图的数据结构来收集的。一束图上的每个地标都有一个节点,每个节点都是相应地标的喷流集合。下面概述了EBGM进行人脸识别的主要步骤:

  1. 选择训练人脸图像上的地标创建人脸模型。选择是手动执行的。
  2. 用Gabor小波变换这些点构造Gabor射流J,利用输入图像I(X)与Gabor FI的卷积编码基准点x周围的局部外观。 使psi;m(X)=kmsigma;2 exp kmx 2sigma;2times;exp i kmx-0.5sigma;2,其中,高斯的宽度由参数sigma;=2pi;控制,Km是波矢量:

射流J有40个系数,nu;=0,1,hellip;,4对应5个不同的频率,mu;=0,1,hellip;,7是Gabor核的8个不同方向。

  1. 创建一个数据结构,称为对应于面部地标的束图,其中包含从面部模型中提取的一组模型喷射器。
  2. 然后,对于每一幅待识别的新图像:(A)用束图估计和定位地标位置。(B)通过比较计算新射流从实际位置的位移。 用最相似的模型JET。(C)创建一个新的面部图,其中包含每个地标位置和该地标位置的喷射值。
  3. 同样,对于每一幅新图像,使用一组图估计和定位地标。然后用Gabor滤波器进行特征提取,然后生成人脸图。 ...。匹配分数是根据数据库中图像的人脸图和新输入图像中的人脸图之间的相似性来计算的。
    1. 相关工作

近几年来,EBGM已被用于人脸识别。大多数基于EBGM的方法都采用Gabor小波进行特征提取(沈和白,2006)。这些特性由GR表示。 几何调整到特征提取点的id。识别的基础是小波系数,计算出代表网格控制的二维弹性图的节点。 夺取地标。该方法通过处理一个点集的多尺度多方向(射流)的Gabor滤波器,将局部和全局表示结合起来。 l点位于面部的特定区域。基准点的位置是该方法最复杂的任务。这些点取决于照明条件、表达式和你的脸。

Monzo等人提出的另一种方法。(2010)是方向梯度直方图(HOG)的应用,而不是使用Gabor滤波器定位特征。hog描述符是 考虑参考点周围所有图像梯度的方向的TIST度量。该算法在定位和定位方面具有不变性。

最近,将EBGM与PCA和软生物识别技术相结合,对年龄变化对人脸识别的影响进行了研究(郭等人,2010年)。另外,一些新版本的EBGM侧重于快速版本的算法,以使其在实际情况下可行;因此,一个并行版本的EBGM用于基于M的快速人脸识别。 PI(消息传递接口)是由Chen等人提出的。(2013年)。Khatun和布伊扬(2011)提出了一种基于神经网络的基于Gabor滤波系数的人脸识别系统,其中识别采用了两个双向的混合神经网络。 关联记忆(BAM)用于降维,多层感知器采用反向传播算法训练网络。

在Mitra等人的工作中。(2011)提出了一种基于熵决策树的数据挖掘方法,以提高EBGM在使用大型数据库时的性能。 在人脸识别过程中。最后,Sarkar(2012)将皮肤检测与EBGM相结合,以获得准确的识别,因为皮肤分割图像去除了背景噪声,降低了er。 识别Gabor特征的ROR方法。

如前所述,计算基准点的精确位置并不简单。在原有EBGM算法,建立了一个固定数量的特征。他们对应 特定的面部特征,如瞳孔或嘴角。结果,获得了人脸模型图,并对数据库中的每一幅图像手动选择了基准点。 e.。另一种定位特征的方法是基于均匀分布的点网格,这些网格变形并符合模式,例如边缘检测器(Canny、Sobel、MLSE)识别的轮廓。 (特别是2008年,Ep等人;Gonzlsquo;Alez-Jimrsquo;Enez和Alba-Castro,2007年)。

近年来在人脸基准点检测方面取得了一些进展。除其他外,Belhumeur等人。(2011)使用的贝叶斯模型具有非常精确的结果,而基于 Dantone等人提出了实时检测二维人脸特征点的回归林。(2012年)。此外,Baltrusaitis等人。(2012)提出了一个概率地标检测器 在输入像素与地标对齐的概率之间产生非线性和空间关系。最后,金等人。(2013)开发了一种基于霍夫投票的方法来改善选举效应。 基准点定位的重要性和准确性。

综上所述,本文提出了两个结论:第一,许多研究小组对使用和改进原始的EBGM方法进行人脸识别仍有很大的兴趣; 这些研究大多集中在将EBGM应用于实时条件下,准确定位人脸的地标或基准点。很明显 在这一领域仍有许多工作要做,以前还没有发现将自组织映射显式应用于EBGM的工作。

3.基于肤色的人脸检测

在应用我们的识别算法之前,必须使用一定的检测方法来定位人脸。最近的许多建议都是基于以最佳颜色表示肤色的基本想法。 或空间(如rgb,yiq或hsv),通过所谓的皮肤集群(Yang等人,2004年)。因此,颜色信息是一种有效的工具用于识别面部区域,如果肤色模型能够适当地适应不同的光照环境。此外,由于颜色处理比处理其他面部特征快得多,因此它可以作为其他人脸检测技术的初步处理(Hsu等人,2002年)。另一个优势 F肤色检测是指颜色不受部分遮挡、缩放、旋转、平移和人脸方向的影响。这一事实在人脸检测技术中尤其有用。

对于我们的建议,RGB颜色系统已被选中。RGB空间与彩色光的物理传感器密切相关,如人眼的锥体或红、绿、蓝滤光镜。 在大多数彩色电荷耦合器件(CCD)传感器中。在Pujol等人的工作。(2008)提出了一种模糊RGB肤色检测器。让我们总结一下它的主要特征,并将其应用于人脸检测。

给出了一个大小为W=ntimes;m像素的彩色图像I,其中每个像素由颜色空间C中的颜色向量c定义,使得c(P)=C1(P),c2(P),hellip;,cl(P),forall;pisin;i,定义了C,H(C)的直方图。 当qtimes;l阵列H(C)={f1,f2,hellip;,fl}时,使得每个fi都是图像i上的频率矢量,使用Q b,表示i=1,2,hellip;,l。

因此,每个bin的值是图像i中具有颜色ci的像素数。如果H(C)被W规范化,则H(C)将颜色空间C取到[0,1]区间,即H(C)表示 根据Zadeh理论(Zadeh,1965;Piegat,2005),模糊集是一对(A,m),其中A是集合,m:a。→[0,1]。第四 可以应用于颜色直方图,其中模糊集可以定义为对(C,H),其中C是颜色空间,H:C。→[0,1]是归一化直方图。对于每个cisin;C,H(C)是g c的隶属度,使得cisin;(C,H)。lArr;rArr;Cisin;C,H(C)不等于0。

因此,每个rgb平面中肤色的隶属函数可以使用高斯函数建模,这样

在那里我= { R、G、B };{ Cr、CG、CB }isin;[ 0, 25

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[21542],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。