无约束的人脸检测:深度学习和机器学习相结合的方法外文翻译资料

 2022-05-30 22:18:23

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


DOI 10.1007/s40012-016-0149-1

2016年特别发行VISVESVARAYA CSIT

无约束的人脸检测:深度学习和机器学习相结合的方法

Dattatray D./bull;Ravindra S. Hegadi1

收到日期:2016年10月28日/接受日期:2016年12月15日/网上发布:2016年12月30日

copy; CSI Publications 2016

摘要:在不受控制的环境中,面临着多重挑战。 主要挑战是遮挡,姿态和照明变化。 在这种情况下,检测面部以进行进一步处理变得困难。 卷积神经网络(CNN)是一种生物启发式网络,可以学习人类大脑学习的方式。 CNN提供对输入图像中存在的特征的深入观察。 本文提出了使用深CNN提取的深度特征和立方支持向量机分类来检测人脸的组合方法。 基于区域的方法用于去除远距离人脸和背景像素,以减少检测阶段每帧所需的处理时间。

关键词无约束面部人脸检测面部曲线深度学习机器学习CNN

介绍

人脸检测和识别被用于许多科学应用。 受控环境中的人脸检测和识别已经取得了基准测试结果[6]但是在具有挑战性的应用中,例如人体监视或人员识别,这些方法不适合。 由于多个未解决的挑战,大多数技术很容易失败。 在识别之前应该检测和处理人脸,但由于诸如遮挡,姿势之类的挑战,很难甚至检测到人脸

&Dattatray D. Sawat sawat.datta@gmail.com

1索拉普大学计算机科学系Solapur,马哈拉施特拉邦413255,印度

变化,光照变化,低分辨率和旋转。 由于人类活动或他们使用的配件,可能会发生遮挡。 遮盖隐藏重要特征和面部器官。 日常活动导致人脸部分可见,检测器无法提取关键特征。 许多正面人脸检测器无法处理姿势变化。 经常出现在无约束面部的另一个挑战是光照变化,它可能在面部或图像内或视频帧内变化。 这些图像在现实生活场景中也可能具有遥远的面孔,这些面部会给面部检测器带来挑战。

检测精度取决于检测器能够从输入图像中提取的独特功能。 输入数据应该转换成可以用来训练分类器的形式。 转换函数将输入数据的维度减少到代表原始数据特征和较小占用空间的维度。 变换函数学习使用预定义公式计算的特征,或通过深入观察数据本身以提取模式。 前者要求为特定问题设计转换函数,并可用于该领域中的问题范围。 后者可以应用于各种设计变化的问题,通过深度观察观察特定模式,并将其称为深度学习方法。

相关作品

    1. 使用公式化功能

研究人员专注于基于配方的脸部检测特征。 这包括最初的工作

Viola-Jones [4]。 在Viola-Jones工作之后,许多人已经扩展了他们的工作并提出了人脸检测方法[8, 13]。 陈等人。 [2提出了简单的增强级联结构以提高人脸检测的速度和精度。 他们使用联合学习方法在脸部对齐中提取形状索引特征。 Zhang等人 [14]使用粗到细的方法来生成多个分辨率,并以非常低的成本拒绝低分辨率,这使得基于HOG的检测器可以扫描很少的窗口。 Park等人 [10]使用多分辨率技术来表示基于可变形部件的模型。 由Zhu和Ramanan通过零件的全局混合和零件树的模型来实现脸部标志的姿态估计和定位[15]。 林和刘[9]设计的学习框架,在这个框架中,他们使用了增强级联来进行多类别检测,每个类别由决策边界和最优标准决定。 Li等人

[5]已经提出了在无监督自适应算法的基础上生成统计对齐的基于零件的人脸模型的算法。 Liao等人提出了一种基于像素的面部区域编码。 [7],其中取对应像素值的差值与总和的比值,并且该方法能够重建原始区域。

    1. 基于CNN的人脸检测

由于其优点,几位研究人员已将CNN应用于人脸检测。 Ranjan等人 [12]添加了规范化层,以减少训练和测试之间的差距,这种差距可以使用深度CNN检测具有姿势和尺寸变化的人脸。 Li等人 [1]使用级联的CNN,其在​​第一阶段之后很快减少背景区域,并且在CNN的每个阶段添加了用于检测窗口的校准。 秦等人。 [11]提出了联合训练以优化CNN级联以及反向传播。 杨等人。

[13]使用全卷积网络生成热图,然后使用热图生成面部提议。 级联CNN [1]和R-CNN [12]被提出用于人脸检测,但这两种都是贪婪的方法并需要优化。 后者与Lis方法相反[1].

方法

所提出的方法是使用Deep来提取特征

图1组合方法:深度学习(FENET),机器学习(立方SVM)

连接层。 这些层串联连接,一层的输出作为下一层的输入。 第一卷积层检测给定图像中的低级分量,例如图像中存在的边缘和区分信息。 在具有区分信息的位置的下一层中,激活功能突出显示值。 合并图层用于图像高度和宽度的下采样。 完全连接的层定义了输入数据到它所属的类的概率。 提出的CNN有18层,包括5个卷积层,3个标准化层,6个整流线性单元(ReLU),3个池层和2个完全连接层。 第一个Convoluational层有11 9 11 9 3个输出和96个不同的滤波器,步长设置为4,pad初始化为0.完整的Deep CNN架构如图1所示。 2.

最后一层是完全连接层,并与输入图像中的每个像素具有神经元连接。 图1中显示了具有不同多重滤波器的第一卷积层的输出。 3.

网络中的每一层都通过卷积滤波器将输入转换为输出,并且每个滤波器都使用带或不带参数的函数。 第一个卷积层采用相同数量的神经元,即227 x 227 x 3作为输入图像,元素明智的产品作为输出。 ReLU层通过使用下面定义的max函数对值进行整形来获取执行元素激活的第一层的输出。

F(x)= Max(0); XTH eth;1THORN;

通过使用随机梯度下降(SGD)来调整卷积和完全连接层中的权重,所述随机梯度下降(SGD)保持概率或分类分数一致。

随机梯度下降函数是

X

卷积神经网络 - 特征提取网(FENET)并使用Cubic支持向量机进行分类。 数字 1 说明了所提出的方法。

1

Qww =nr

n ifrac14;1

QidwTh eth;2THORN;

    1. 深CNN特征提取器

深CNN由卷积层,整流线性单元(ReLU),标准化,最大池和完全

    1. 分类

提取的特征使用具有三次核函数的支持向量机进行分类。 为了分类

图2提议的深层架构:18层FENET(5卷

层,3个标准化层,6

ReLU,3个池层和2个完全连接的层)

一个四分之一尺寸 eth;4THORN;

b frac14; sizeeth;yTHORN; eth;5THORN;

d eth;6THORN;

其中alpha和beta是图像的高度和宽度,r1和r2是给定数据库中图像的高宽比标量。 该

8lt;c1 8( a

frac14;

frac14;r1;bfrac14;r1;

d 120 r2

:

则为c2

120 r2

如果a = 120和b = 120,则通过将行大小乘以常数c1和c2而计算出宽高比为4:3的图像的可能的脸部区域,其中c1和c2分别计算为a * 4,b * 3有比例r1:r2。

然后将计算出的面积除以长宽比的元素之和即r1ge; 如下式所示。

图3滤波器第一次卷积后的计算权重

氩 d

eth;r1 r2THORN;

frac14;

eth;7THORN;

面对面和非面对面,使用One-vs-One多类方法。 数据标准化在执行分类时启用。 立方体内核函数定义如下

d

方程中的过程。 (6)将要处理的区域的数量删除到很少。 因此,在寻找图像中的候选人时,处理帧的速度相对于窗口扫描方法增加。 训练数据库是通过将图像gen-

Keth;xi; xj)= xxi x xj 1)

eth;3THORN;

通过上述方法对人脸和非人脸样本进行评估。

CNN用于使用提议的18来提取特征

其中d是多项式函数的度数并为此

我们使用的分类任务d = 3。

实验

    1. 预处理

来自IJB-A数据集的图像通过使用基于区域的阈值用于训练目的被分割成可能的人脸和不可能的人脸区域。 基于面积的阈值如下所示。

具有最大池和标准化层的多层体系结构。 完全连接的层即层18将激活值转换为1times;4096特征向量。

    1. 评价;

4.2.1对训练数据库的评估

为了评估目的,将所提出的方法应用于作为IJB-A数据库的子集的训练数据库,并且针对子集获得的ROC曲线示于图2中。 4.

图4训练数据库的ROC曲线

图5来自FDDB数据库的图像帧的人脸检测结果

使用所提出的训练数据库方法获得的结果的准确度为98.2%。

4.3评估FDDB数据库

FDDB数据库[3]分为10个子集,其中包含2002年和2003年不同月份从互联网获取的图像。实验在数据库的第一个子集(FDDB-fold-01)上进行。 数字 5 显示来自FDDB数据库子集的注释图像(FDDB-fold-01)。

结论

在本文中,我们介绍了一种用于无约束人脸检测的组合深度学习(FENET)和机器学习方法。 所提出的方法显示了面部检测率的改善。 虽然检测面部可能的人脸区域而不是窗口扫描方法,但通过拒绝远距离人脸区域和背景细节提高了每帧的整体检测速度。

致谢第一作者衷心感谢新德里电子信息技术部(MeitY)授予Visvesvaraya博士学位。 通过文件号PhD-MLAn4(34)n2014-15向他提供奖学金。 日期:10/04/2015。

参考

  1. Li H,Lin Z,Shen X,Brandt J,Hua G(2015)用于人脸检测的卷积神经网络级联。 在IEEE计算机视觉和模式识别会议上,pp 5325-5334
  2. Chen D,Ren S,Wei Y,Cao X,Sun J(2014)联合级联人脸检测和对齐。 在:计算机科学讲义(包括子系列人工智能讲义和生物信息学讲义),8694 LNCS,no。 第6部分,第109-122页
  3. Jain V,Learned-Miller E(2010)Fddb:无约束设置中的人脸检测基准。 技术报告UM-CS-2010-009,马萨诸塞大学阿默斯特分校
  4. Jones M,Viola P(2003)快速多视图人脸检测。 三菱电机研究实验室TR2000396
  5. Li H,Hua G,Lin Z,Brandt J,Yang J(2013)概率弹性零件模型在无监督人脸检测器适应中的应用。 在:Proceedings of the IEEE international conference on computer vision,pp 793-800
  6. Liao S,Jain AK,Stan Z Li(2015)关于野外人脸检测的调查:过去,现在和未来。 Compu

    全文共5164字,剩余内容已隐藏,支付完成后下载完整资料


    资料编号:[11454],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。