基于正面视图图像测量的车型识别技术外文翻译资料

 2022-09-30 11:09

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


基于正面视图图像测量的车型识别技术

摘要:本文提出了一种新的汽车制造和模型识别的方案,它因为颜色识别的可靠性而被人们所信任。一个被评估过了的概率神经网络作为分类器,证明了相对简单的图像处理的测量可以用来获得高性能车辆身份验证。这个提出的系统是由一个以前开发车牌识别,对称轴检测器和图像相位一致性计算模块所组成的。所获得的报告的结果表明,这个系统具有高的识别率和快速的处理时间,使得系统适合于实时应用。

1介绍

大多数现有车辆检测系统只处理车辆/非车辆检测,分类成一般类车辆或追踪车辆,然而,汽车制造商和型号识别(VMMR)是该领域报道相对有限的研究课题,因为图像采集在户外环境中进行,在光照条件下无法转接,控制,从而使识别成为一个艰难的任务。因为一个单独类别中的车辆形状种类很多,是各种各样的,所以很难用一个简单的模型进行车辆的分类。

Dlagnekov和Belongie利用由罗威开发的尺度不变特征变换(SIFT),利用不变的缩放,旋转和部分的ILLU-mination差异,发展完善,使它们适合于VMMR。在他们的研究中,在后视图车辆图像中使用,达到89.5%的识别精度。车辆制造和模型识别被视为同时被认可为一个单独的分类。然而,据报道,这个系统不具备实时性和没有公布识别速度的情况。帕罗维奇和Cootes为VMMR提出了一个有趣的方法,即从正面视图识别车辆图像,这种方法得到了93%的识别精度。车辆制造和模型识别被视为一个单独的类,同时认可和接受没有识别速度结果的报告。 Merler提出了一种基于颜色分割和标识,它执行颜色识别和分割,但缺乏VMMR车辆检测系统。而李使用了纹理描述符如对比度,均匀性,熵和动量为前视图车辆的图像,通过对VMMR的三层神经网络分类,从而达到了94%的准确性。车辆制造和模型被视为同时被认可为一个单独的类。处理时间也没有一份准确的报告。想比较而言,一份较为完整的知识获取系统出现在Maemoto的研究里,它由多个对象识别模块,从后方观察汽车的图像,如窗口,尾灯,等等,基于颜色识别而达到车型识别的目的。这种方法具有对照明条件敏感的缺点。

在这个研究中,提出了一个旨在获得可靠VMMR系统,首先检测感兴趣区域的车辆,在车辆正面图像中进行车牌定位和其他特征元素的采集,包括头灯,格栅和标志区,从此之后被称为“汽车面具形象”。如果需要的话,对称轴模块被用来验证和调整中央分段的正面“车辆面具形象”。然后,使用一个叫做相位一致的特殊的图像处理技术,进行制造商标志的检测和分割(见2.3节)。

这项研究的贡献,主要在于有效地利用了LPR,车辆面具和标志图像检测与分割,并使用概率神经网络(PNN)作为分类比较简单的图像处理技术,从而快速识别时间,是适于实时应用。

这项工作的新颖性,是利用一个分层图像数据库,它包含了一组要小得多的数据库,根据每一个制造商,以及该制造商的所有模型。这种方法显著降低了识别时间,至少在一个数量级以内。为了知道哪个厂商查询的模型,所有只需要与各自的制造商数据库模型进行匹配。

如果有M个制造商和N型/制造商,使用单个数据库,识别复杂度为O(M2N2),并使用一个分层数据库时,复杂度为O(M 2) O(N 2)。因此,标志的检测和模块识别首先被用于制造商的检测。其次,模型对应于车辆的正面图形,其中,在检测到的标志的模型中,使用了该制造商的模型数据库识别。因为比在车辆的后视图图像更容易检测标识的原因,选择前视图车辆图像进行系统的研究。

这项工作的另一个贡献,是实施一种快速的颜色识别计划,使用一个简单的基于直方图技术,结合VMMR,完成并整合从每一个车辆正面图像采集的信息。

简言之,该系统主要包含八个模块:1)车牌识别,2)车辆正面视图分割,3)颜色识别,4)相位一致计算,5)车辆正面图像分割6)车辆制造商概率神经网络(PNN)识别,7)车辆SIFT指纹测量和8)车辆模型PNN识别如图所示。算法细节和实验结果本文下面的章节介绍。

2汽车制造商和型号识别(VMMR)

2.1汽车车牌识别

从照相机或摄像机的连续图片序列中获取车辆的前面图像,首先转换为灰度(便携式灰色地图,PGM)与8位分辨率,然后通过480像素尺寸缩小到640,然后应用一个牌照地点识别模块(LPR)。 LPR使用一个滑动同心窗口(SCW)分割方法,参考普乐施的文献[1],车辆正面图像提取,二值化用Sauvola的方法[16],随后将布置在序列中的组件标签连接以及进行二进制的测量。 图 2展示了了车牌检测的图像处理步骤。图3显示了车牌分割算法的流程图。输入到这个模块的是灰度图像,结果是输出包括车辆车牌号码以及车牌矩形区域的坐标。Anagnostopoulos在他的研究中分析和描述了整个过程。其中写道,当在一个大的,在各种照明条件下捕捉的1334个图像集合中应用上述模块,96.5%实现了车牌分割,89.1%的车牌成功识别了整个板块的内容。并且整个过程是相当快(平均约100毫秒)。

图2.车牌分割步骤:a)初始图像,b)SW分割技术的分割规则和阈值的应用程序后的结果,c)图像B后的车辆正面图像步骤,d)车牌的检测。

图3 LPR系统架构

2.2 车辆正面视图图像分割

在本节中,感兴趣的区域(“车辆正面图像”),被定义为:Wmask= 4times;W和Hmask= 2times;H,其中Wmask和Hmask分别是车辆“车辆正面图像”的宽度和高度,W和H分别是分割牌照板的宽度和高度。在第2.1节中检测到车牌的坐标,例如图4所示。然而,应该指出,所有车辆图像都具有非对称的正面车牌位置的假设并不一定成立。但在这种情况下,采用车辆图像对称轴模块(查看我们以前的工作[15]和[18]),以使车牌在向对称位置(中央)转移,然后按照以前的步骤一样继续进行。

2.3车辆正面图像分割

对图4中所示的车辆正面图像进一步分割以便隔离出制造商的标志。为了完成这个任务,采用了一个基于相位一致性计算的方法,用一个无量纲的指标来评估显著特征的存在与否。相位一致性的输出值从最小的零(表示没有意义)变化到1(指示一个非常显著功能)。通过由Kovesi在文献6中提供的默认值代码,我们同时研究并计算每一个车辆图像的特征曲线,这个特征曲线是每个样品的独特的和有代表性的“图像签名”,如图5(a)中所示。

图4.基于车牌定位的车辆正面图像(ROI)的定义。

例如,在图5(C)的汽车形象中,整个图像分为相位一致性对应的标志(C部分),散热器格栅(部分B和D)和前大灯(部分A和E)各单位的分立分割图梯度阈值(DS/ DX N =4.5),参见图图5(b)。 “图象签字”的最重要的部分是在车辆的正面图像,其中制造商的标志通常出现在该图像的中心区域。

图5(a)第一阶段叠合特征图,(b)微分相位一致性,(c)基于相位叠合图梯度(DS/ DX)阈值的车辆面具分割。

2.4车辆颜色识别

被捕获的车辆图像经过裁剪该图像的车辆正面图像和覆盖的车辆的引擎盖后得到,如图6所示。

图6 车辆正面图像颜色分割

为了估计所述车辆的颜色,创建分割图像的含有R,G,B分量的直方图。每个直方图(Rmax,Gmax,Bmax)的峰值形成感兴趣的主区,它定义了车辆的颜色,它可在图7中可以看出。

图7 直方图RGB分量

估计占主导地位的RGB值,然后通过使用欧几里德度量距离给定的16个标准色,对输入车辆图像的彩色特征进行比较。例如,对于车辆如图图6中,颜色识别结果在图8呈现的颜色。

图8检测颜色

2.5汽车制造商的识别

一个概率神经网络(PNN),由斯皮赫特在文献[17]中描述的,用于汽车制造商(标志)的分类。它是一种特殊类型的神经网络,一般用于模式分类,并且它的目的是将输入图案分类为预定义的类别,从而通过先前提出的网络监督训练的一个输入模式进行分类。神经网络则提出它将被期望识别的的每一个模式的样本。之后PNN学习这些课程并计算出未知输入模式是同一类的概率。

这个系统有至少三层:输入,径向和输出层。径向单位直接从每一个案例的训练数据复制。每个辐射单元模型在以高斯函数为中心的培训情况下输出每个类别的输出单元。因此,输出单元简单地加起来,组成属于它们自己类的输入单位的响应。输出是每个成正比的概率密度函数(PDF)的各种数据,以及这些基于内核估计所产生的总结类概率。

对于使用PNN最大的好处是训练和分类的速度很快。事实上培养一个PNN的过程就是将培训课程复制到网络的过程所组成,这个过程快速和简单,使它更适合实时图像处理的应用程序。一个图案类已经观察不久的同时,网络可以开始将所有未来输入模式送入PNN,进入预定义的类之一进行分类。

PNN的缺点是巨大的网络规模:事实上,在PNN网络包含了一整套的训练情况下,需要昂贵的内存和复杂的计算,每过一年就会有更大的内存和更快速度的电脑出现。而在我们研究的情况下,训练可离线进行,并不会影响实时识别的进度。

第一层的系统具有径向基函数(RBF)的神经元,计算其与欧氏距离和网络输入产物加权输入。当有一个输入进入时,所述第一层从输入矢量的训练中输入矢量计算的距离,并产生一个数值表示其与第一个输入载体的输入的接近程度。第二层具有竞争力的神经元,计算输入的每个类投入生产所得到的贡献的加权输入与点积和总和,将所得到的一个向量的概率作为网络输出。最后,比较第二层输出的传递函数的概率并取最大值,并产生一个判断1属于这类0不属于这类。概率神经网络(PNN)是基于贝叶斯分类:

P eth;ci = xTHORN; =

N

P eth; x = ciTHORN;P eth;ciTHORN;

eth;1THORN;

jfrac14;1

sum; P x = cj

P

cj

其中,P(X / CI)是设定的ci的x的条件概率密度函数。P(CJ)为从另一个分类的CJ绘图数据中的概率。矢量x属于分类ci,如果P(CI/ X)N P(CJ/ X),J= 1,2,...,N,Jne;I。 PNN近似于矢量x属于一个特定分类ci的概率。如由下式给出在每个训练样本为中心加权的高斯分布的总和:

1

Ni

minus; xminus;xji

xminus;xji

T

p

sum; exp

2

p

sigma;

2sigma;

eth;2pi;THORN;2

Ni j = 1

2

eth; THORN;

其中,xij表示为i类模式的第j个训练矢量,sigma;是平滑算子,N是输入向量的维数,以及Ni是训练模式的数目在i类。非线性决策边界,平滑操作者sigma;必须尽可能小。如果sigma;为接近零,网络充当最近相邻分类器。随着sigma;变大,设计的网络考虑到附近的几个设计载体。该系统体系结构提供了PNN下面示于图9:

图9 PNN系统架构

2.6车辆指纹识别与车辆模型识别

对应于标志图像分割,尺度不变特征变换(SIFT)由Lowe 提出并应用于车辆图像领域。SIFT在图像识别领域是最先进的识别和选择的方法,并得到了广泛的应用。它是一种基于一组直方图梯度方向的图像描述方法。兴趣点(关键点)在于一个尺度空间搜索和过滤的局部峰,并且只保存那些有可能保持稳定的

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[150183],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。