使用HOG特征和SVM在交通图像中识别车辆标识外文翻译资料

 2021-12-13 10:12

英语原文共 6 页

第16届国际IEEE智能交通系统年会(ITSC 2013)会议录,2013年

10月6日至9日,荷兰海牙

WeC3.1

使用HOG特征和SVM在交通图像中识别车辆标识

D. F. Llorca, R. Arroyo, M. A. Sotelo

要 - 本文采用方向梯度直方图(HOG)和支持向量机(SVM),提出了一种新的车标识别方法。该系统专门设计用于处理由交通摄像机提供的低分辨率图像。采用滑动窗技术结合多数投票方案,为汽车制造商提供估计值。建议的方法是根据一组3.579辆车的图像进行评估,这些图像是由27个不同车辆制造商的两个不同交通摄像头拍摄的。报告的结果显示总体识别率为92.59%,支持将该系统用于实际应用。

引条款 - 车辆制造商识别,车标识别,交通图像,HOG特征,SVM,滑动窗口,多数投票。

  1. 介绍

如今,在智能交通系统(ITS)应用的背景下,通过标准车牌识别(LPR)系统识别车辆制造商(汽车制造商)的能力变得越来越重要。当前的交通监控,速度控制和门禁系统依赖于对车牌的正确检测来识别被监控的车辆。然而,如[1]中所讨论的,车牌识别系统会失效,并且大多数识别错误不是由于缺少识别能力,而是由于与环境条件的高度可变性相关的分割错误。

如果这些数据直接发送给驾驶员,而无需人工监督LPR系统提供的结果,识别错误可能是错误文件的原因。此外,车牌识别系统无法检测假车牌号。自动车辆识别系统通过包含被监控车辆的更多细节来增加其可靠性和稳健性,例如车辆颜色[2],车牌颜色[3],汽车制造[4],汽车模型等。如果检测到的车牌和车辆制造商与存储在警方或国土安全数据库中的数据相关联,LPR错误和可疑车辆可以自动识别,无需人工监督。

如[5]中所述,车辆制造商识别(VMR)是该领域研究相对有限的主题。文献中描述的大多数关于VMR的方法都是基于对车辆标识的识别,车辆标识是汽车制造的明确指标。因此,VMR问题可以简化为不同车辆制造商的所有车辆标识的多分类问题。

D. F. Llorca, R. Arroyo, M. A. Sotelo在西班牙马德里阿尔卡拉大学理工学院计算机工程系工作。

电子邮件:llorca,sotelo@aut.uah.es。

本文提出了一种基于车标分类的车辆制造商识别系统。车标检测由先前开发的车牌识别阶段辅助。然后在检测到的牌照上方定义的感兴趣区域(ROI)中应用滑动窗口技术。目前已经研究了局部二值模式(LBP),尺度不变特征变换(SIFT)和定向梯度直方图(HOG)作为表示车辆标志的特征。然后使用多类支持向量机(SVM)对滑动窗口阶段提供的所有区域进行分类。最后,利用支持向量机给出的二进制输出,实现了一种基于多数投票的标识估计方法。与以前方法的主要区别在于使用HOG特征结合多类SVM来处理徽标识别,以及基于纹理的描述符(例如LBP)的评估和使用滑动窗口技术结合多数投票做法。此外,我们的VMR系统专门设计用于交通图像,如图1所示。虽然其他方法识别高分辨率区域的徽标,但我们的方案适用于徽标出现在低中分辨率区域的图像。提出的方法是在一组3.579车辆图像上进行评估,这些车辆图像由两个不同的交通摄像头(见图2)捕获,摄像头分属于27个车辆制造商。

图1.用于车辆标识识别的交通图像的示例

  1. 相关工作

VRM通常通过车标识别(VLR)来实现。该程序包含车牌识别(LPR)模块,然后是一个粗略的方法来识别徽标ROI,最后,采用了一些标识识别方法。在[6]中,使用模板匹配和边缘方向直方图来解决徽标识别问题。在[7],[5]中提出了使用SIFT描述符和神经网络结合进行徽标识别。文献中可用的大多数方法使用SIFT描述符。因此,在[4]中,使用一组对应于10个不同车辆制造商的1200个徽标图像来评估基于SIFT的方法。这是一种增强的特征匹配方法,可以合并来自不同徽标样本的SIFT点,提供97%的准确度。然而,[4]中使用的样本与自然交通图像不对应,可以使用ROI尺寸约为100times;100像素(asymp;我们使用的尺寸x3)的特写徽标图像。

最后,在使用傅立叶形状描述符和内部结构均方误差分析的[8]中,指出亮度的大变化、前景中的车辆特征和镜面反射使SIFT方法实际上毫无用处。

HOG特征

ROI选择

运动?

没有

LPR没有

车辆标识识别(VLR)

汽车标志

图3.提出的VRM方法的总体架构

多级SVM 多数投票

根据车速的不同,摄像头捕捉到同一辆车对应的2-7帧图像,并能完全看到其徽标。这种方法在图4所示的有限状态机(FSM)中以图形方式描述。无车状态意味着图像上既没有运动也没有车牌。一旦我们检测到图像上车辆牌照的第一个外观,我们就切换到运行徽标识别模块的汽车状态。我们对多类支持向量机的所有二进制输出进行了累加。多数投票法仅在牌照丢失时适用。

图2.用于记录交通顺序的原型

没有动作没有LP

运动与LP

没车 汽车

运动与LP

  1. 系统描述

VMR系统的总体结构如图3所示。可以观察到,如果识别模块检测到图像上出现的车辆的运动和牌照,则识别模块将由以前的阶段触发。仅当我们检测交通图像上的运动时才应用LPR模块。一旦打开徽标识别模块,就应用滑动窗口技术来选择徽标可以定位的ROI。针对每个先前选择的ROI运行HOG特征的快速实现,并且通过多类SVM对这些特征向量进行分类。使用多数投票方案,最终获得与车辆制造商相对应的预计标志,它为每个预先选择的ROI获取SVM类文件的所有二进制输出。

所提出的多数表决方案以多帧方式定义,即用于识别徽标的SVM二进制输出对应于出现相同车辆的所有帧。

没有动作amp;amp;没有LP /汽车标志

图4.有限状态机(FSM)

  1. 车辆标识本地化

第一阶段使用帧到帧差分方法检测与摄像机捕获的传输序列相对应的连续帧之间的变化。因此,如果图像上没有出现车辆,则CPU负载很低。一旦运动模块检测到两个相邻帧之间发生相当大的变化,就会执行先前由我们的研究小组开发的LPR系统,同时提供牌照的文本和位置。然后,做出以下假设:在大多数情况下,车辆标志将出现在位于车牌正上方的区域中。该假设对于其中牌照不位于中心而是位于车辆前部区域的一侧的某些类型的车辆是无效的。因此,我们应用不同区域尺寸(方形窗口)的滑动窗口技术,沿垂直轴滑动窗口,将两个相等大小的区域中的牌照分开(见图5)。

值得一提的是,其他方法是专门设计的,只提供一个适合车辆标志的区域[6],[9],[10]。在我们的例子中,我们提供了一组反馈送到分类器的区域。虽然此过程会增加CPU负载,因为Hog功能和SVM分类必须在多个区域中运行,但我们希望得到更好的结果,因为我们不依赖于每个图像仅输出一个分类。作者在行人[11]和人行道[12]识别的背景下成功地应用了类似的方法。

垂直轴

不同的窗口位置

不同的窗口大小

牌照

开始窗口

图5.滑动窗口方法的整体视图

  1. 车辆标识识别

正如[4]所建议的那样,车辆标识识别的自然方法是使用SIFT特征,因为它具有透视,旋转和移位的不变性[13]。虽然我们没有实现[4]建议的整个方法,但我们很快发现SIFT特征不足以在不同光照条件下捕获的低分辨率图像(见图6)。[8]在日常照明条件下使用高分辨率图像也引用了这个问题。通过这种方式,我们最终放弃了使用SIFT功能。

图6.在不同光照条件下,包含相同汽车制造商徽标的两个图像的SIFT性能不足

我们考虑使用Dalal和Triggs[14]的方法,使用良好标准化的定向梯度密度直方图(HOG)来模拟车辆标识的局部形状和外观。根据方向对局部梯度进行分级,根据其大小加权,在具有重叠的块状对比度归一化的单元的空间网格内。在每个重叠的单元块内,通过从贡献的空间单元中对直方图进行采样来获得特征向量。将所有重叠块的特征向量连接起来,生成最终的特征向量,并将其输入到类文件中。图7描述了一些车辆标志的平均梯度图像,图8显示了HOG/SVM架构的概述。

我们对HOG参数的选择如下。徽标本地化阶段提供的ROI调整为32times;32分辨率。我们使用具有平滑效果的线性渐变(minus;1,0,1)遮罩、线性方向分块(8个分块)和2times;2块8times;8像素的单元。最后,应用重叠块对比度归一化(l2-norm)。连接的特征向量大小为288。

最后,我们测试了使用本地二进制模式[15]来确定在完成车辆标志分类时,标志的纹理是否包含相关信息。结果表明,无论是单独工作还是结合HOG的特点,系统性能都没有得到改善。因此,我们放弃了使用诸如LBP等纹理特征来进行车辆标志识别。

奥迪 奔驰 标致 欧宝 大众汽车

涉 雷诺 沃尔沃 雪铁龙 座位

图7.本工作中使用的一些车辆标识的平均梯度图像

一旦我们有了与所有特定车辆出现的帧的滑动窗口方法给出的所有区域相对应的所有HOG特征(见图4),然后根据标准的一对一方法,通过多类SVM[16]对这些特征向量进行分类,以将单个多类问题简化为多个二元分类问题。通过求解优化问题来计算最佳分离所有类的最大边缘超平面。与径向基核函数相比,线性核函数具有最佳的精度。此外,线性核函数还提供了一个在线应用函数,它涉及具有独立于支持向量的权向量的点积。最后,使用多数投票方案将最终结果指定为投票数最多的类别。

  1. 实验

分辨率为640times;480像素,焦距为50mm的数码相机被放置在指向高速公路一条特定车道的两个不同的公路桥上(见图2)。在不同的照明条件下(从晴天到阴天),分两天拍摄图像。这些序列总共包含3.579个车辆图像,属于27个不同的车辆制造商。通过对摄像机图像中相应的边界框进行人工标记,获得车牌号及其位置、车标及其位置对应的地面真值。每个汽车制造商的样品数量如表一所示。图9中描述了27个汽车标志的一些示例。

方向直方图

梯度

伽玛标准化

输入图像

块规范化 特征向量连接 多类SVM分类器

图8. HOG / SVM架构概述

表i

每个汽车制造商的样品数量

生产厂家

#样品/

# 车辆

生产厂家

#样品/

# 车辆

阿尔法罗密欧

17 / 5

24 / 6

奥迪

232 / 64

马自达

25 / 10

宝马

142 / 47

奔驰

293 / 85

雪佛兰

19 / 6

微型

7 / 2

雪铁龙

276 / 107

日产

lt;

资料编号:[5484]

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。