《运用多级和单级分类方法从图像到车辆模型的识别》外文翻译资料

 2022-04-08 10:04

英语原文共 17 页,剩余内容已隐藏,支付完成后下载完整资料


附录A 译文

《运用多级和单级分类方法从图像到车辆模型的识别》

Daniel T. Munroe and Michael G. Madden

Department of Information Technology

National University of Ireland, Galway

Galway, Ireland

摘要: 本文研究了使用机器学习分类技术来识别车辆的构造和模型的任务。尽管已经存在多种车辆分类系统,但其中的大多数仅追求区分车辆类别,例如:识别车辆是公共汽车、卡车还是汽车。这里介绍的系统表明,从车辆正面视图中提取的一组特征可用于高精度地确定车辆类型(品牌和型号)。对于这个问题不仅比较了一些常用的多类分类算法的性能,而且一类k-最近邻分类算法也被实现和测试。

1 简介

近年来,由于人们对停车场、建筑物和限制区域的门禁系统的安全意识逐渐增强,这关系着人们对车辆识别和分类技术的需求。车辆识别也可以在道路交通监控和管理领域发挥重要作用。例如,在道路上的自动收费系统中,车辆必须分类以便计算正确的收费金额。

车辆类型识别中从车辆(汽车)的正面图像识别正确的品牌和型号的过程,代表了传统车牌识别系统的自然延伸。本文提出的系统有益于车牌识别软件的发展,本文通过提供一个双重检查来解决假车牌号问题。

本文提出的识别过程是基于数字图像使用特定的特征提取技术。使用不同的机器学习算法在车辆的150个正面视图图像数据集上进行测试(五个类别中的每个分类有30个图像),并且进行实验以评估它们的性能。

考虑两种广泛的机器学习分类方法:多级分类器和单级分类器。正如下面在第3节中所讨论的那样,多级分类是机器学习中使用的“标准”方法,但单级分类方法在某些应用中比较合适,在这些应用中,示例分布的标准假设不适用。

本文在提供相关研究和单级分类概念的简要概述之后,将更详细地描述该系统。然后,分析各种分类算法的性能,并得出结论。

2 相关研究

计算机视觉文献报道了各种车辆分类和检测方法,尽管在车辆检测方面有大量文献,但在车辆分类领域中做得相对较少。由于各种车辆的形状和大小不同,使这成为一个相对具有挑战性的问题,使得使用简单参数对车辆进行分类变得很困难。

大多数系统要么检测(定位在背景下的车辆),要么将车辆分为大类,如汽车、公共汽车和卡车[3,5,7,8,14,16]。魏等人[14] 使用与车辆拓扑结构的特征相对应的三维参数化模型,使用神经网络进行分类。他们提出的结果显示,91%的车辆被正确识别为六个不同的类别。Lipton等人 [8]创建了一个车辆跟踪和分类系统,可以将运动物体分类为车辆或人类,但其目的不是将车辆分为不同的类别。 他们的系统在车辆的识别上获得了超过86%的成功率,在人类识别上的正成功率达到了83%。

Gupte等人 [5]提出了一种在交通场景图像序列中进行车辆检测和分类的算法。该系统将车辆分为两类:轿车和非轿车(例如公共汽车、卡车、SUV)。在20分钟的公路交通顺序中,90%的车辆被正确检测和跟踪,并且这些正确跟踪的车辆中,70%识别成功。加藤等人,[7]提出开发一种驾驶辅助系统,该系统使用基于视觉的前方(与主车辆行驶方向相同的车辆)车辆识别方法,其能够根据道路环境背景识别多种车辆类型。他们使用的分类方法是多聚集修改二次判别函数。该系统将车辆分为三类,成功率为97.7%。

Dubuisson Jolly等人[3]使用一种可变形的模板算法,该算法包括找到最能表现车辆的模板为五个类别之一。他们的算法在405个图像序列上进行了测试,识别率为91.9%。同样,吉田等人[16]描述了一个基于局部特征的车辆分类系统,该系统使用计算机图形模型对车辆进行分类。将图像分为五类时,他们使用模板匹配技术识别达到54%的准确率。

就我们所取得的成果而言,与我们相关的有更突出成就的工作是Petrović等人的研究,[11]证明了从正面汽车图像中提取的一组相对简单的特征可以用来获得车辆类型的高性能验证和识别。通过定位感兴趣区域(ROI)并使用直接或统计映射特征提取方法的算法启动识别,使用最近邻居算法获得分类的特征向量。结果显示,当系统在超过1000个包含77个不同类别的图像上进行测试时,识别率超过了93%。

3 单级分类

前一节中介绍的所有系统均基于多级分类器。多级(包括两级)分类是机器学习中使用的标准方法,由此构造了一个区分固定类别的假设。例如:分类器可以区分显示车辆或不显示车辆的图像,也可以区分卡车、公共汽车、货车和汽车。然而,多类分类有两个假设:

1.闭合集合:所有可能的情况属于其中一个类

2.良好的分布:训练集由统计学案例组成每个类的代表

虽然这些假设并不繁杂,但在实践中可能是合理的也可能不合理。例如,当将图像分类为车辆存在或不存在时,闭合设定假设是有效的,但是在将车辆分类成类别(关于拖拉机、摩托车和重型机械如何分类?)时可能不是有效的。相反,当将车辆分类时分类假设可能是有效的,因为它可以直接获取代表每个类别的图像,但它可能不适用于区分车辆和非车辆的任务,例如图像只显示空路或者是人、动物、鸟类、建筑物、自行车、树木或其他物体。

由于近年来机器学习研究人员和从业人员已经解决了这些假设无效的问题。对于某些类别来说,没有数据、数据不足或数据分布不均的分类,单级分类技术开始受到关注。从本质上讲,这些技术形成目标类的特征描述,用它来区分目标与其他类(被认为是异常类)。显然,这避免了闭集假设,也不要求训练中的数据在统计上有代表性和目标类别样本的可用性。

第一种用于单级分类的算法是基于神经网络的,例如Moya等人的神经网络[9,10]和Japowicz等[6,最近,已经提出了支持向量机的一类版本,特别是由Tax [13]和Scholkopf等人提出的[12],实现的方法是找到包含大部分培训数据的最小体积超球体(在特征空间中)。Scholkopf等人的目标是找到一个二进制函数,在捕获大部分数据的“小”区域中取值 1,在其他地方取值-1。他们转换数据,以便原点代表异常值,然后找到数据和原点之间分离超平面的最大裕度。Scholkopf等人提示这两种方法在某些情况下是等价的。

在本文中,我们使用基于k的最近邻(kNN)算法的简单单级分类技术。选择单级kNN算法是因为,正如将在4.1节中讨论的,在我们最初的比较多级分类算法的实验中,发现多级kNN运行良好。在该算法中,当测试对象的局部密度大于或等于训练集(目标类)中最近邻的局部密度时,测试对象被判定为属于目标类[13]。

单类kNN分类器有许多可以调整的参数; 可以改变邻居的数量,从而计算到前k个邻居的平均k距离; 接受异常类别的阈值可能会改变; 此外,距离度量可以改变。图1显示了一个由Ford Focuses组成的目标类的例子。用于测试案例A(例如:大众高尔夫)是否在目标等级中的算法在下面被示出。

一级k近邻分类算法

将A分类为成员/不是目标类的成员

1.设置阈值(例如1)并选择k个距离的数量

2.在目标类中找到A的最近邻居,将之记为B并称为距离D1

3.如果k=1

在目标范围中找到B的最近邻并称为距离D2

否则

找到目标等级中B到k最近邻的平均距离,并称为距离D2

4.如果D1/D2gt;阈值 拒绝A作为目标分类

否则 接受A作为目标分类

4 车辆类型识别

对于这项工作,车辆的正面图像数据集经过数周的手记,其中包含了一系列天气和照明条件。该数据集由150个车辆图像组成-五个类别中每种类别有30个图像。这些车包含:欧宝可赛,福特嘉年华,福特福克斯,大众波罗和大众高尔夫。很自然地,只考虑每个车型/型号的一个版本,例如1998年的高尔夫必须被认为是与2004年高尔夫是不同的等级,因为这两个版本的外观完全不同。所有图像均包含大约一米高的位置不同角度捕获的单个车辆的正面视图。图像具有1600 x 1200像素。图2显示了每类汽车的样本。

该系统使用图像处理工具在Matlab中实现。图像被转换为灰度图像并自动裁剪以排除上半部分。下一步是检测图像中的边缘。边缘检测强调强度的急剧变化,因为强度差异可以对应于图像中特征的边界。在尝试了一些替代算法之后,选择Canny边缘检测[2]方法是因为它成功地找到了图像中的所有重要特征。在执行边缘检测之前,Canny边缘检测器首先使用高斯滤波器平滑图像以消除噪声。随后使用扩张来填充边缘检测器留下的空隙。膨胀是一种在二进制图像中“增长”或“增厚”对象的操作,并且被称为线性结构元素的形状控制[4]。

将图像处理为一系列边缘后,会自动识别图像的标准元素,如灯光和车牌。 然后为每个车辆导出固定长度和数字特征矢量,来表示图像的各个元素的几何特性。

最后,如下所述,使用不同的机器学习分类器来确定与每个向量相关联的车辆构造和模型。整个过程如图3所示。

  1. 实验结果

已经进行了两组实验。第一组实验在4.1节中描述。它们涉及比较数据集上的一系列标准多级分类器的性能,因为在先前的车辆识别/分类方法中使用了多级分类器。先前的方法已经使用了不同形式的特征提取,所以考虑如何使特征选择方法与标准分类器一起运作变得有趣。 所选择的特定分类算法是C4.5决策树、k-最近邻分类器和使用反向传播训练的前馈神经网络,这些在WEKA机器学习包[15]中的被实现和使用。这些算法中使用了WEKA的默认设置。

第二组实验的目的是评估单级分类器对于这项任务的性能。将第3节中描述的单类kNN算法在Matlab中实现,其性能评估在4.2节中讨论。

    1. 多级分类结果

图4比较了所考虑的三种多类分类算法的学习曲线。学习曲线给出了用分类算法实现良好性能所需的数据量。它是通过从总体数据集中随机抽样训练集构建的,其范围为整体数据集的5%到90%。每次用训练数据集构造一个分类器,并对剩余的数据进行评估。对每个训练组大小重复10次,并对结果取平均值。

学习曲线表明,k-近邻和神经网络算法的分类性能在比较中,在较低的训练集大小下,k-近邻算法比决策树算法的分类性能更好。曲线还表明,在使用kNN或神经网络的情况下,70%的数据集足够实现100%的分类准确度。

每个算法的性能也使用10times;10倍排序的交叉验证[1]进行评估。使用这种技术时,数据被随机分成十个部分,每部分依次展开,学习计划在剩下的九个部分进行训练。该过程重复十次,并计算十个部分的平均值。整个过程重复十次,然后计算平均值和标准偏差。表1列出了三种多类分类算法中每一种的训练数据的精度(平均值plusmn;标准偏差),使用10times;10倍交叉验证计算。

虽然kNN的结果在数值上高于其他两种算法的结果,基于10times;10-fold排序的交叉验证运行的配对t检验没有将该差异鉴别为在5%显着性水平以上的统计显着性。

    1. 单级分类结果

目标类别包含代表特定车辆(例如:欧宝Corsa)的数字特征向量的20个示例,并且该测试集合包含车辆的不同图像的数字特征向量的134个示例(目标类别10个,其​​他4个类别中的30个类型和4个未知数)。4个未知数是不在数据集中的汽车图像(例如:丰田卡罗拉)。对于每个目标类别,该过程重复多次并计算平均值。获得的结果如表2所示。如上所述,kNN单级分类器算法的性能还取决于若干预定义的选择。可以改变k值,从而计算到前k个邻居的平均k距离。计算出的k的最佳拟合值为k = 1。接受异常值类别的阈值也可以改变。实验进行的最佳阈值评估为1.5。一级分类器正确识别目标类别和离群类别的比例很高,但该方法的缺陷在于计算优化时高性能级别的阈值较高。

  1. 结论

车辆识别是发展智能道路交通监控及安全问题系统的重要技术。然而,由于车辆形状和颜色的多样性,车辆具有多种不同的外观,因此实现计算机系统的难度很大。

本文提出了一种新颖的车辆识别过程,从正面图像中识别车辆的品牌和型号(例如大众高尔夫)。 使用不同的机器学习技术对提取的固定长度数字特征向量进行测试和分类。在所考虑的多级分类器中,kNN和神经网络分类器似乎对这项任务最有效,且准确率超过99.5%。

还对单级kNN分类器进行了评估,因为单级分类器的好处是不会对具有一组封闭的类或具有充分代表性在实践中会遇到的数据的训练数据集进行假设。该分类器也表现出色,总体准确率约为97.5%。

显然,在这里提出的多级和单级分类器的结果之间进行直接比较是不合理的,因为实验方法学和背后的假设是完全不同的。特别是,通过将车型添加到未出现在训练集中的车辆类型时,我们发现多分类结果会被任意破坏,但不会损害单级分类器的性能。使用其他方法可以用来防范这个问题,例如使用两级分类器并使用一对一分类方案对它们进行训练。然而,这种方法在理论上不是一个好的想法,因为否定的例子将代表多样化的类别集合,并且仍然不会在统计上代表负面概念。

将来,我们建议测试其他形式的单级分类器在这个问题领域的表现。我们还打算收集一个不属于这里所考虑的含有任何类别的车辆图像库。

<s

剩余内容已隐藏,支付完成后下载完整资料</s


资料编号:[467533],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。