环境，车辆和驾驶员特征在工作区中对危险驾驶行为的影响外文翻译资料-外文翻译网

英语原文共 9 页，剩余内容已隐藏，支付完成后下载完整资料

环境，车辆和驾驶员特征在工作区中对危险驾驶行为的影响

摘要

本研究旨在分析环境，车辆和驾驶员特征对工作区危险驾驶行为的影响。使用分类和回归树（CART）算法构建决策树，将危险驾驶行为与其影响因素之间的关系可视化。这种方法可以避免传统逻辑回归模型的固有问题，进一步提高模型的预测精度。本文基于密歇根M-94 / I-94 / I-94BL / I-94BR公路工作区驾驶行为数据，建立了由33个叶节点组成的决策树。恶劣的天气，恶劣的道路和光线条件，不完全的权限控制，缺乏交通控制装置，使得转向以及在旧车中驾驶都与风险驾驶行为有关。那些驾驶装备有安全气囊的车辆的中年司机更有可能采取危险行为。此外，中年男性司机比中年女性的司机更频繁地从事危险驾驶行为。在不同的旅行条件下，通道的数量表现出对危险行为的反作用。更具体地说，相比良好光照条件和多车道道路，在恶劣的光线或天气条件下的单车道公路上司机更容易从事风险行为。

绪论

工作区被定义为道路维护或建筑工程的一段道路，道路施工通常会持续很长时间（例如3天以上），维修工作经常占用1小时以上。必须在工作区附近进行限速并且关闭一部分车道以保证工人的安全。但是工作区的存在可能会导致交通拥堵并创建更复杂的交通环境。这是因为交通堵塞可能会增加驾驶者的沮丧感，使驾驶员愿意冒险。尽管道路阻塞也可能增加驾驶风险行为，其特征与工作区的特征大不相同。例如，阻塞可能不会持续很长时间，因为它可能会被迅速解除。工作区给司机的健康和安全带来了新的挑战，本项研究集中在工作区危险驾驶行为分析这个问题上。将高风险驾驶行为定义为以下行为：频繁加速，积极变道，粗心大意/疏忽大意/鲁莽驾驶，驾驶太快，未让步给行人，忽视交通控制信号和使用不正确的车道。

尽管最近工作区安全管理有所改进，但严重工作区崩溃的可能性很高，高风险的驾驶行为仍然是工作区严重碰撞的主要原因。例如，Bai和Li（2006）的报道指出，堪萨斯州92％的工作区域车祸与高风险的驾驶行为有关。目前的安全措施和政策不能充分减少有风险的驾驶行为（Hirsch，2003; Mayhew和Simpson，2002;Mayhew，2007; Senserrick等，2009）。由于这些原因，充分理解环境，车辆和驾驶员的特点如何影响工作区危险驾驶行为十分必要。

目前的一些研究已经确定这些因素可以显着影响危险驾驶行为（Harre等人，2000; Rhodes等人，2005; Oltedal和Rundmo，2006）。在这些研究中，应用单变量统计和多元回归方法比较高风险的驾驶行为和不同的群体（例如性别，年龄）两者之间的分布差异。但是，应该指出的是单变量统计技术只允许一次分析一个因素。这可能会导致通过分离单个因素进行分析来产生偏见或不正确的结果。一个差异的多元回归方法仍然存在固有问题，多元回归方法的一个假设是变量应该是独立的，并且是增加值，一个变量可以按比例减少来补偿或增加另一个变量的值以产生相同的效用。尽管如此，这种假设在司机行为分析中经常被打破。例如，单线道路上的司机多在恶劣的旅行条件下采取有风险的驾驶行为，而他们不太可能在良好的旅行中采取这种行为。因此，多元回归方法可能不能准确描述危险驾驶行为与其影响因素之间的关系。

决策树是流行的数据挖掘技术之一，而且它最近已被应用于表征驾驶员行为的另一种方法。这种技术的一个优点是它可以用图形描绘危险驾驶行为及其影响因素之间的关系。更重要的是，决策树可以避免多变量回归模型中出现的固有问题，并提供较高的预测精度。因此，本研究的重点是使用决策树方法分析工作区危险驾驶行为与环境/车辆/驾驶员的特征之间的关系，采用分类和回归树（CART）算法构建决策树。

1.1文献综述

许多研究已经采用单变量统计方法对风险驾驶行为进行了分析。Elliott等人（2006）评估了年轻司机在物质使用/环境影响和高风险驾驶行为之间的性别差异。他们的结果显示滥用酒精的女性风险驾驶事故少于滥用酒精的男性。Vassallo等人（2008年）审查了共现基于v2测试结果的一系列外部化和内部化问题的风险驾驶。他们发现并发和危险驾驶和物质使用之间的纵向联系（酒精，香烟和大麻的使用，暴饮）。

但是，单变量统计技术一次只能分析一个因素。通过在治疗过程中分离单一因素进行分析，可能会产生偏差或不正确的结果。Paschall（2003）通过使用逻辑回归技术调查了大学出勤率与风险相关驾驶指标（如酒后驾驶，安全带）之间的关系，结果显示大学生更可能喝酒开车也比较容易穿安全带。Oltedal和Rundmo（2006）探讨了性别和人格特征的影响，包括焦虑，兴奋寻求，攻击和烦躁，解释了37.3％的风险驾驶行为的差异。罗兹和Pivik（2011）研究了年龄，性别和风险的驾驶的关联，通过建立回归模型他们发现青少年司机有更多的风险驾驶行为。

尽管多元回归技术能够研究多种因素对危险驾驶行为的影响，但仍存在可变的交互问题。为了消除可变的相互作用问题，一些研究人员（例如Fernandes等人，2007）放弃了高度相互作用的变量，基于相关分析结果的相关性。然而，上述变量相关性仍然存在差异因为相互作用的因素在一定条件下可能没有互动效应。另外，环境，车辆和驾驶员特征（例如道路

条件，工作区速度限制，车辆年龄）对工作区的风险驾驶行为在之前的文献中尚未完全考虑。

1.2研究目标

这项研究的目的是重现决策树来调查工作区的危险驾驶行为。因为简单和高精度，CART（分类和倒退树）算法被用来重现决策树，对环境、车辆和驾驶员特征对危险驾驶行为的影响进行最终检查。

这项研究的贡献是双重的。首先，这项研究首次尝试分析环境和车辆特征对危险驾驶行为的影响。这项研究可以为交通工程师提出有用的参考，有效的措施/政策，以减少工作区危险驾驶行为。其次，发达的决策树可以避免变量交互问题。树中的图形显示使得

危险驾驶行为与其影响因素之间的关系容易理解。

2决策树

决策树是一个类似于流程图的树结构，其中的根节点位于顶部，叶节点位于底部。在一个决策树中，根节点包含所有记录并通过树遍历在节点处对数据进行分区的测试，每一个叶子节点对应于所有可能的测试结果。叶子表示组。要弄清楚一条记录属于哪一组，我们可以从树的根节点开始根据记录的特征沿着树形路径追踪。

有两种类型的决策树。当目标变量是分类，决策树被称为分类树。由于目标变量是连续的，决策树称为回归树。因为目标变量驾驶行为的结果是二分法（即驾驶行为不科学和冒险），再生决策树实际上是本研究中的分类树。由于简单，CART（分类和回归树）算法由Breiman等人（1984）应用于重现决策树。 CART算法由两个步骤组成：树生长和树木修剪，如图1所示。

2.1构建决策树

生成决策树的原理是对目标变量进行递归分区，以使后代节点中的数据总是比父节点中的数据更纯。当训练数据进入决策树的根节点，则执行测试以对于使用分裂准则的所有变量的所有可能的分裂进行搜索，衡量每个可能的分裂。在CART中，基尼指数是发展分类树的分裂标准，方差减少被用作回归树的分裂标准。由于驾驶行为是二元目标变量，因此本研究采用基尼系数分裂准则来选择哪个变量和分裂方案用于最佳分裂节点。详细的分割过程如下所示：

步骤1。对于给定节点t，根据基尼指数的定义计算节点杂质i（t）:

(1)

迭代节点

Yes

测试数据

剪枝的决策树

剪枝

剪枝能降低复杂度？

评估结点准确度

生成决策树

符合停止分支规则？

设置为叶子结点

选择最佳分支

最大全局偏差减少gt;0？

计算分支标准

搜索可能分支

训练数据

图1.CART算法构建决策树

(2)

是结点t中j类型的比例，|T|是结点t中的记录数量，||是属于j类的纪录数量。

第2步.对于变量x的所有可能的分支，计算分支s引起的父节点t上的误差减少：

(3)

其中是t的子节点数，是t的第j个子节点，是第j个子节点可能的记录。通过仔细搜索，我们选择与变量x相关的所有可能的分支，选择能最大程度减少误差的最佳的分支

(4)

第3步.通过重复第2步，所有变量的最佳分支可以确定。在这些最佳分支中，分支带来的最大全局误差减少为

(5)

上述分支过程可直接用于分类解释变量。对于有序的离散或连续的解释性变量，我们首先对父级中的记录进行排序，根据情况值按升序排列节点。此外，排序的记录被细分为几个组来创建类别。

2.2剪枝

过度拟合的树可能会导致在新的（测试）数据的真实错误率（Breiman et al。，1984）上出现很大的问题，因此需要从中删除一些对精度没有贡献分支。 CART利用成本复杂性修剪后的方法来修剪分支。成本复杂性是一个函数，其复杂度的加权和（即叶节点的数量）及其错误，如下所示

(6)

因此，修剪分支的程序可以描述如下：从树的底部开始，分别检查节点和子树，如果用叶子替换这个子树节点将导致更低的成本复杂度，则修剪这一分支。

3．数据描述

工作区域驱动程序行为数据来源于一个由密歇根大学管理的碰撞数据库系统。本研究所使用的驾驶员行为数据是从2004年到2008年密歇根州M-94 / I-94 / I-94BL / I-94BR高速公路工作区所获取的。每个记录数据包括以下信息：（i）环境特征; （ii）车辆特性;和（iii）驾驶员特征。环境特征包括关于路况（干，湿，泥泞），天气（晴朗/阴天，雨，雾/雪/强风），光照条件（日光;黑暗中照明，没有照明的黑暗，车道的数量，工作活动状态，速度限制，访问控制和流量控制设备等详细信息。车辆特性包括车辆年龄，车辆行动（停在路上，左转/右转，直行）和安全气囊（未配备，装备）。有关性别，年龄，酒精和自制力被视为驾驶员特征。

(7)

表1显示了环境，车辆和驾驶员特征。为了简单起见，二进制值将被分配给目标变量——驾驶行为。更具体地说，如果驾驶员在平等的情况下从事有风险的驾驶行为，则结果应该是一个唯一值。年龄基于质心聚类（CC）算法分为三个组（#39;不超过20岁#39;，#39;20-65岁#39;和超过 65岁）。在CC算法中，目标函数是最小化群体平均距离的总和（Arnold和Stokes，1999）。同样，车辆年龄和车道数量分别被分类分成三种基于CC算法的类型，如表1所示。

在M-94 / I-94 / I-94BL / I-从2004年到2008年94BR高速公路工作区记录了3502条记录。在这3502例中，有1841例涉及不同类型的高风险的驾驶行为，如不小心/疏忽/鲁莽驾驶，注意力不集中，速度太快，不适当/没有信号。属性#39;#39;未编码和错误#39;#39;将由以下热门版本推算方法。使用另一个属性替换的概率#39;#39;未编码错误#39;#39;属性取决于这个比例替换属性。例如，4％的案例分配了“饮酒”属性为酒精变量，而96％的情况将“不饮酒”属性分配给酒精变量。因此，alcohol变量的#39;Uncoded＆Errors#39;#39;属性有4％的概率被“饮酒”属性所取代，96％的概率被“非饮酒”属性所取代。为了建立一个分析风险驾驶行为的决策树，收集到的数据分为两组：一组为训练数据，另一组为测试数据。更具体地说，70％的收集数据（2451组）被随机选择进行训练，30％的数据（1051组）用于测试。

变量	值
目标变量
驾驶行为	0=安全;1=危险
环境特征
道路状况	良好;一般;糟糕
天气	雾/雪/大风/;雨;晴/多云
光照	白天;夜晚弱光;夜晚无光
车道	1;2-3;4及以上
工作行为状态	无;有
限速	不超过40;40以上
交通管制	完全管制;无管制
流量控制设施全文共9308字，剩余内容已隐藏，支付完成后下载完整资料资料编号：[11969]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

环境，车辆和驾驶员特征在工作区中对危险驾驶行为的影响外文翻译资料

您可能感兴趣的文章

登录

注册

找回密码

您可能感兴趣的文章