车路协同环境下的实时自适应信号控制外文翻译资料

 2021-12-09 10:12

英语原文共 14 页

车路协同环境下的实时自适应信号控制

Yiheng Feng , K. Larry Head, Shayan Khoshmagham, Mehdi Zamanipour

摘 要:现实中交通信号控制策略的状态主要依赖于基于基础设施的车辆检测数据作为控制逻辑的输入。基于基础设施的检测器一般是不能直接测量车辆位置和速度的点检测器。随着无线通信技术的进步,车辆之间能够进行通信,并且能够与新兴的互联车辆系统中的基础设施进行通信。从联网车辆收集的数据提供了一个更完整的十字路口附近交通状态的图像,并可以用于信号控制。提出了一种基于连通车辆数据的实时自适应信号相位分配算法。该算法通过求解一个两级优化问题来优化相序和时间。考虑了两个目标函数:车辆总延误最小化和队列长度最小化。针对连通车辆渗透率较低的问题,提出了一种基于连通车辆数据估计未装备车辆状态的算法,为相位分配算法构建完整的到达表。在VISSIM中模拟了一个真实的交叉口,以验证算法的有效性。结果与各种连接方式的汽车市场渗透率和需求水平进行了比较,并进行了优化。一般而言,该控制算法在高渗透率情况下总时延可减少16.33%,在低渗透率情况下总时延可减少类似时延,优于感应控制。不同的目标函数导致不同的信号时序。车辆总延误的最小化通常会产生较低的车辆总延误,而队列长度的最小化则以更均衡的方式服务于所有信号配时阶段。

关键词:车路协同;自适应交通信号控制;动态规划;车辆状态实时优化

1. 引言

1868年,英国威斯敏斯特安装了第一个彩色交通灯,至今已有150年的历史(Webster and Cobbe, 1966)[1]。信号控制系统在硬件和控制策略上都经历了巨大的发展。目前,有三种主要的交通控制策略:固时控制、感应控制和自适应控制。

固时控制系统利用历史交通数据为一天中的不同时间创建计时计划(TOD),以解决需求波动问题。假设在某个特定计划的整个时间段内,交通需求保持相似。然而在现实中,交通需求可能会快速波动。感应和自适应控制策略是为了解决实时性这个问题而开发的。感应控制从基于基础设施的传感器(如环路检测器、视频检测器或雷达)收集实时数据,并应用简单的逻辑(包括相位调用、绿色扩展、间隙输出和最大输出)来做出控制决策。目前的自适应控制策略是利用类似的实时传感器收集交通数据来预测近期的交通状况,并根据定义的目标函数寻找最优的时序来进行控制决策。目前几种自适应信号控制系统包括ACS-Lite (Luyanda et al., 2003), SCATS (Sims and Dobinson, 1980), SCOOT (Bing and Carter, 1995), OPAC (Gartner, 1983), MOTION (Brilon and Wietholt, 2013), UTOPIA(Mauro and Taranto, 1989) and RHODES (Mirchandani and Head, 2001)[2-8]

目前的自适应信号控制系统主要依赖于基础设施传感器的数据,包括路面或视频环路检测器。使用环路检测器有两个限制。首先,环路检测器是点检测器,只在车辆通过检测器时提供瞬时车辆位置。当车辆通过检测器后,无法直接测量车辆的状态(位置、速度、加速度)。其次,检测系统的安装和维护成本较高。如果一个或多个环路检测器出现故障,则自适应信号控制系统的效果会大大降低。

随着无线通信技术的进步,车辆之间可以通过专用短程通信(DSRC)进行通信(V2V)并与基础设施(V2I)进行通信,被称为车路协同。美国交通部建议将车路协同技术应用于安全、移动和环境领域(美国交通部智能交通系统联合项目办公室,2014)。利用V2I通信的移动性应用程序能够获得十字路口附近车辆状态的完整的图像。联网车辆的数据提供实时车辆位置、速度、加速度等车辆数据。基于这种新的数据来源,交通管制员应该能够做出“更明智”的决定。收集联网车辆数据依赖于单个基础设施设备(无线电),比安装和维护一套检测器(如视频或循环)的成本要低得多。如果一个或多个车载设备由于通信失败而无法与交叉口通信,则只会略微降低渗透率,对系统性能的影响较小。如果基于基础设施的设备出现故障,交叉口将返回到实际感应或固时控制的状态。

本文的目的是提出一种车路协同环境下的实时自适应交通控制算法。该算法是基于对相位控制优化算法(COP) (Sen and Head, 1997)[9]的改进,该算法用于RHODES自适应交通控制系统(Mirchandani and Head, 2001)[8]。原COP算法是基于A、B、C、D等阶段序列,其中阶段A可以表示阶段1、5(记为A),也可以表示阶段2、6(记为B),但不支持灵活或双环的阶段序列。本文提出的相位分配算法采用一种基于双环控制器的两级优化方案,同时对相位序列和持续时间进行优化。

依赖联网车辆数据进行信号控制的主要问题之一是,联网车辆的渗透率很低,至少在未来几年是如此。之前的研究表明,即使在联邦政府强制要求在美国制造的新型轻型汽车上安装DSRC比率后,美国也没有改变这一状况。在美国,联网汽车可能需要25-30年才能达到95%的普及率(Volpe国家交通系统中心,2008)。因此,为了为交通控制提供更准确的到达数据,需要从联网车辆的数据中估计未装备车辆的位置和速度。

本文的其余部分组织如下。第2节提供了一个简短的关于信号控制与连接车辆的数据的文献综述。第3节介绍了在真实路网和仿真环境下,为测试信号控制在车路协同环境下的应用而开发的系统框架。第4节和第5节分别描述了相位分配算法和未装备车辆位置和速度的估计算法。第6节给出了基于VISSIM模型的两种算法的测试结果。第7节以结论和进一步的研究结束本文。

2. 文献综述

利用车辆数据进行信号控制已经有了一些研究。与环路检测器数据不同,联网车辆的轨迹数据提供了更多的车辆状态信息。利用联网车辆的数据,交通控制决策可以对实时交通状况做出更动态的响应。

Priemer和Friedrich [10]利用V2I通信数据开发了一种分散自适应交通信号控制算法。该算法以相位为基础,将时间离散为5s区间。预测时间为20秒。该方法的目标是最小化总队列长度,并通过动态规划和完全枚举来解决这个问题。Goodall等 [11]提出了一种用于信号控制的预测微观仿真算法(PMSA)。该算法从联网车辆的位置、航向、速度等数据中提取数据,利用微观仿真模型对未来交通状况进行预测。选择15秒滚动水平策略来优化延迟或延迟、停止和减速的组合。该算法考虑了多个市场渗透率,并根据装备车辆状态估计了未装备车辆状态。然而,由于并行仿真的要求,该算法不能实时应用于预测未来交通状况。

He等人[12]提出了一种基于V2I环境下多模式交通信号控制框架PAMSCOD。提出了一种基于车头的排识别算法来识别网络中的伪排。通过求解一个混合整数线性规划(MILP)问题,根据当前的交通状况、控制器状态、排数据和优先级请求,找出最优信号方案。基于VISSIM模型的仿真表明,PAMSCOD可以考虑公交和客车两种模式,在饱和不足和饱和过盈的情况下都可以减少延误。结果表明,40%的渗透率是有效运用该算法的关键。PAMSCOD的一个限制是,随着交通需求的增加,计算需求显著增加,因为决策变量的数量与交通需求成正比,目前无法实时求解。在相同的V2I框架下,He等人[13]考虑协调和车辆驱动,将应急车辆、公交车辆、商用卡车和行人等多模态优先控制集成在一起。在公式中将信号合作视为一种虚拟的优先请求。然而,在优先级控制框架内使用传统的车辆驱动逻辑对非优先级车辆可能不是最优的。Lee等[14]提出了一种基于联网车辆数据的累积出行时间响应(CTR)实时交叉口控制算法。累计行驶时间定义为车辆从进入临近链路到当前时刻所经过的时间。行车时间包括交叉口的车辆延误。该算法利用卡尔曼滤波估计低市场渗透率下的累计出行时间。下一阶段是组合旅行时间最长的阶段。论文指出,至少需要30%的市场渗透率。

互联车辆的市场渗透率是决定控制算法有效性的关键参数。联邦政府要求在美国制造的所有新型轻型汽车上安装DSCR装置后,大约25年内,联网车辆渗透率将稳步增长至接近100% (Goodall, 2013)[15]。一些创新的想法(Fajardo et al., 2011;Lee和Park, 2012)[16-17]基于100%的车辆渗透率提出,在这种情况下,交叉口的交通信号被移除,交叉口知道所有车辆的轨迹,并对每辆车进行完全控制。这些算法被设计用来控制车辆的单独运动,这样车辆就可以安全地通过交叉路口而不会发生碰撞。仿真结果表明,该方法能显著减少车辆的延误和行驶时间。

3. 系统概述

为了测试车路协同环境下的信号控制算法,开发了一个如图1所示的测试平台。该平台支持真实道网和仿真环境。

在真实的道路网络中,联网车辆配备车载设备(OBE),能够通过DSRC无线电向路边设备(RSE)广播基本安全信息(BSM)。BSM主要是在汽车工程师学会(SAE) (Society of Automotive Engineers, 2009)[18]中主要定义的一类消息类型。

图1 车路协同环境下信号控制系统框架

为了安全的应用程序。每个BSM包含车辆位置、速度、航向、车辆系统信息和车辆大小信息。每个BSM通过DSRC无线电以10赫兹广播,当车辆在交叉口无线电范围内时,RSE可以接收到BSM。在VISSIM仿真环境中,使用API接口提供相同的BSM广播功能。RSE中有三个组件:车辆信息数据库、信号控制组件和信号控制接口。车辆信息数据库从OBEs(或VISSIM API)接BSMs,并对每个车辆轨迹进行解码和临时保存。联网车辆离开DSRC范围后,删除车辆轨迹,保护隐私。该组件还基于车道的地图在道路上定位车辆,计算所需的服务阶段,并估计每个联网车辆的到达时间(ETA)。信号控制组件在解决信号时序优化问题之前,从车辆信息数据库中请求车辆轨迹。

4. 相位分配算法

相位分配算法根据预测的车辆到达时间分配信号的相位序列和持续时间。该算法由两层优化组成。在上层,将动态程序DP应用于定义为标准NEMA环形屏障结构中两个屏障之间的收集阶段的每个屏障组,如图2所示。该公式可以推广到更一般的环势垒控制器,但本文仅限于对偶环。将上一层的性能函数计算传递给下一层。较低层次(单个阶段)的优化被表述为效用最小化问题。

用以下符号来定义算法:

p:各环和势垒组的相位指标。

r:各势垒组的环指数。

j:势垒群指数。

T:规划视界内的离散时间步长,以秒为单位。

J:停车前DP计算的最后一段。

xj:表示势垒组j长度的控制变量。

sj:状态变量,表示分配给势垒组j的时间步长。

Xj(sj):给定势垒组状态。sj的一组可行控制决策。

fj(sj,xj):给定势垒群状态sj和控制变量xj,在j阶段进行性能测量。

vj(sj):给定势垒群状态sj的值函数,该状态sj表示当前和之前所有阶段的累积性能度量。

Rp,r:相变区间,即r环中p相的黄色变化和红色间隙时间之和。

Gp;r min: 环r中p相的最小绿色时间。

Gp;r max:环r中p相的最大绿灯时间。

Xmin j:第j阶段可能的势垒组长度的最小值。

Xmax j:第j阶段可能的势垒组长度的最大值。

gp,r: 环r中p相的绿灯时间。

n:计划时间指标。

lp; r(n):队列长度的阶段在时间n p环r。

qp; ra(n):流量阶段p到达时间在环r n。

qp;r d(n):离开流量阶段在时间n p环r。

d(gp; r; Rp; r):延迟函数相p环r给予绿灯时间gp; r相变Rp; r

A(p;r; n) : 第p阶段在第n时刻到达r圈的车辆数量。

图2 带势垒组定义的环形势垒控制器结构

4.1 上层

上层DP使用正向和反向递归。正向递归计算性能度量根据决策和状态变量,记录各阶段的最优值函数。落后的递归从向后工作的最后阶段开始检索最优策略。向前和向后递归的细节如下所述。

前向递归的基础是将时间分配给每个势垒组作为DP中的阶段。考虑每一个障碍作为一个阶段,该算法规划了尽可能多的阶段来获得最优解。环和相的定义图2中定义了一个势垒组。每个势垒组的相被分成两个环。r代表环指数和p表示环内的相位指数。由于交通需求的可变性,该算法没有产生一个固定的循环长度。

根据信号定时参数计算出最小和最大允许阻挡群长度方程式所示。(1)、(2)、参数包括最小绿灯、最大绿灯

资料编号:[5960]

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。