像人类一样泊车:直接轨迹的规划解决方案外文翻译资料

 2022-04-12 08:04

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


像人类一样泊车:直接轨迹的规划解决方案

Wei Liu, Zhiheng Li, Member, IEEE, Li Li, Senior Member, IEEE, and Fei-Yue Wang, Fellow, IEEE

自动车辆的停车控制问题仍有待解决。现有的方法通常首先设计一个不完全匹配车辆动态约束的参考停车轨迹,然后应用某些在线负反馈控制,使车辆大致跟踪这个参考轨迹。本文提出了一种新的轨迹规划方法,该方法直接将实际的停车轨迹和转向动作联系起来,找到最佳的停车轨迹。实验表明,该方法具有较高的可靠性和较低的计算成本。此外,本文还讨论了如何利用模型不确定性引起的轨迹规划误差。我们指出,前馈轨迹规划与在线反馈控制相结合可以解决此类问题。

关键词:自动车辆,停车,轨迹规划。

一·论文简介:

自动驾驶汽车的设计是为了完成大多数驾驶任务[1]-[3]。这样的要求变得错综复杂,即使是在每天每个司机都会遇到的交通场景中:停车场景。一般来说,自动车辆的停车控制问题可以定义为:找到一种控制策略,引导自动车辆从给定的初始位置向给定的最终位置和方向移动[1]。

通常,停车控制器采用分步控制策略,将当前状态(位置/方向)与给定的最终状态(位置/方向)进行比较,选择当前阶段的转向动作[4]-[8]。然而,这个方向的大多数现有方法都使用启发式规则。确定转向操作,这样就很难证明所选的操作是有效的还是最优的。然而,如果泊位周围存在障碍物,仅仅使用启发式规则有时很难选择正确的转向操作。

为了解决这个问题,研究人员采取间接的轨迹规划方法[9],[17]认为一个等价的形成停车控制问题:找到一个有效的轨迹沿着自主车辆可以跟踪后,从给定的初始位置和方向移动到给定的最终位置和取向[1]。

显然,一个特殊的停车控制策略完全决定了一个停车的轨道,反之亦然。因此,如果计划了有效的轨迹,那么我们就可以确定一系列的转向操作和这个轨迹。注意到有无限的轨迹将给定的初始状态与给定的最终状态联系起来,我们通常需要找到最短的轨迹。

这些轨迹规划方法的主要问题是,我们必须充分考虑车辆动力学,严重影响候选轨迹的几何性质。与许多移动机器人转向角度可以很容易地改变360度的控制问题不同,自动驾驶车辆的转向角是有限的。因此,许多可以为小型移动机器人制造的运动不能被自动驾驶汽车复制。

大多数现有的间接轨迹规划方法通过设计一个自动车辆可以近似遵循的参考停车轨迹来解决这个问题[9]-[17]。这样的参考轨迹通常属于一组特殊的曲线(如多项式曲线[1],[14])beta;-spline曲线具有独特的几何属性简化的表示和规划预期的轨迹。在参考停车轨迹和实际轨迹之间的差距(通过应用与参考停车轨迹相对应的转向动作产生)将通过添加一个特定的负反馈控制器来调整转向动作,使车辆大致跟踪这个参考轨迹。

然而,这样的轨迹规划仍然是间接的和麻烦的。在轨道的某些部分,设计的停车轨迹与车辆的实际轨迹之间的距离可能过大。这些偏差可能会导致车辆撞上障碍物,特别是在需要倒车的时候。

为了解决这一问题,首先提出了一种直接的轨迹规划方法[18]。这个新颖的解决方案的关键思想是:

图1所示。自动停车直接轨迹规划的解决方案框架。

列举所有可能的停车轨迹,一辆汽车可以制造并学习建立任何初始/最终状态对之间的直接关系,以及相应的转向动作和停车轨迹。基于此学习结果,如果给定初始/最终状态对,自动车辆将很快回忆起所需的转向动作/停车轨迹;如图1所示。

根据我们的调查,许多成熟的司机说,只要看到最终泊位的位置/方位,他们就会知道在他们真正开始停车之前,他们会采取什么行动来停车。这一事实表明,在停车之前,驾驶员经常会想起正确的停车轨迹。

[18]中提出的直接轨迹规划方法实际上是对人类驾驶员的模仿。该方法的核心是正确地建立初始/最终状态对和停车轨迹之间的关系。在[18]提出了一种神经网络实现这一目标,类似于著名的Alphago所使用的球员最近提议在[19],它使用一个深层神经网络学习围棋中所有可能的场景,以找到合适的移动在一个给定的阶段。幸运的是,停车场的解决方案空间远小于Alphago的解决方案空间,所以我们不需要像Alphago这样的超级计算机来学习这种关系。

然而,在[18]中提出的神经网络仍然非常复杂。因此,我们进一步分析了停车问题,并发现它可以在一个多阶段的风格中得到解决。

[18]中的轨迹规划方法是一种单阶段的规划方式,它能让人回忆起停车的精确轨迹。显然,解决方案空间的大小随着轨迹的时间长度而增加。如果我们想用一个可接受的分辨率来对解决方案空间进行采样,那么计算成本可能是巨大的。

然而,我们发现没有必要确定准确的整个轨迹。实际上,轨道的下半部分最重要的是将车辆移动到理想的泊车位。所以,我们可以用一个粗略的分辨率来对轨道的前半部分进行采样,然后再用更精细的分辨率来对轨迹的下半部分进行采样。这将大大降低直接停车轨迹规划的计算成本。

直接规划方法的另一个显著特点是采用动态模型而不是运动学模型来描述车辆运动。这个选择是基于以下考虑:

首先,我们的目标是建立一个通用的轨迹规划方法,不仅适用于停车问题,也适用于其他车辆运动规划/控制问题(例如车道变化规划)。与运动学方法不同,建议的解决方案框架允许较大的车辆速度,并可扩展到其他车辆运动规划问题。

第二,直接轨迹规划方法的复杂性低于传统的机动车辆运动模型的间接轨迹规划方法。在运动学的方法中,我们需要首先规划轨迹,然后设计一个控制器,使车辆尽可能接近预定的轨迹。适当控制器的设计成本显著提高了计算复杂度。在直接规划方法中,节省了适当的控制器的设计成本。

第三,很难使车辆在严格跟踪间接轨迹规划方法中获得的理想轨迹。

第四,使用直接规划方法,我们可以明确地考虑车辆的动态约束,而不是考虑车辆的运动学模型,这些模型要求车辆以非常慢的速度移动。因此,在某些情况下,我们可以选择一个相对高速的特定轨道,以更高的速度(同时在更短的时间内)将车辆停靠在泊位上。这个函数在某些应用程序中非常有用。

此外,我们还讨论了如何处理由模型不确定性引起的轨迹规划误差。我们指出,前馈轨迹规划与在线反馈控制相结合可以解决此类问题。

为了更好地解释我们的新发现,本文的其余部分安排如下。第二部分首先解释了如何对轨迹空间进行采样,然后如何学习这种关系,最后如何做一个直接的停车轨迹规划。第三节讨论了一些重要的问题,例如如何使用经验轨迹数据库来避免未建模的车辆动力学引入的错误。最后,第四节对本文进行了简要的总结。

二.轨迹规划的解决方案

A.控制轨迹映射的车辆动力学模型。

在不丧失通用性的前提下,我们考虑了前车的停车问题和全转向车辆的停车问题[1], [20], [21]。

为了说明如何对轨迹求解空间进行采样,我们采用了著名的自行车模型来描述车辆的动力学[22]。假设一辆车在一个平面上运行,自行车模型的特征如下图2所示的变量和表。我。

在这里,重心(CG)的参考点中心被选择在车身的重心位置。它的坐标谷(x, y)表示车辆的位置。车辆

速度v在参考点CG定义。航向角psi;是指角从x轴的纵轴车辆身体AB。浸玻片角beta;是角的纵轴车辆身体AB的方向车辆速度。

根据[20]-[22],可以将自行车模型的状态空间模型写成。

系数关系:

世界坐标的设置如下:原点是在车辆初始时刻的重心处设置的;正x轴的方向假定为指向车辆的头部。让vx和vy分别是v在X轴和Y轴上的投影。参照图2,如果车辆前进,我们可以得到。

vx = v cos(beta; psi;)v = v sin(beta; psi;)

否则,如果车辆倒退,我们就有。

vx =minus;v cos(beta; psi;)v = v sin(beta; psi;)

术语和代表值

基于Eq.(1)-(6),我们可以很容易的计算出车辆在停车时的位置和方向。

B.采样控制-轨迹映射关系。

在动态模型的基础上,我们可以计算出车辆的产生轨迹,给定车辆速度(速度的值)和在一个时间范围内的前转向角。这将产生一个样本的输入车辆速度/转向角度与轨迹之间的映射关系。如果我们获得足够数量的样本,我们就可以学习这个映射关系。

注意在停车过程中车辆的速度相当慢,可以假定车辆的启动和停止过程是瞬时的。在实践中,我们可以选择车辆速度的其他值,建立更复杂、更丰富的映射关系。为了简单起见,我们只考虑车辆在整个停车过程中保持v = 1m/s的情况。

在本文中,我们使离散控制变量的值delta;f沿着时间轴。它,允许停车轨迹可以通过分配不同的转向序列生成delta;N f = {delta;f(1)hellip;hellip;delta;f(N)} N的时间片段。在每次段,选择转向角从一组预选转向S1 = {delta;1,delta;2,hellip;,在这段时间内保持不变。这里K是我们考虑的转向角的个数。通常,我们统一样本的允许值范围delta;f,[minus;delta;max,delta;max]。因此,控制动作空间被采样到一个由K N转向角序列组成的集合I1中作为其元素。枚举允许的控制序列,我们可以建立映射关系的草图。

作为本节的一个示例,我们考虑使用表中给出的参数的车辆。我这个车的大小是假定为3.7米times;1.8米。假设车辆的停车行为必须在12秒内完成,并统一分为4段。每段的时间间隔是3秒。

操舵角选择从集合S1 = { 0.6,0.4,0.2,0,minus;0.2minus;0.4minus;0.6 }。设置N = 4和K = 7,我们可以生成7的4次方 = 2401的轨迹,如图3a所示。

图3 b显示了一个特殊的轨迹与转向后果delta;4 f = { 0.6、0.4minus;0.6minus;0.4 }和图3 c给出相应的转向角序列。这一系列的转向操作确实实现了平行停车。

C.单级直接轨迹规划。

如[18]中所指出的,如果采样分辨率足够高,我们可以枚举所有可能的控制动作及其对应的轨迹(以及相应的初始/最终状态对)。这实际上为自动车辆建立了一个完整的检查表。每次给定初始/最终状态对时,我们都可以检查这个查找表来找到所需的控制操作。

我们将这种轨迹规划方法称为单级直接轨迹规划,因为整个控制动作序列将在停车过程开始时生成。间接轨迹规划方法[9]-[17]和直接轨迹规划方法[18]的区别在于,所表述的轨迹是由近似曲线或车辆动力学产生的。

对于数值的简单性,我们将所有发现的轨迹以离散形式存储,离散化的时间间隔选择为0.1。为图3所示的数值例子,我们将存储2401times;120 = 288120个候选国家的对手可能的最终状态。换句话说,轨迹将被存储为连续的一系列状态。最后得到的轨迹集记为R1。如果给定的最终状态与存储在R1中的任何状态之间的距离小于给定阈值,那么我们说,给定的最终状态可以与存储的轨迹相匹配。在这种情况下,可以正确地回忆所需的控制操作。

需要指出的是,我们不需要将规划时间进一步划分为直接轨迹规划过程。相反,我们可以允许不同的最终状态对应于相同的控制动作。

由于可能存在多个连接给定OD对的轨迹,所以我们只存储每个OD对的最优轨迹/动作。为了达到这个目标,我们定义了一个轨迹的性能指标。

终端时间tau;,c(t)是沿着轨迹曲率在时间t。(ytau;xtau;psi;tau;)的最终状态是车辆和(x p,yp,psi;p)被认为是国家的车辆完全停在停车泊位的中心。h是积分

图3所示。抽样控制轨迹映射关系的说明。(a)使情节清晰,只绘制出2401条轨迹的1/10;(b)每一秒车辆位置和方向的第145条轨道的详细图;(c)相应的转向行动和车辆状态的变化。

由函数f (x, y)定义的曲面,与代表车辆的矩形区域有关。

其中Dt是矩形区域代表的车辆状态。越靠近泊位中心,积分越小。

函数f (x, y)是在一个新的坐标中定义的,它的原点位于泊位和轴线平行的中心。

图4所示。

位于泊位的两个垂直边缘。它的形成是这样写的。

其中k为泊位长度与宽度之比。

图4给出一个示例的多对一的映射,在最终状态(x1,y1,psi;1)=(4.3,4.0,0.9)绘制的颜色黑色和最终状态(x2,y2,psi;2)=(10.1,4.8,0)在红色对应相同的策划指导后果delta;4 f1 = { 0.6、0.4minus;0.6minus;0.4 }。停放车辆的最终状态(x1,y1,psi;1)而不是最终状态(x2,y2,psi;2),我们需要监控停车过程并适当地停止当车辆到达(x1,y1,psi;1)。

实现一个能够精确移动车辆停车控制给定的最终状态,控制动作空间的大小可能是巨大的,完整的查表的存储和查询成本成为阻止我们应用的主要困难等单级轨迹规划。

在[18]中提出了一个基于人工智能的解决方案来解决这个问题。正如[23]中所建议的那样,查找表被传输到一个深度神经网络中,该网络学习映射关系。

如图5所示,我们将车辆速度和最终状态设置为这个特殊的深度神经网络的输入(假设我们将坐标转换为零),并将期望的控制动作作为这个特殊神经网络的输出。由于深度神经网络的压缩能力,我们可以使用更小的存储和查询成本达到相同的目标。

然而,训练深层神经网络的计算成本成为一个新的问题。要保证深层神经网络正确地学习了映射关系,仍然是困难的。

图5所示。[18]中提出的深层神经网络结构。

D.多级直接轨迹规划。

在本文中,我们提出了一个新的解决方案。这个解决方案的关键在于两个事实:

1)直接轨迹规划过程可以分解为几个子过程,每个子过程的计算成本可以大大降低;

2)停车轨迹的后半部分通常比前半部分更重要,精确地将车辆移动到所需的停车位置/方位。

更准确地说,我们首先在相对较

全文共9883字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[14082],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。