人机协作中快速动作识别和轨迹生成的相位估计外文翻译资料

 2022-03-23 07:03

英语原文共 16 页,剩余内容已隐藏,支付完成后下载完整资料


人机协作中快速动作识别和轨迹生成的相位估计Journal Title XX(X):1–16

sect;c The Author(s) 2015

Reprints and permission: sagepub.co.uk/journalsPermissions.nav DOI: 10.1177/ToBeAssigned www.sagepub.com/

Guilherme Maeda1, Marco Ewerton1, Gerhard Neumann2, Rudolf Lioutikov1 and Jan Peters1,3

摘要

本文提出了一种通过估计人类运动的进展来实现快速流畅的人机交互的方法。该方法允许在人体的观察为部分和被遮挡时,也被称为运动的阶段,来估计进展;这是在混乱的环境中使用运动捕捉系统时通常会遇到的问题。通过利用交互概率运动基元(ProMPs)的框架,相位估计可以对人类行为进行分类,并在人类完成他/她的移动之前生成相应的机器人轨迹。因此该方法适用于作为助手和同事的半自动机器人。由于观测值可能很稀疏,因此我们的方法是基于计算不同候选相的发现概率以找出最佳对准ProMP与当前观测值的相位。该方法与基于动态时间规整(DTW)的方法有着根本的不同,后者必须依赖运行时的一致测量流。相位估计算法可以无缝集成到交互ProMP中,使机器人轨迹协调,相位估计和动作识别都可以在单个概率框架中实现。我们使用7-DoF轻量级机器人手臂在单个和多任务协作实验中评估了该方法,该机器人手臂配备了5-finger手。我们将通过相位估计实现的精度与我们之前基于DTW的方法进行比较.

Keywords

Class file, LATEX 2ε, SAGE Publications

介绍

辅助和协作机器人必须有能力与人进行身体交互,安全和协同。然而为大量任务预编程机器人不仅乏味,而且不切实际,尤其是在任务不断增加或改变的情况下。此外,传统的编程方法不能适应于取决于人类行为动作的半自动机器人。一旦部署,例如在家庭或小型工业环境中,不需要专门的专家就可以使用半自动机器人。出于这个原因,本文提出了使用交互式学习,一种基于使用模仿学习的数据驱动方法(Schaal1999),用于学习涉及人类机器人交互的任务。在本文中,我们利用人类运动阶段分布来了解增强交互学习方法的好处。

协作机器人的一个重要方面就是能够识别人类的行为并迅速识别生成与预期人类轨迹匹配的相应的机器人轨迹。如图1所示通过观察人的运动, 机器人必须决定是否应该交出螺丝,盘子或者拿起螺丝刀;但是一旦动作被识别出来,机器人就必须在空间上协调这个动作。已经使用概率模型来解决动作识别或轨迹生成,但是为了实现这些模型,许多方法需要训练数据的时间对准,以便可以适当地捕获空间相关性(Calinon等人2007; Ye和Alterovitz2011; Dong等人Williams 2012; Ben Amor等2014; Perez-D#39;Arpino和Shah 2015)。在人类轨迹持续时间严重变化的情况下,这些模型需要可靠地测量位置,以便在查询交互模型之前在线对齐观测值。这个要求带来了一个实际重要的问题,因为在诸如医院,家庭和工厂的许多感兴趣的合作环境中容易出现遮挡和中断的位置流。其他方法将在相关工作部分讨论。

1 Intelligent Autonomous Systems Group, TU Darmstadt, Germany

2 Computational Learning for Autonomous Systems Group, TU Darmstadt, Germany

3 Max Planck Institute for Intelligent Systems, Tuebingen, Germany

Corresponding author:

Guilherme Maeda, Intelligent Autonomous Systems Group, TU Darmstadt, Germany

Email: maeda@ias.tu-darmstadt.de

Screw handover

Plate handover

Hold tool

图1所示。在决定采取何种行动之前,机器人同事必须认识到人类的意图。在这种情况下,是用手

递一个螺丝,把一个盘子递过来,或者为人类的伙伴拿着工具。一旦做出行动决定,机器人用人类

的轨迹来协调它的轨迹,例如,一个盘子的交接是成功的。这篇论文的目的是在人类运动受阻时,

让机器人在人类运动的早期阶段迅速采取这样的行动。

Action recognition

2011; 董和威廉斯2012; Ben Amor等人2014; Perez-D#39;Arpino和Shah 2015)。 在人类轨迹持续时间严重变化的情况下,这些模型需要可靠地测量位置,以便在查询交互模型之前在线对齐观测值。这个要求带来了一个实际重要的问题,因为在诸如医院,家庭和工厂的许多感兴趣的合作环境中容易出现遮挡和中断的位置流。 其他方法将在相关工作部分讨论。

我们提出的方法的原理是通过计算具有不同持续时间的模型的可能性来测试候选相位,而不是系统地计算轨迹之间的距离以获得精确的时间对准。这种方法允许用最少量的观测值查询模型。总体思路如图2所示,其中不同持续时间收集的训练数据首先归一化为单个标称持续时间。 运动原语的概率表示(Paraschos et al。2013)用于在标准化时间内学习分布参数。 在执行过程中,该方法会计算模型的时间变化,并由相位控制。 从图2中可以清楚地看出,给定相同的观察结果,持续时间为T1的模型比持续时间T2的模型更有可能代表当前的人体运动。

为了实现与机器人伙伴的协调,使用交互ProMP的方法(Maeda et al。2016),该方法允许机器人轨迹与人体运动的预测一起生成。 基本上,Interaction ProMP提供了一种模型, 该模型将描述在协作执行任务时描述人类和机器人基本轨 迹的参数。使用概率处理,通过推理生成机器人的轨迹,其中交互ProMP以人的观察为条件。机器人状态随后从得到的后验分布中采样。

Training data

Probabilistic model

T

Execution

T1

T2

图2.相位估计问题的动画:在稀疏观测下,可能有很多方法可以通过时间尺度不同的模型变体来解释观测。 每种变化导致不同的人类预测和协作机器人轨迹。假定最可能的时间缩放是产生人机协调。

本文的贡献是一个单一的概率框架,它允许机器人在线估算人体运动的相位,并将估算结果与不同的任务及其各自的机器人运动联系起来。 相位估计不仅可以让机器人做出更快的反应 - 因为轨迹推断可以通过部分甚至封闭的观测来完成 - 同时也不需要时间对准。 Maeda等人提出了本文的初始版本。 (2015)介绍了相位估计算法。 在这里,我们提供了一个更加详细的扩展版本,其中包含新的实验结果和大量额外的评估。 完整的概率框架,包括它与交互ProMPs的关系也有更详细的解释。

本文组织如下。 第2节涉及与框架相关的相关文献,重点是相位和时间表示。 第3节描述了提出的方法,简要介绍ProMPs,其次是交互ProMPs,相位估计和动作识别。 最后,第4节提供了关于该方法在单任务切换实验和多任务组装场景中的应用的实验和讨论。

相关工作

本节首先讨论解决时间变化下机器人运动生成或人类动作识别问题的方法。 通常的方法是基于轨迹的时间对齐。 然而,其他作品将时间视为转换概率,或将相位视为动力系统。 与我们的工作的一个重要区别是,绝大多数人要么解决动作产生问题或动作识别问题,因此缺乏原则性的,统一的方式来连接这两个问题。 由于实际应用,本节还简要讨论了切换文献。

动态时间调整(Dynamic Time Warping,DTW)(Sakoe和Chiba 1978)已经在很多机器人应用中用于时间对齐轨迹。 例如,作为估算由多个专家演示(Coates et al。2008)提供的最优隐藏轨迹或作为产生概率表示的预处理步骤的算法的一部分,特别是高斯混合模型(GMM)(Calinon et al。2007; Ye and Alterovitz 2011)以及其他形式的表述(Dong and Williams 2012; Perez-D#39;Arpino and Shah 2015)。 尽管DTW适用于离线处理数据,但其在线应用程序具有挑战性,因为其主要机制依赖于完整轨迹之间的系统距离计算。 Dong和Williams(2012)和Ben Amor等人 (2014年)介绍了在数据流一致时用于在线应用的DTW公式。

如图2所示,在部分/封闭观测下,使用DTW变得不切实际。Calinon等(2007,2012)提出明确地编码混合模型中的时间依赖性。因此,通过按时间直接调整模型,可以实现使用高斯混合回归的平滑时间解。然而,在我们的工作中,观察是由人类提供的,而不是受控机器人的运动。由于人类可以改变速度的方式很多,时间索引并不能反映运动的阶段,阻碍了直接调整模型的可能性。事实上,我们工作的一个重要区别是人与机器人之间的协调,而不是单个机器人的机器人场景。 (Calinon et al。2006)和(Lee and Ott 2011)中也使用隐马尔可夫模型(HMMs),特别是避免在线执行过程中对数据进行预处理。尽管时间信息由HMM的转移概率来解决,但HMM本身不足以完全表示轨迹的连续分布,通常需要额外的机制来克服其离散性质。

当速度或人类轨迹的目标已知时,可以缓解时间对准或相位估计问题。例如,通过区分一致的位置流来衡量或估计速度,消除了图2中所示的模糊性,并且允许实现能够应对非常快速动态的在线算法(Kim et al。2010,2014)。然而,这种方法依赖于一个没有遮挡和快速跟踪能力的计划环境;在半自动机器人预计将产生最大影响的环境中,例如在小型工厂,医院和家庭护理设施中,要求很难实现。恩格勒特和杜桑(Englert and Toussaint,2014)提出了一种反应适应运动计划者由于环境变化而产生的轨迹的方法。这是通过用动态相位变量测量任务的进度来实现的。虽然这种方法适用于已知目标的情况 - 由于相位是从到目标的距离估计的,所以半自动机器人不具备这样的信息:目标必须从人体运动的观察中推断出来,这又需要对阶段进行估计。

动力学运动基元(DMP)能够用相位变量调制时间变化(Ijspeert et al。2013)。

相变量用于控制编码强制函数参数的固定数量的基函数的扩展。 最近,Vuga等人提出了相变速率与运动速度有关的DMP的改进形式,该方法使用强化学习和迭代学习来加速执行机器人的运动而不违反预先定义的约束条件,例如携带装满液体的玻璃而不会溢出液体。 使用类似形式的迭代学习来学习演示的轨迹和参考轨迹之间的时间映射(Van Den Berg et al。2010)。 通过他们的方法,机器人能够比人类演示者更快地执行结扎手术的任务。 尽管这种方法利用相位或持续时间来调整速度曲线,但它们不能解决估计相位本身的逆问题。 ProMP以与DMP相同的方式使用阶段的概念,不同之处在于基础函数用于编码位置。 这种差异对交互原语的易用性至关重要,因为估计人类的强迫功能(DMP要求)在实践中并不平凡。

有几篇着作解决了动作识别问题。图形模型尤其被广泛使用。在人机交互中,HMM被分层次地用来表示状态并触发低级基元(Lee et al。2010)。在Koppula和Saxena(2013)使用条件随机场来预测人类可能的行为时,HMM也被用于预测工具交付装配线中同事的位置(Tanaka等,2012)。许多作者使用概率方法模拟轨迹(Dong and Williams 2012; Mainprice and Berenson 2013; Perez-D#39;Arpino and Shah 2015),已经解决了人类同事行为和动作的预测问题。通常,引用的方法并没有明确将机器人轨迹生成作为模型的一部分,通常将机器人运动的设计视为独立步骤,一旦识别动作就必须执行该步骤。 Koppula和Saxena(2013)已经预先编制了机器人轨迹,或者由运动规划师Mainprice和Berenson(2013)生成了机器人轨迹; Hayne等人(2016)。我们利用相关运动基元来生成机器人轨迹,使得动作识别和运动生成都由相同的概率模型给出,并通过类似的计算来解决。

虽然这里提出的一些场景最终导致了对

象的切换,但切换并不是交互ProMP的唯一应用,我们的方法不打算成为整个切换问题的独立解决方案。 切换由一系列复杂的物理和社交互动步骤组成。 正如之前由Strabala等人所研究的那样。 (2013年),这些步骤的范围从(1)建立馈赠者和接受者之间的联系的社会认知线索,(2)位置和作为偏好和社会可接受的运动的函数的结果轨迹的协调(Sisbot 和Alami 2012),以及(3)包含相互作用力和遵

全文共26027字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[15682],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。