用于驾驶的语音输入应用:在模拟器研究中使用不同级别的保真度外文翻译资料

 2021-11-07 10:11

英语原文共 19 页

用于驾驶的语音输入应用:在模拟器研究中使用不同级别的保真度

A. W. Stedmon 1 J. Richardson 2 S. H. Bayer 2

R. Graham 2 C. Carter 2 M. Young 3 B. Hasseldine 1

摘要

运输模拟器提供了隔离特定变量的潜力,以测试对照实验中的差异。如果模拟器在从低端,基于纸张的原理图到高端完整复制系统的频谱上运行,则存在与它们可能“适合目的”相关的基本问题。模拟器的物理和功能保真度是其成功实施的关键因素,以及面部有效性和生态有效性的问题(研究结果从一种设置推广到另一种设置的程度)。本文探讨了作为英国政府LINK内陆地面运输(IST)计划的一部分进行的多项实验的不同保真度水平,该计划研究了语音输入系统在汽车应用中的潜在影响。研究结果表明,并不总是需要进行高端模拟,特别是在探索性研究中,其中确定了基本原则以供进一步检查。然而,需要更现实的驾驶任务和背景来提高更高水平的保真度并提高结果的生态效度。

将知识应用到实验室之外并进入现实世界。

关键词: 驾驶模拟,语音输入,人为因素,保真度,有效性

1使用模拟器进行运输研究

在运输研究中,现实世界数据在真实的使用环境中提供了人机交互(HMI)的有价值的视角,但这并不总是实用的,或者确实是道德的,特别是如果在可能危及个人或公共安全的情况下调查用户行为[ 1]。因此,模拟器提供了研究道路使用者如何通过更高程度的实验控制(通常在实验室环境中)执行复杂任务的机会,但可能会牺牲现实世界的保真度和生态效度[2]。模拟器的保真度和有效性(例如它们代表真实系统的程度以及它们准确评估调查中的现象的潜在信心)是制定适当研究解决方案的关键因素。本文的目的是从许多研究中吸取参考,这些研究调查了语音输入系统在汽车应用中的潜在影响。在这样做时,研究表示不同级别的模拟器保真度和有效性,然后与模拟谱的基本原理相关联。

从历史上看,模拟器逐渐发展为培训工具,从技术上讲,它们提供从部分任务培训师到高保真复制应用程序的各种解决方案。但是,没有先决条件,模拟器应该是一个完整的副本,或者它们成为模仿现实世界用户体验的每个方面的奴隶尝试[1]。模拟可以包括非技术应用(例如基于纸张的原理图和纸板模型,小组工作或面对面角色扮演)到简单的基于计算机的桌面模拟,情境或设备仿真和基本培训系统[1 ]。对模拟器技术的回顾表明,模拟器在许多运输研究模式中很常见[1]。航空工业一直是模拟应用发展的主要推动力,最早的飞行模拟器是在两次世界大战期间开发的,并证明是具有成本效益的培训工具。这导致了模拟器培训投资和扩展到其他运输模式(例如海事,汽车甚至铁路应用)。除了培训最终用户外,运输模拟器也已发展成为强大的研究工具。已经建立了列车模拟器并用于研究铁路基础设施问题以及信号设计和潜在认知因素,驾驶性能和路线安全性的变化[3]。在公路运输中,汽车模拟器已被用于研究驾驶员行为,使用先进的语音识别接口[4],卫星导航和驾驶员信息系统[5,6]以及概念车辆控制系统的评估[7,8]。最近,摩托车模拟器已经开发出第一个专为骑车行为研究设计的模拟器[9,10]。

1.1 使用模拟器进行研究

从方法论的角度来看,实验室和实地研究都有优点和缺点。虽然假设现实世界为研究提供了更大的有效性[11],但更难以控制可能混淆数据收集或影响分析的外来变量。现实世界也是一个高度动态的研究论坛,根据当时的交通,天气,环境照明和其他道路条件,参与者之间的相同道路将会有很大差异[1]。尽管保持平衡很重要从现实世界,基于实地的研究或基于模拟实验室的试验的相对优点的角度来看,最终决定通常基于研究要求和调查的复杂性。对驾驶员心理工作负荷的研究使用了次要任务范例来评估驾驶员在驾驶和额外任务之间划分资源的备用注意力能力[7,12]。出于安全原因,在实际道路研究中不建议诸如此类的方法和头戴式眼睛跟踪设备的使用。现实世界的方法通常必须采取非侵入性的方法,以便驾驶员不会为了研究而分心安全驾驶的任务。由于这个原因,经常使用试验前和试验后比较或非侵入性措施(例如使用视频分析的心理生理学或远程监测),这可能导致冗长的试验后分析。模拟器的一个主要优点是用于开发场景的软件(其中环境的所有方面都可以编程到场景中)通常为收集大量数据提供了基础,这在现实世界中通常是不可能的,除了高端和昂贵的仪表车辆。

运输模拟器提供了控制可能影响研究的许多变量的潜力,因此可以隔离特定变量并测试实验差异。还可以在模拟场景中对特定或不常见的危险进行建模,这在现实世界中可能难以或危险地重建。模拟器研究的最大力量之一在于能够在参与者之间重复相同的体验,从而可以进行详细的调查。模拟器还可以提供实际优势,因为无论外部天气或根据一天中的时间变化的道路状况都可以进行试验,并且试验可以相对容易地中止,而在现实世界中这更加困难。现实世界的研究也可能受到法律和保险要求以及使用真实道路的参与者的详细和复杂的后勤问题的阻碍。通过任何模拟经验,参与者通常会意识到他们没有操作具有完全真实世界后果的真实系统(例如,如果飞行员撞毁飞机模拟器,他们知道他们不会受伤)。这意味着用户可以在安全的环境中犯错误并从中学习,但这也意味着模拟器会遇到保真度和有效性的基本问题[13]。

1.2 模拟器的保真度和有效性

如果模拟器在从基于低端纸张的原理图到高端完整复制系统的抽象范围内运行[13],那么存在与它们可能适合的目标相关的基本问题[1]。从历史上看,模拟器是按照技术驱动的参数开发的,最近已将高级视觉系统,计算机图形和运动平台纳入其设计中[13,14]。然而,在探索真实或模拟环境时,重要的是要明确关注研究需求,以便它们达到预期的目的[1]。此外,如果选择模拟器作为研究工具,那么在模拟范围内使用不同的解决方案可能会有特定的好处(图1)。保真度的两个维度被认为对模拟器研究的有效性影响最大[15]:

- 物理保真度(模拟器看起来像真实系统的程度)

- 功能保真度(模拟器像真实系统一样运作的程度)。

虽然物理保真度在训练模拟器中很重要[14,16],但有人认为,对于可能受到损害的研究模拟器(假设保持功能保真度)而不影响结果的可转移性这一点并不重要[17]。物理保真度还可以支持沉浸的方面和模拟场景中的“存在感”(即某人认为他们在人工环境中的程度),这可能导致更真实的行为[18,19]。此外,可以在保真度和功能之间进行区分,其中具有低功能(但仍具有高保真度)的系统与复杂任务一起使用,以探索给定操纵如何影响驾驶相关性能而不是潜在的驾驶员心理[20]。

保真度本身就是模拟设计的重要因素,也是模拟器有效性的重要组成部分[2,20,21]。运输模拟中一个关键因素并未被很好地理解,并且“成为#39;更多更好#39;哲学的牺牲品”是运动平台和线索的结合[20]。运动系统可以增强面部有效性,这是系统满足用户期望的程度,因为用户通常期望模拟器模仿真实平台的物理行为[15]。然而,如果物理运动和认知线索不匹配,这不仅会破坏模拟器的预期用途,还会引起一般不适症状的症状。模拟器疾病与VR疾病或晕动病相似,并影响约5%的人口[22]。因此,在进行模拟器研究以保护参与者时,必须遵循明确的道德规范和监测协议。

保真度还支持模拟器研究的生态有效性,这是研究结果从一种环境推广到另一种环境的程度。通常认为现实世界的研究是生态有效性的最佳基础,这给实验室研究带来了挑战。然而,研究具有很高的生态效度,如果它“超出实验室到田间环境,但在自然环境中进行实地研究不会自动#39;生态有效#39;”[11]。虽然现实世界的研究应该具有很高的现实性,如果它过于具体并受到特定背景的限制,那么研究结果将不会推广到其他环境,因此它可能具有较低的生态效度[11]。因此,如果模拟器能够证明可以推广到其他使用环境的发现,则它们在生态学上是有效的。

在一项研究中,通过使用车载触摸屏界面来说明基于运动的研究的生态有效性[23]。结果表明,较高的运动水平与较差的性能和较高的主观工作量相关,这为在移动平台中设计和使用这些系统提供了指导。在培训应用中,保真度和有效性与培训效果有关,培训效果通常与培训转移到现实世界驾驶员行为和绩效有关[21]。这已经通过不同级别的模拟器保真度进行了探索,模拟器性能适用于复杂的驾驶场景,并且反复暴露于危险分析后的训练后暴露。其他研究已经使用模拟器来检查低能量,其中对不可预测的事件做出反应的能力在其他单调和平静的驾驶任务中恶化[24]。在这种情况下,公路设计将驾驶任务减少到车道保持活动并由此导致的缺乏驾驶员刺激会导致驾驶员注意力不集中。该研究表明,模拟器可用于评估道路设计和路面变化对驾驶性能的影响,并且是第一项将不同单调条件下的低警戒和驾驶员表现联系起来的研究。

模拟器也被用于测量驾驶员对新技术的反应(例如语音识别,分心任务和碰撞避免系统)[8,12,16,25]。然而,对于任何研究(实际或模拟)以及生态有效性和结果普遍性的潜在问题,焦点都会回归到模拟的保真度。不同的模拟解决方案之间仍然存在有限的知识或实际上有限的可比性,并且基本问题仍然存在,例如模拟器如何准确地表示驾驶体验的关键方面,以及视觉线索(通常为其开发高技术解决方案)驱动程序从音频,动作或触觉感知中获得其他线索[16]。也许模拟中最关键的因素之一是系统中已知错误在多大程度上可能影响研究结果的可信度[16]。与开发可用VE的VEDS方法类似,已经设计了一个框架来描述驾驶的物理方面如何从抽象表示转变为感觉以支持用户体验[16]。随着这些进步,运输模拟演变成更可靠的研究工具,并且增强了推广结果的潜力。然而,许多因素仍然超出了本文的直接范围,但在模拟研究,设计和构建活动的未来非常重要。

通过本文提出的研究,在模拟的范围内探索了不同的模拟,因为它们为即时的研究需求提供了不同的解决方案。如图所示,频谱的下端趋向于较低的物理保真度和面部有效性,而交互式接口的提供较少(尽管并非总是如此)。频谱的高端提供增强的物理保真度和面部效度,再加上运动平台和高质量图形,以支持复杂的用户交互。在频谱的中间范围内,放置了部分定位训练器或情境/设备仿真器,其可能具有低功能但高保真度以捕获交互的特定元素而不是整个过程。模拟器技术发展的动力一直是提高这些系统的面部有效性,以使它们对用户更加可信[15],但是,考虑模拟环境的质量也很重要。用户体验和虚拟环境(VE)的设计[26-28]。模拟器中使用的虚拟驾驶场景与VE的设计和构建共有许多共同的基本问题。在许多情况下,虚拟现实(VR)设计师仍在寻求支持用户交互和现实程度的解决方案,虽然存在人机工程学和人体工程学指南,但它们向3D实时交互式VE的转移有限[26]。为了帮助开发人员,利益相关者和研究人员,我们开发了一种虚拟环境开发结构(VEDS),它是一种用于指定,开发和评估VE应用程序的整体的,以用户为中心的方法[27]。重要的是要从一开始就考虑VE属性的已知或要求,并考虑它们如何与应用要求相匹配[26]。

以类似的方式,用于驾驶员模拟的VE需要在危险很少(而不是很多)的环境中考虑和开发任务(例如,驾驶活动),并且其他代理以现实的方式行事以使整体体验成为合理代表现实世界。与此同时,VE并不总是提供与现实世界相同的可供性和提示,并且已经研究了使用模拟器来支持公路设计活动[28]。从这种方法中,重要的是确定可以从驾驶模拟器的使用中受益的设计问题以及将驾驶员性能数据从这种模拟转换为道路上的实际交通行为。为了实现这一目标,无论它们在模拟频谱上的位置如何,模拟器必须解决保真度和有效性的基本问题。

2.语音理念

在模拟器保真度和有效性的背景下,一项研究项目(#39;Speech-Ideas#39;)作为英国政府LINK内陆地面运输(IST)计划的一部分进行,该计划由经济和社会研究委员会(ESRC)联合资助, 环境,运输和地区部(DETR)。 本研究的目的是研究语音输入系统在汽车应用中的潜在影响。 这是通过一系列实验室实验来实现的,这些实验使用了不同级别的模拟器保真度,以及来自工业合作伙伴的宝贵意见,以便为在现实世界中使用此类技术的背景,技术和更广泛的系统性问题提供信息。由于标准汽车系统要求驾驶员在驾驶时操作视觉显示器和手动控制(导致“眼睛不在路上”的情节并且危及安全性)语音输入可能潜在地改善系统的驾驶体验,例如用于移动电话的语音启动拨号以及娱乐,路线引导或旅行和交通信息服务的运作[29,30]。从该项目和更广泛的语音识别和需求捕获活动知识库中,已经确定了与汽车应用的语音输入的使用相关的许多基本人为因素问题[31-37]。因此,应使用以下变量设计和评估任何语音输入应用程序:

- 用户(例如考虑年龄,性别,经历,方言,文化,个体差异)

- 系统(例如包括系统准确性,响应时间,对话和命令结构,词汇表)

- 任务(例如,了解并发或竞争任务的复杂性,工作量,压力,疲劳)

- 环境(例如环境噪声,振动,心理社会方面)

此外,在Speech-Ideas项目中,特定应用被确定为使用语音输入的示例和潜在候选者,例如移动电话,娱乐系统的使用,和路线指导和驾驶员信息系统。

在汽车应用中,使用语音输入的任务是次要的安全驾驶的主要任务,因此,驾驶员对语音介导的交互过程(例如命令,接受的词汇表,驱动程序接口)的注意力或备用容量可能是有限的[29] ]。这些应用也可以被视为“恶劣环境”,其特征在于高水平的环境噪声,用户工作负荷的高峰和低谷以及可能影响所产生的语音质量和随后的语音识别过程成功的潜在压力源[ 38。

许多研究都强调了驾驶时使用手动系统的危险以及语音识别的潜在好处[30,34,37,39,40]。手动拨号移动电话已经被证明会破坏车辆控制活动,例如车道保持和速度维护,而语音操作打电话会导致车道偏差降低和控制更好[30]。双任务研究采用模拟器来检查手机通话对驾驶性能的影响[3​​9,41,42]。虽然通过使用手持或免提移动电话收听音频刺激(例如,无线电或录制的书籍)而没有中

原文和译文剩余内容已隐藏,您需要先支付 20元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。