面向汽车驾驶员移动使用的方向盘安装语音接口的设计与评估外文翻译资料

 2021-12-15 10:12

英语原文共 6 页

面向汽车驾驶员移动使用的方向盘安装语音接口的设计与评估

摘要:具有语音识别接口的先进移动设备在很多方面为驾驶员提供了帮助。然而,目前驾驶员与移动设备语音界面的交互方式在驾驶过程中仍然会产生明显的手动和视觉干扰。本文提出并原型化了一种驾驶员友好界面,包括安装在方向盘上的蓝牙模块和安装在挡风玻璃上的平视显示器(HUD)。它允许驾驶员在不离开方向盘的情况下,远程激活移动设备的语音交互模式,在不离开道路的情况下,读取移动设备的视觉显示。通过驾驶模拟器实验对新界面进行了评价。结果表明,本研究设计的界面减少了驾驶员的注意力分散,提高了可用性。

一、导言

移动互联网和智能手机等智能移动设备的革命,极大地改变了我们的日常生活。移动互联网通过提供多样化的功能和方便的基于位置的服务,推动人们随时随地使用它。与此同时,人们还发现了另一种趋势,即司机在开车时花大量时间在移动互联网上,尤其是在发展中国家[1]。这两种趋势都使汽车从一种交通工具变成了一个多功能的、可移动的、可以上网的生活空间。移动设备可以轻松地提供导航、基于位置的搜索(LBS)和各种应用程序(APPs)等驾驶员辅助服务。然而,在驾驶过程中使用这些新功能将不可避免地增加驾驶员的车内互动,减少他们对驾驶的注意力,这是[2]优先级最高的首要任务。驾驶员注意力分散是道路安全的最大威胁之一。近年来,车载信息娱乐设备已经成为驾驶员注意力分散的主要来源。如今,移动设备的普及使得这种分心变得越来越严重。为了减少驾驶员在使用移动设备辅助驾驶时的分心,需要一种更安全、更友好的驾驶环境下的交互设计。

*中国高等教育博士学位项目研究基金(20131102120034)、国家自然科学基金(71001092)资助。北京航空航天大学交通科学与工程学院车辆基础设施协同系统与安全控制北京市重点实验室,北京100191yingwang@buaa.edu.com;zuli117@163.com;zhuyueyan0216@gmail.com)。华南理工大学设计学院,广州510641;ljjiang@scut.edu.cn;与Z. Li对应,电话: 86 (20)3938-0731;传真: 86 (20)3938-0726;电子邮件:zhelinli@scut.edu.cn)。

语音识别作为一种新兴的交互技术,在驾驶[2]时提供了对车内设备的免提操作。语音识别界面(如苹果的Siri)无疑是一种合适的交互方式;然而,大多数移动设备上的相关应用都没有将驾驶环境融入到交互设计中。通常情况下,语音识别应用程序的目标是导航或LBS要求司机按下一个按钮-to-talk (PTT)来激活收听模式,然后通过视觉或音频输出显示搜索结果。驱动程序需要一直持有设备,直到搜索任务或输入任务完成。在这方面,语音识别只是一种新的信息输入方式,而不是一种新的交互方式。为了满足消费者的技术需求,许多汽车制造商最近开发了带有语音识别的车载信息娱乐系统(IVIS),或致力于将智能手机服务集成到IVIS中。然而,汽车不可能像耐用品那样容易更新。相反,随着强大的cpu和前沿操作系统的发展,移动设备正在迅速发生变化。它为大多数驱动程序提供了更容易的语音识别技术和其他自然接口。因此,寻找一种简单易行的方法来优化驾驶员目前在车内对移动设备的使用,对道路安全具有重要的现实意义。本研究以普通智能手机原有的语音识别功能为基础,设计了一种扩展的车载移动设备语音界面。我们主要对智能手机的输入输出机制进行重新设计,以适应驾驶员驾驶时的动态行为模式。采用蓝牙遥控作为输入媒体,激活移动设备语音识别界面。采用平视显示器(HUD)作为输出媒体,对移动设备进行可视化显示。通过对驾驶模拟器的研究,与传统的智能手机“手持”模式进行比较,验证了新界面的安全性、效率和可用性。

二、相关的工作

现代信息技术和移动设备为驾驶员提供了一个利用旅行时间进行多样化工作和娱乐的机会。这些功能,如LBS和导航,对驾驶非常有帮助。然而,这些车内次要任务同时也带来了安全隐患[5,6,7]。

  1. 驾驶情境下的移动

互联网最近的研究表明,无论是驾驶员个人对智能设备[8]的使用,还是汽车制造商将移动互联网与IVIS集成,例如宝马(BMW)的iDrive[9]和荣威(Roewe)的iVoka[10],移动互联网都已大举进入汽车领域。然而,与汽车相比,它们的缺点是产品生命周期短得多,缺乏人机交互的灵活性,增加了制造成本[11]。因此,学术界和工业界的研究人员开始尝试将现有的智能移动设备集成到IVIS中[11,12]。移动设备制造商还计划开发车载应用程序,如苹果的Carplay和谷歌的投影模式,允许司机将他们的手机显示复制到IVIS上[13,14]。然而,以上所有系统都只适用于有限的车型,仍然需要驾驶员的手离轮操作,至少在激活语音识别界面时是这样。

B.移动设备导致司机分心

开车时打电话和发短信被证明会增加撞车的可能性。根据州长公路安全协会的报告,美国25%的车祸与司机在驾驶[16]时使用手机有关。手机使用引起的驾驶员注意力分散可以分为视觉、认知或手动三类,反映了驾驶员将视线从道路上移开、将注意力转向非驾驶任务或手动操作移动设备的行为。在三种干扰类型中,视觉-手动组合干扰具有最高的碰撞风险比[17]。今天的智能手机扮演着微型电脑的角色,内容丰富,而不是打电话和发短信。它引起了更复杂的干扰[18]。开车时使用智能手机应用程序通常会创建可视化手动任务,这要求司机查看图形用户界面并触摸屏幕进行操作。虽然低于2秒的越野注视只会轻微增加撞车的风险,但超过2秒的注视会大大增加[19]的风险。以前,很多出版物都指责开车时发短信,因为它很容易引起远距离的越野目光;然而,如今智能手机应用程序中丰富的内容大大提高了长时间越野凝视的频率。

C.减少分心的自然用户界面

自然用户界面(NUI)提供了人与机器之间的触觉交互、语音交互和kinect交互,符合自然人类行为[20],具有很强的学习性。语音交互不占用驾驶员的视觉资源(驾驶过程中最重要的资源),在车载应用中具有巨大的潜力。之前的研究表明,语音交互可以显著减少驾驶员的注意力分散,并在选择音乐、打电话和使用导航系统[21]时提高驾驶性能。但根据语音内容的深度,基于命令的交互和基于对话的交互在减少驾驶员分心[22]方面有不同的效果。如上所述,市场上只有有限的车型已经将语音接口集成到IVIS中。相比之下,数百个语音识别应用程序可以立即下载到移动设备上。这些应用程序的主要功能包括语音到文本的翻译、基于命令的操作和基于对话的操作。在中国市场广受欢迎的语音识别服务提供商代表包括苹果的Siri[23]和科大讯飞的iFly[24]。

三、用户界面设计及原型

  1. 司机使用Siri为例

虽然语音交互本身主要是认知需求,不产生视觉和手工的工作量,但从语音交互开始到结束的整个过程通常都是认知需求。目前,大多数移动设备上的语音界面需要驾驶员在驾驶时进行两种操作产生视觉和手动干扰:1)驾驶员必须伸手到设备上,按下一个物理或图形按钮才能激活聆听模式;2)驱动程序可能需要瞥一眼设备的显示来检查语音识别的输出。作为iPhone上的一款原创应用(世界上最受欢迎的移动设备之一),苹果的Siri将设备的“Home”键定义为其PTT按钮,这使得Siri比其他具有语音交互功能的售后应用更加方便。图1显示了通过Siri完成LBS任务的常规流程:1)拿起设备,按下PTT按钮;2)与设备通话,输入语音信息;3)手持设备,Siri搜索结束后,听语音提示;4)浏览可视化输出,选择满意的结果。这四个步骤都需要手工操作,最后一步是视觉要求。

  1. 新的用户界面设计

为了减少语音交互过程中的人为和视觉干扰,本研究设计了一种适应Siri的新界面(具有代表性的语音交互应用)和LBS任务(驾驶员与移动设备在驾驶过程中的典型交互)。如图2所示,新界面包括一个安装在方向盘上的蓝牙模块,可以从驾驶员的移动设备远程接收驾驶员的PTT操作和语音输入;挡风玻璃上的HUD单元可以直观地显示Siri的搜索结果输出。蓝牙模块通过iPhone上的蓝牙连接与Siri进行通信,并配备了一个PTT按钮、一个麦克风和一个扬声器。利用方向盘后部作为手的交互空间,结合HUD,强烈建议减少驾驶员的手离轮和眼离路[25]。我们的设计将蓝牙安装在方向盘的前端,让驾驶员可以用拇指轻松地按下PTT按钮。HUD的安装很简单,挡风玻璃上有一小块半透明薄膜,可以投射出iPhone的屏幕,手机上还有一个仪表盘。

在新的LBS任务语音交互回路中,驾驶员首先按下方向盘上的PTT按钮激活Siri;然后自然地说话,不要把手从方向盘上拿开;等到Siri找到答案,并通过方向盘上的扬声器发出音频警报;最后,查看挡风玻璃上的HUD查看结果,选择一个目的地,按照显示顺序告诉Siri目的地的名称(例如,我想去第三个目的地)。最后,Siri在HUD中显示路线,并通过音频指令导航。总的来说,通过新界面与Siri交互,人工操作非常少,视觉资源也更少,这就缩小了使用移动设备时,单驾驶任务和双驾驶任务之间的人工和视觉需求的差距。

C.原型开发

我们用蓝牙耳机上现成的蓝牙芯片制作了蓝牙模块的原型,并在将音频输出部分连接到一个微型扬声器后重新密封。蓝牙模块体积小,可以灵活地安装在方向盘上。将iPhone (iOS 7操作系统)与蓝牙模块配对后,只需按下方向盘上的PTT按钮即可激活Siri(见图3)。HUD单元显示了修改后的iPhone屏幕镜像图形,并修改了字体大小和图形对比度。如图4所示,在驾驶模拟器的挡风玻璃上粘了一块大小与iPhone 5s差不多的半透明薄膜,其位置略偏右,靠近方向盘。连接蓝牙模块的移动设备被放置在仪表板上,面向HUD单元。图形和文本被设计成移动设备上的镜像,然后很容易地反射到HUD上。为HUD设计了深色背景、明亮的图形和较大的文本字体,以突出显示视觉输出(参见图5)。

四、评价方法

A.参与者

在北京航空航天大学(Beijing, China)进行了驾驶模拟器研究,以评估所提议的用户界面。通过网络广告招募了24名20 - 29岁的青年司机,平均年龄为24.2 (SD=2.84)。参与者必须是活跃的司机和手机用户。此外,他们还需要在实验当天保持良好的身体状况,以及过去一年的安全驾驶记录(无事故记录)。每名参与者将获得100元人民币(16.26美元)的补偿。

B.设备

驾驶任务在固定底座驾驶模拟器上完成,使用三个宽屏液晶显示屏。前、左、右巷道和提出了一种后视镜几乎在LCD显示屏大约143ordm;的视野水平。模拟的道路和交通场景由UC-Win/Road Ver.8标准(FORUM8, Tokyo, Japan)生成,刷新速率约为20hz。本研究使用的移动设备为全新的苹果iPhone 5s(屏幕尺寸:4英寸;分辨率:1136 x 640) iOS 7操作系统(苹果公司,加州库比蒂诺)。

C.外围检测任务(PDT)

外围检测任务是一种测量驾驶员驾驶时的心理负荷和视觉干扰量的方法,已被证实是一种很好的工具[26,27]。该任务在驾驶员的外围视图中呈现随机目标。当司机分心时,反应会变慢,错过更多的PDT目标。在这项研究中,两个LED阵列被放置在挡风玻璃上,水平角度约为11至23度左右的司机的前视,垂直角度约为2至4度以上的地平线。左右LED阵列每3-6秒随机发光(红色)一次,持续2秒。参与者被要求在看到LED阵列被点亮后按下方向盘上的一个绿色按钮。响应时间定义为从每次LED照射开始到按下响应按钮。超过2秒的响应被认为是错过的事件。

D .过程

与会者在抵达时审阅并签署一份同意书。然后他们接受了良好的训练,在三种模式下使用Siri完成一系列LBS。三种模式包括1)Siri的原始设置(拿起并握住手机,缩写为“PUP”);2)蓝牙模块仅用于语音输入和音频输出(缩写为“BT AU”);3)使用蓝牙模块和HUD进行语音输入和视觉辅助输出(简称“BT HUD”)。在高速公路上进行了8公里的驾驶练习,以帮助参与者适应驾驶模拟器。在练习过程中,每一种Siri模式至少都有一次练习。正式测试是在一条双向六车道的城市道路上进行的。为两个方向设计低至中等交通密度(每车道每小时500辆)和中等速度(50公里/小时至65公里/小时)。参与者被要求在中央车道上跟随一辆车速为60公里/小时的领先汽车行驶。18个LBS任务,每个模式下3个没有PDT, 3个有PDT,在测试过程中以60秒(PUP)或90秒(BT AU和BT HUD)的间隔进行分配。每个LBS任务都由一个搜索附近服务(如加油站、餐厅、酒店)的音频指令组成。等),使用特定的Siri模式,选择具有特定标准的目的地(例如最近的目的地)。实验条件呈现顺序为:纯驾驶2分钟,PUP任务3个,BT AU任务3个,BT HUD任务3个,PDT纯驾驶2分钟,PDT BT HUD任务3个,PDT BT AU任务3个,PDT PUP任务3个。在HUD和iPhone上的可视输出都在一个页面中显示了三个搜索结果。音频输出逐个播放结果。所有目的地都位于前三个结果中。为了保证Siri搜索结果的一致性,我们让5名志愿者在模拟器的驾驶员座位上测试了30多个目的地。最后选择最稳定的18个目的地(始终呈现相同的结果)。

E.数据分析

使用IBM SPSS 19 (IBM Co., Foster City, CA),使用重复测量一般线性模型(GLM)计算三种Siri模式对LBS任务性能、PDT响应时间、驾驶性能和用户体验的比较。如果在GLM中不能假定球度,则应用温室效应校正。对GLM的显著结果进行两两试验(含LSD调整)。对于非参数变量,采用Friedman检验和Wilcoxon秩检验代替GLM中的重复测量方差分析和配对检验,对PDT反应的成功率进行统计。差异有统计学意义(plt;0.05)。

五、结果与讨论

lt;

资料编号:[5131]

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。