基于移动视频和位置信息的增强现实平台的方法和评估外文翻译资料

 2022-03-27 07:03

英语原文共 7 页,剩余内容已隐藏,支付完成后下载完整资料


基于移动视频和位置信息的增强现实平台的方法和评估

关键词:增强现实,图像跟踪,教育娱乐,ARML,GPS,信标,游戏化,用户体验

摘要:

为行人提供移动定位信息面临着许多挑战。一方面本地化的准确性,由于GPS和信标的技术限制,室内和室外都受到限制。然后再次只有一个小显示器可用显示信息以及开发用户界面。另外,软件解决方案必须考虑硬件特性移动设备在执行过程期间以最小的延迟瞄准性能。本文介绍了我们的通过包括图像跟踪和GPS或信标的组合来确保定位的方向和精度。至于达关于兴趣点(POI)的信息,我们决定选择增强现实(AR)。对于这个概念除了显示器外,我们还使用加速度和位置传感器作为用户界面。本文特别详细介绍了图像跟踪算法的优化以及基于视频的AR的开发Android平台的播放器以及考虑提供良好用户体验的视频评估作为AR元素。为了设置POI的内容,甚至生成我们使用的漫游,并扩展了Open Geospatial Consortium(OGC)标准增强现实标记语言(ARML)。

1介绍

1.1移动设备的细节

提供的信息在移动设备从台式电脑显著不同。 Ruuska‐Kalliokulju et. al. (2001) 列举了以下几个方面的区别:

1.使用的物理,社会和文化背景影响交互的方式。

2.移动设备的个性化是一个关键的设计问题。

3.应用程序和服务的质量和数量不同。

4.移动信息和通信技术设备变得更加具体到一定的任务。 为了保持任务透明并减轻用户负担,设备之间的通信,传输和同步需求日益增长。

在进一步的程序中,我们认为用户将作为行人在途中。 由于身体状况以及环境,用户受到各种形式的干扰,这会影响他集中和接收信息的能力。 为了简化信息和交互的接收,针对上下文敏感的解决方案。 在本文中,我们试图通过关注基于视频和基于位置的AR来实现这一目标。 根据Touml;nnis(2010)的观点,我们将AR分成三类: 跟踪,交互和演示。

1.2跟踪

AR的一个关键方面是准确跟踪用户。GPS是必要和使用的,尽管它仅限于室外,其准确度在几米之内不等,并且如果设备不在移动中,GPS信号不提供关于设备的方向的任何信息。为了在室内提供导航信息,我们使用了信标。为了方向和增加室内和室外的精确度,我们另外使用图像跟踪。我们的方法将移动设备的摄像头视图与现有和准备的参考图片的数据库进行匹配。如果相机视图与参考图片匹配,则会触发事件。AR元素将被定位并显示在相机视图中并自动启动。图像跟踪允许将AR元件定位在其确切位置。

1.3互动

为了交互,这种方法使用用户的位置,移动设备的摄像头及其传感器的视图。 为了在显示器上定位和启动AR元素,使用了定位和图像跟踪的组合。要在摄像头视图和雷达视图之间切换,将检查内置传感器。如果用户垂直拿着移动设备,则会显示相机视图,并且图像跟踪过程的扫描过程处于活动状态。然后再次如果用户水平握住设备,则显示雷达视图。或者,用户可以使用最小的用户界面来处理应用程序。

1.4演示

在小型显示器上显示文本沉重的文档要求对用户的短期记忆有很高的认知要求。Jones等人 (1999)在一项关于小型显示器对检索任务的影响的研究中表明,移动设备和台式计算机之间的偏差为50%,偏向桌面电脑。因此,我们使用视频格式作为文本格式的替代选项。为了在台式电脑上编辑视频并在Android智能手机上显示视频,我们开发了视频编辑器。对于每个平台(Windows,Linux和MacOS),特定的软件通过裁剪和调整视频大小来准备文件。进一步的格式,如超链接,网站,音频,触觉反馈或这些组合已被实现为AR元素,但不主要使用。

1.5准备游览

我们构建增强现实平台的方法包括一个网站和一个Android应用程序。 网站storytellAR.de是创建POI或一系列POI作为线性或非线性游览的主要平台。 用户可以设置POI,指定GPS坐标,上传参考图片,定义开始和最终POI并可选择确定POI的顺序。所有信息将以AMRL格式保存。Android应用程序是一个AR浏览器,可以请求ARML文件,下载参考图片并显示移动设备的摄像头视图的AR元素。

2.跟踪

对于基于位置的AR,我们的方法可以分为三个技术步骤:

1.用户的本地化。

2.如果用户达到预定义的POI,则会触发事件。

3.虚拟信息将通过移动设备传达给用户。该方法使用图像跟踪和GPS或信标的组合来定位用户。

2.1 GPS

如果有GPS接收,则使用GPS。为了提高定位图像跟踪的准确性和方向,将另外应用。尽管参考图片的数量不受限制。对于每个匹配过程,摄像机视图必须与每个参考图片进行比较。 此过程可能会随着参考图片数量的增加而降低性能。 为此,所有参考图片都是地理参考的。通过到达任何POI,只有附近POI的图片用于图像跟踪过程。因此,较少的参考图片被比较并且延迟时间减少。

2.2信标

当在室内,GPS信号不存在或弱时,实施利用信标技术的导航系统。 蓝牙信标是一种小型设备,可以在30米的最大距离内传输无线电信号。使用蓝牙信标的室内导航的基本类型是邻近信息。当用户进入或离开信标的发现区域时,可以在应用程序中触发事件。我们使用了接近锁定方法,在这种方法中,我们为每个Beacon,入口区域和出口区域定义了两个区域。为了锁定用户在他进入的区域(例如房间)中的位置,入口区总是小于出口区(例如入口区= 2m,出口区= 5m)。当用户进入信标的发现区时,图像跟踪将开始等同于GPS跟踪。用户可以自由浏览感兴趣的区域。当用户退出退出区域时,我们假设他离开感兴趣的区域并且图像跟踪过程将停止。

图1.信标入口和出口区域

2.3图像跟踪

这种使用AR的方法与标记或QR码无关。只需要预定义POI的参考图片。 Alan(2013)称这种做法只使用了独特的地标自然特征跟踪(NFT)。这使得AR还可用于文物建筑,受保护的纪念碑等等。

另外,跟踪用户和放置AR元素的准确性通过图像跟踪显着提高。通过选择参考图片,我们可以确切知道用户站在哪里以及智能手机朝向哪个方向。因此AR元素可以放置在根据参考图片预定义的确切位置上。因此增加了定位和保真度,单独使用GPS或Beacons的追踪可能无法提供。

2.3.1 ORB算法:图像跟踪程序由三个步骤组成。第一步是图像匹配过程。我们使用了Rublee等人的ORB(Oriented FAST and Rotated BRIEF)算法。被称为关键点的摄像机视图的图像部分被随机选择并与参考图像连续匹配。匹配值越大,图片之间的差异越小。为了提高性能,参考图片和相机视图被转换为单色图像并被调整为低分辨率(Dastageeri等,2015)。另外,低分辨率降低了关键点唯一性的错误率。 这是因为通过计算关键点,如果分辨率很小(图2左侧),可以考虑更多信息。

图2.具有突出显示的补丁的摄像头视图图像摘录:左侧8x8像素补丁(400x300px),右侧8x8像素补丁(1600x1200px),(Kampa等,2014)

通过使用高分辨率,图像包含相同的色块尺寸较少的信息(图2,右)。为了达到相同的结果,每个补丁的大小必须增加指数(图3)。

图3.64x64像素补丁(1600x1200px),(Kampa等,Q2014)

2.3.2过滤方法:虽然这些关键点的比较不够。结果显示太多摄像机视图图像被错误地分配给参考图像。 因此,增加了三种过滤方法。第一种方法是对称比较。 只考虑在相机视图图像和参考图像的比较中找到的关键点,但也考虑相反的情况。没有这个属性的关键点被删除。第二种过滤方法检查ORB算法的值。消除了匹配值非常低的关键点。第三种过滤方法检查异常值。为了识别异常值并删除它们,正在使用RANSAC过滤器(Fischler等,1981)。

2.3.3定义关键点的数量:图像跟踪的结果和性能的重要参数是关键点的数量。 表1显示了不同关键点数量的测量值的摘录。对于这次测量,参考图片具有395x175像素的分辨率和400x300像素的相机视图。 我们用于测试三星S3与1.4 GHz四核ARM Corstex-A9与1GB RAM。成功的图像匹配始于2500个关键点。

3.互动

3.1移动设备的用户界面

移动设备和台式计算机之间的主要区别在于地理位置的独立性(Franz,2005),必须考虑操作概念。手持设备被旅行中的人使用。注意跨度是有限的,因为设备被引入到用户关注的次要位置。台式电脑受到专注,但手持设备只能得到零碎的关注(Weiss,2005)。因此,用户分散注意力,影响注意力集中,特别是视觉和心理关注(Duh等人,2006)。因此,复杂的用户界面操作或用户输入的永久请求使交互变得困难并且必须避免。与使用台式计算机相反,移动设备的用户还对温度,雷电条件和响度仅有非常有限的影响或没有影响的环境。而且,对于移动设备,通常没有关于用户界面或软件布局的标准。事实上,操作系统供应商推荐设计指南(谷歌公司,2016年,苹果公司,2016年),但它们不是强制性的,分别没有被开发人员广泛应用。尽管如此,用户界面应该对所有年龄段的用户群以及有障碍的人都具有吸引力和可用性(Ruuska-Kalliokulju等人,2001)。为了应对这些要求,我们将操作概念降到了最低限度。界面和历史交互设计是从复杂到简单的一条路径(Valli,2006)。启动Android应用程序后,用户必须选择一个ARML文件。开始屏幕上没有其他菜单选项或按钮。

3.2作业范围

扫描过程在选择ARML文件后立即开始。菜单结构的复杂性越低,成功完成任务就越快(Ziefle,2002)。目前的概念被构造为在主屏幕上仅显示总共三个按钮:

1.左上方的菜单按钮; 在菜单中,用户拥有所有提供的视频的播放列表,并可以手动启动它们

2.雷达左下方; 雷达显示附近的POI依赖于用户的位置

3.帮助右上; 通过按帮助图标,可以启动关于处理应用的教程视频(仅在扫描过程中可见,如果播放视频则不可见)

这三个图标是根据简约的用户界面设计流派平面设计而设计的。美学和形式只是一见钟情。尽管第二眼功能和易用性更重要(Kiljander,2004)。因此,设计和操作范围都降至最低。扫描过程不断搜索相机视图图片与参考图片的匹配。成功跟踪事件后的图像可以自动触发。用户不需要进一步的操作。

图4.斯图加特应用科学大学展示研究路径过程中的示范

为了测试我们最低限度的用户界面方法,我们在2015年11月16日与斯图加特应用科学大学管理学院一起开发了移动AR应用程序,用于展示学习路径。在此年度活动期间,每个学士学位课程都通过口头介绍,信息亭和横幅。我们决定使用横幅作为参考图片,并为每个本科课程制作视频。通过扫描横幅,触发了一个视频来描述学士学位课程(图4)。此外,我们还为AR应用程序设置了一个信息亭,以展示应用程序,与用户讨论并收集反馈意见。我们还在展台上为Android平台提供了应用程序,并通过现场请求将其安装在设备上。为了能够在展览后观看AR视频,用户还可以选择通过菜单手动启动每个视频。由于访问者以及大学管理层对我们的普遍兴趣,我们决定在2016年11月的下一个展会上调整反馈和launchan更新版本的应用。

3.3可用性

除了主屏幕上的按钮外,用户还可以通过握住移动设备的方式进行交互。 通过垂直握住移动设备,相机视图被激活并开始追踪。通过水平握住设备,雷达正在显示。 我们想要通过许多方式来达到相同的结果。用户可以决定他喜欢哪种方式。

“可用性是衡量用户体验与某些事物交互时的质量的标准 - 无论是网站,传统软件应用程序还是用户可以以某种方式操作的任何其他设备。”(1994年Nielsen在Schweibenz等人引用的文章中称。2003)

交互的选项是有限的,尽管它是有意的。 根据80/20规则,我们试图找到20%的功能来解决80%的功能。 “对于每个应用程序或功能集,有助于确定满足80%用户任务需求的20%功能。”(Mohageg等人,2000年)

4.增强现实

要创建AR用户体验,必须考虑几个方面。 Azuma(1997)将AR区分为三个特征:

1.现实与虚拟的结合

2.低翘曲交互性

3.以3D录制

根据Alan(2013)的观点,关于现实与虚拟性的结合有四个关键方面。

1.通过将数字信息叠加在物理世界的视野上,通过数字信息来增强物理世界。

2. AR软件在应该显示数字信息的真实世界中自主地找到它的位置。

3.信息将根据用户在现实世界中的当地位置和方向显示。

4. AR是一种交互式体验,一个人可以注意到一个信息,然后再将信息更改为所需信息。相互作用的程度可能会随着方向的简单改变直至影响甚至产生新信息而变化。

艾伦(Alan)编辑了由六种成分组成的AR:

1.增强现实应用程序

2.内容

3.互动

4.技术

5.物质世界

6.参与者

Alan(2013)指出了AR的正确用法。 AR元素的选择及其位置必须根据情况而定。

4.1 AR元素

考虑到我们的方法是成为信息经纪的一般解决方案,我们的应用程序允许使用视频,图片,文本,音频,网站,网页链接,振动或组合作为AR元素。考虑到响度户外字幕可以选择添加。我们选择了符合我们要求的SubRip文本(SRT)格式,例如允许定义文本的时间跨度。

lt;

全文共9111字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[15059],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。