使用大规模移动传感方法了解旅游行为 ——以日本手机用户为例外文翻译资料

 2022-06-21 11:06

英语原文共 22 页,剩余内容已隐藏,支付完成后下载完整资料


使用大规模移动传感方法了解旅游行为 ——以日本手机用户为例

摘要

本文描述了一个使用大规模机会主义移动感知的方法分析旅游行为的框架。本文介绍了使用基于GPS的手机定位记录来研究旅行活动的行为,特别是旅行次数、在目的地所用时间以及使用的交通方式。此外,本研究考察了个人旅游行为与旅游行为之间的关系,并提出了对旅游业有用的一些有趣见解,如旅游流,主要目的地或出发地,最佳目的地类型,最佳交通方式所用时间和行驶距离,以及个人移动信息的可能性估算游客旅行行为的可能性,即旅行次数,时间在目的地消费时间和旅行距离。此外,本文还介绍了基于此研究分析开发的应用程序。该应用程序允许用户观察城市规划人员,交通管理和旅游部门的旅行,非旅游和通勤旅行,以及家庭和工作场所以及旅行交通。

关键词:移动感知;移动模式;GPS定位痕迹;旅游行为

1.简介

随着信息和通信技术(ICT)的发展,今天的城市已经变得越来越有机械化且互通。城市居民的活动和运动通过嵌入城市系统(如CCTV,楼宇通道系统,公共Wi-Fi)以及个人电子设备(如手机,笔记本电脑,平板电脑)的无处不在的传感器进行持续测量和记录。生成大量的单个数字轨迹,从中可以捕捉到社区和城市级别的行为轨迹。总的来说,真实(物理)世界的都市形象可以用数字方式重建。因此,如最近的研究报告所述,可以对城市的特征,其功能和居民的行为进行分析。例如,Phithakkitnukoon等[1]介绍了一张地图,显示了城市不同地区最可能存在的活动,他们发现从事同一行业工作的人(例如餐厅,零售店等)往往具有相似的日常活动模式,基于他们对连接的分析近百万手机用户的手机信号塔位置(呼叫详细记录(CDRs))。Gonzalez等人[2]指出,纵向移动电话的位置也可以帮助揭示人类流动的有趣特征。他发现,尽管我们的旅行历史多样化,但人类遵循简单的可重复模式。同样,宋等人[3]发现人们对于他们的去向可以预测93%。 Song等人[4]后来开发了一种模型,反映了人们定期在固定地点之间往返的趋势。Phithakkitnukoon等人[5]表明,人们的旅行模式受其社会关系地理位置的影响,也为这些努力做出了贡献。

人类流动是21世纪最重要的生态和社会挑战之一。人们出于不同的目的旅行,例如通勤和旅游。通勤旅行通常以不变的路线重复;因此,这种旅行是相对可预测的。另一方面,旅游旅行难以预测。因此,了解旅游出行行为对城市规划,交通管理和旅游管理部门非常重要。移动电话等现今普遍存在的技术,如今已经成为许多人生活中不可缺少的组成部分,如最近的研究报告中所看到的那样,具有可帮助将手机变成个人传感器的感应功能,共同创造了一种融合人类的新型感应模式作为传感基础设施的一部分。通过利用手机的传感能力,研究人员能够从人们那里收集到前所未有的精细行为数据。它比传统的旅游行为调查研究提供了更大的优势。

传统的旅游行为研究倾向于依靠调查和问卷调查。例如,Alegre和Pou[6]使用三年收集到56915名游客的调查数据,来研究他们在西班牙巴利阿里群岛的居留时间。Gokovali等人[7]分析了从1023名游客收集到的三周问卷调查数据,研究在土耳其博德鲁姆度假的停留时间。最近,吴等人[8]根据日本1253名受访者的调查数据,研究了日本游客的选择过程。

在这项工作中,我们使用大规模的移动感知方法来分析旅游行为。我们分析了在日本收集的130,861个手机用户的GPS定位痕迹,为期一年。本文的其余部分将介绍我们使用GPS位置记录检测游客的方法。从这些记录中,我们能够进行旅游行为分析并展示对城市规划者、交通管理和旅游当局有用的应用。

这项工作的主要贡献包括以下内容:

bull;根据GPS位置信息确定旅游行程的计算框架(包括家庭和工作位置检测算法);

bull;旅游行为的大规模(国家级)分析,包括旅游流量、目的地时间、交通方式的选择、人员流动与出行行为之间的关系以及出行行为的相似性;

bull;基于分析开发的原型应用程序,允许用户观察和分析旅游行程和流量。

2.识别游客

2.1 数据

我们利用了机会感知模式,即手机可以作为个人传感器,以便将此个人通信设备用作我们分析的位置跟踪器。我们使用了从日本的130,861个手机用户收集的完整日历年(2012年1月1日至2012年12月31日)的GPS位置记录。这些数据是由日本领先的移动电话运营商之一提供给我们的,并且是从注册基于位置的服务用户(并且同意使用他们的位置信息)收集的。位置信息通过网络发送并用于执行特定分析,然后将某些服务提供给注册用户,如图1(a)所示。为了保护用户的隐私,在发送给我们之前,数据集完全由移动电话运营商匿名。数据集中的每个条目包括:唯一的用户ID,位置(纬度,经度),时间戳,高度和近似误差(即lt;100,lt;200或lt;300 m)。为了减少电池消耗,使用加速计来检测相对停滞的时段,在此期间可以暂停耗电的GPS采集功能。采样率随用户的移动性而变化,但不超过每五分钟一次。例如,图1(b)显示了我们数据集中移动电话用户的位置轨迹。

图1 数据收集过程和示例数据

由于各种原因,我们研究对象池中的一些科目没有GPS位置痕迹,例如电话关闭,未订购服务或出国旅行;因此,为确保我们的分析有足够的数据量,我们选择了2012年(365%)365天内至少有350天观察到GPS位置的130,861位受试者。

2.2 家庭和工作场所位置检测

为了从GPS轨迹识别游客,首先我们必须检测对象的家庭和工作场所位置来仅仅考虑非通勤旅行。从这种非通勤旅行中可以确定旅游行程。为了检测家庭和工作场所的位置,我们的方法有三个步骤,如图2所示。

图2 家庭和工作场所检测方法

第一步是识别站点,该站点是记录的近距离GPS位置的集合,即用户花费大量时间的位置。位置点可以是家庭,工作场所,餐馆,市场等。我们聘请了15个实验人员携带一个月的智能手机,并提供一个应用程序允许受试者识别他们每天所做的停留 有了这个地面实况信息,我们发现,空间和时间标准[9]最准确地确定停止是196米和14分钟,我们的实验结果显示在图3(a)和(b)。如果Xu=﹛Xt1,Xt2,hellip;hellip;,Xti,hellip;﹜表示用户的GPS位置集合。Xti是t时刻的位置,那么我们的实验结果表明集合Xti, Xti 1, Xti 2,hellip;,Xtm在196m内,tm-tile;14 min作为停止。

第二步是停靠点的空间聚类。该集群的质心被认为是一个重要的地方(例如,家庭,工作场所,其他)。对多种聚类技术进行了评估,我们发现DBSCAN(基于密度的噪声应用空间聚类)[10]在所有技术中表现最好。为了进行验证,我们开发了一个工具,允许工具用户在观察停靠点集群后标记重要位置,如图4所示。使用此工具,我们用400个被试人员的家庭和工作场所位置注释了我们的数据,并使用此工具作为我们验证中的地面实况。我们的实验结果(如图3(c)所示)表明DBSCAN在标识匹配重要位置的停止集群的中上,优于其他技术(k-均值,交互式k均值)。DBSCAN(ε= 30 m和MinPts = 5 points)在0.0001十进制单位(asymp;11.1 m)处达到近100%的准确率,而k均值和交互式k均值只能达到不到10%。(注:1.0的小数点位数约为111.32公里。)

图3 停止的空间和时间标准的实验结果

图4 我们开发的手工标记工具和标记示例的快照(为了解释这个图图例中对颜色的引用读者可以参考这篇文章的web版本)

最后一步是将重要地点归类为家庭或工作场所。手工标记的地面实况被用于这项任务,我们发现随机森林[11]与k-最近邻居法和朴素贝叶斯分类器(表1,使用10倍交叉验证)相比,使用以下10个不同的特点::

—集群排名:排名最高的集群可以指示家庭和工作场所的位置。

—集群中的一些站点:在某种程度上,这表明了地方的重要性,因为人们往往比其他人更频繁地访问重要地点,例如家庭和工作场所。

—停留时间:它是一天中几小时的部分时间,集群停止出现。例如,如果从上午9点到下午4点(全年)观察到停止,则此功能将为8/24。

—停留天数:观察到集群停靠的天数。

—非活跃时间:对于每一个主题,一个不活跃的周期被定义为几个GPS位置比平均至少连续三个小时还少的时间。非活动小时数功能是非活动时段的群集停止的一部分。

—白天停留小时:观察到停止的白天部分(上午9点至下午6点)。

—夜间停留小时:观察到停止的夜间部分(晚上10点至早上6点)。

—最长停留持续时间:停止持续时间的最大值。

—最短停留持续时间:停止持续时间的最小值。

—平均停留持续时间:停止持续时间的平均值。

为了进一步验证我们的家庭位置估计,我们将我们的结果与人口普查数据进行了比较,并观察到基于我们家庭位置估计的估计人口密度与2006年日本人口普查[12]获得的城市人口密度信息具有可比性(R 2 = 0.9666),如图5所示。

图5 人口普查数据中得出的我国手机用户与实际城市人口的对比

表1 家庭和工作场所分类的性能比较

2.3 旅游行程检测

在获得对家庭和工作场所位置的确切估计之后,我们能够确定通勤(家庭和工作场所之间)以及非通勤的旅行。假设Su = S1,j,S2,j,hellip;hellip;, Si,j,hellip;是用户u的停止集合,其中Si,j是具有空间概况j的第i个停止;我们将旅程定义为一系列从家中开始并在家中结束的停靠点。换句话说,trip = {Sm 1,home,Sm 2,j,Sm 3,j,hellip;,Sm t,home } 其中t是行程中的停靠站的总数。因此,通勤旅程被定义为至少出现一个停靠点在工作场所(Si,work)的旅行,即commuting = {Sm 1,home,Sm 2,j,hellip;,Sm i,work,hellip;,Sm t,home }。另一方面,非通勤旅程被定义为在工作场所没有出现任何停靠站的旅行,即non-commuting = {Sm 1,home,Sm 2,j,hellip;,Sm i,j,hellip;,Sm t,home }。

在非通勤旅程中,我们将旅游旅行视为至少有一次在旅游目的地出现的一种旅行,即touristic trip ={Sm 1,home,Sm 2,j,,hellip;,Sm i,touristic,hellip;,Sm t,home }。对于我们的分析,我们使用了日本国土交通省(MLIT)提供的旅游目的地信息[13]。旅游目的地信息由两个数据集组成:一个包含目的地的位置(纬度,经度),另一个包含目的地的形状(即shapefiles)。这两个数据集不重叠;换句话说,这两个数据集不包含相同目的地位置。为了将停靠分为旅游或非旅游,我们使用了两个数据集。我们将旅游停靠点定义为距离旅游目的地位置200米内或旅游目的地覆盖的多边形区域内的站点。因此,空间概况j可以被识别为家庭,工作,旅游或非旅游。

3.旅游行为

被检测到的旅游旅行接下来被用于我们的旅游行为分析。根据我们的家庭位置估计,来自日本47个不同地区的受试者人数如图6所示,受试者的空间分布如图7所示。相应的县名在表2中列出。东京有如预期的那样(因为我们的主题分布与人口普查人口密度相关性良好(图5))有最高的受试者数量(15,586),其次是神奈川(8588)和琦玉(7329)。

图6 来自不同地区的受试者人数(表2中给出名称)

在我们的旅游行为分析中,我们对旅行流量感兴趣的是日本各地的往返旅行次数、目的地时间、游客使用的交通方式、个人出行和旅游出行行为之间的相关性。在很大程度上,旅游业的环境和社会影响是旅游旅行数量的产物[14]。因此,了解旅游流的这些特征对于在我们走向可持续旅游业时做出更明智的决定非常重要。

图7 受试者数量的空间分布

表2 地区标识及相应名称

3.1 旅游旅行的次数

对于我们数据集中的每个受试者,使用前面介绍的算法提取旅游行程。图8(a)描述了受试者出行次数的分布情况。总共有1,987,858次旅行,相当于平均每人15.19次旅行。旅行分为三类:短途(少于5公里),中途(5-100公里)和长途(超过100公里)。图8(b)显示了这三个不同范围的旅行次数分布。

图8 旅行次数和旅行距离的分布

基于被试者的估计家庭地点,图9(a)显示了不同县的(已排序)外出旅游旅行,其中东京的流出量最高(495,904),其次是神奈川(161,422)和福冈(109,962)

全文共13513字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[10795],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。