多城市自行车停车场数据分析的交互式可视化分析外文翻译资料

 2022-03-01 08:03

Interactive Visual Analytics for Multi-City Bikeshare Data Analysis

Alicia Bargar, Amrita Gupta ⇤ , Srishti Gupta, Ding Ma

Georgia Institute of Technology Atlanta, GA, USA

{abargar3, agupta375, srishtigupta, mading}@gatech.edu

ABSTRACT

Bicycle sharing schemes are gaining traction as an alterna- tive or complementary mode of urban transport. In this pa- per, we explore the utility of an interactive web-based visual analytics application for comparing usage patterns between

dicrarr;erent bike sharing programs. We demonstrate the poten- tial for adjustable filters on user demographics and trip char- acteristics to reveal dicrarr;erences in ridership between cities. We also perform clique-detection and Louvain modularity- based community detection to reveal areas of high connect- edness under dicrarr;erent contexts. Our work utilizes the ST-

DBSCAN algorithm in a novel context to cluster trips as a

means of categorizing flow patterns. Finally, using publicly available data from bike share organizations, we conduct some experiments combining the data filters, algorithms and visualization. This preliminary work showcases the value of interactive visual analytics for highlighting notable dicrarr;er-

ences between established bike share systems that may help

frame questions for future research or policymaking.

Categories and Subject Descriptors

H.2.8 [Database Applications]: Data Mining

Keywords

bike share, community detection, visualization, visual ana- lytics

INTRODUCTION

Bike share schemes are an increasingly prevalent mode of intra-city transportation. In April 2013 there were 26 bike- share programs in the US [11], a number expected to double in the subsequent 2 years as many cities are investigating this option for a number of reasons. Bike sharing can provide an alternative to traditional modes of transport or, more likely,

⇤Corresponding author. Tel: 14108071155

Email address: agupta375@gatech.edu

Permission to make digital or hard copies of all or part of this work for personal or classroom use is granted without fee provided that copies are not made or distributed for profit or commercial advantage and that copies bear this notice and the full citation on the first page. To copy otherwise, to republish, to post on servers or to redistribute to lists, requires prior specific permission and/or a fee.

UrbComprsquo;14 August 24, 2014, New York, NY, USA Copyright is held by the author/owner(s).

a complementary service for solving the “last mile problem” of getting from a public transportation stop to the final des- tination. Furthermore, bike share systems may help miti- gate automobile congestion and reduce pollution, although relatively little research has been done to asses their actual impact in these areas. Benefits to users include potentially reduced commute times by perhaps as much as 10% [9]; and

a healthier lifestyle–one recent study investigating the ecrarr;ect of the London cycle hire scheme on the health of over half a

million of its users reported a measurable reduction in dis- ability adjusted life years, particularly for male and older participants [17]. These potential benefits have contributed to the recent rise in bike share feasibility studies and policies to promote cycling in the USA.

To ensure the success of such ventures, it is useful to study the operation of existing public bicycle programs to identify features that improve the ecrarr;ectiveness of bike share scheme implementations. For instance, a comparison of bike share schemes in China revealed that government-led invest-

ment, enforced bicycle lanes and technologically sophisti- cated equipment greatly boosted the performance of bike share schemes [18]. Making public bicycles available to non- registered users can increase the number of trips taken and introduce new flow patterns between docking stations [12] compared to a system reserved for use by subscribers only. Studies also suggest numerous station-specific variables (neigh- boring land use, population density, proximity to transit, distance from the CBD, bike lanes and bicycle infrastruc- ture [6, 7, 15], among others) and city-wide variables (station density, weather, demographics, attitudes towards cycling)

that acrarr;ect bikeshare ridership.

Although bike share usage patterns and trends necessar-

ily vary between cities, there are relatively few comparative studies in the literature. However, jointly analyzing dicrarr;er- ent bikeshare programs may bring to light valuable insights that can be used to improve or expand existing services or to shape planning decisions for a new scheme [19]. Further-

more, the analysis in bikeshare network studies is not acces- sible to non-technical persons. This paper aims to address these needs through a web-based interactive visual analyt- ics application for simultaneously exploring bikeshare data from multiple US cities. Specifically, we focus on detecting sub-communities in networks from usage patterns subject to filters like date, time, trip duration, and user data. We use maximum clique detection to identify the most intercon- nected parts of the bikeshare network, as well as modularity- based community detection to find sub-communities. Addi- tionally, our use of ST-DBSCAN to cluster similar trips is a

novel application of this algorithm. Urban planners may be able to leverage such a tool to improve cycling infrastructure or identify target regions or demographics for expanding a bikeshare system.

RELATED WORK

Cycling is seen as a cost-ecrarr;ective, eco-friendly and healthy mode of urban transport, and as such numerous research ef- forts have sought to determine factors that may promote

its ado

剩余内容已隐藏,支付完成后下载完整资料


多城市自行车停车场数据分析的交互式可视化分析

Alicia Bargar,Amrita Gupta,Srishti Gupta,丁马

乔治亚理工学院,乔治亚州亚特兰大,美国

Abargar3,Agupta375,srishtigupta,mading@gatech.edu

摘要

作为一种交替或互补的城市交通方式,自行车共享方案正受到越来越多的关注。在本文中,我们探讨了一个基于Web的交互式可视化分析应用程序的实用性,用于比较其他自行车共享计划。我们展示了用户人口统计和出行特征的可调过滤器的潜力,以揭示城市之间的出行差异。我们还执行了小组检测和基于模块化的Louvain社区检测,以揭示不同环境下的高连通性区域。我们的工作利用了新上下文中的dbscan算法将trips作为一个对流程模式进行分类的方法。最后,利用自行车共享组织的公开数据,我们结合数据过滤器、算法和可视化进行了一些实验。这项初步工作展示了交互式视觉分析在突出显著差异方面的价值。现有自行车共享系统之间的NCE可能有帮助为未来的研究或决策制定制定问题框架。

类别和主题描述符

H.2.8[]:数据挖掘数据库应用程序

关键词

自行车共享、社区检测、可视化、视觉分析

1. 引言

自行车共享计划是一种日益流行的城市内部交通方式。2013年4月,美国共有26个自行车共享项目[11],预计未来2年将翻番,因为许多城市出于多种原因正在调查这一选择。自行车共享可以替代传统的交通方式,或者更可能的是,

通讯作者。电话: 14108071155

电子邮件地址:邮箱:agupta375@gatech.edu

允许制作本作品的全部或部分数字或硬拷贝供个人或课堂使用,无需付费,但前提是复制品的制作或分发并非为了利润或商业利益,且复制品在第一页附有本通知和完整引文。否则,要复制、重新发布、在服务器上发布或重新分发到列表,需要事先获得特定的许可和/或费用。

urbcompamp;apos;14号2014年8月24日,纽约,纽约,美国版权归作者/所有者所有。

为解决从公共交通站到最后一站的“最后一英里问题”提供补充服务。此外,自行车共享系统可能有助于缓解汽车拥堵和减少污染,尽管对这些领域的实际影响进行的研究相对较少。对用户的好处包括可能减少10%的通勤时间[9];以及更健康的生活方式——最近的一项研究调查了伦敦自行车租赁计划中超过一半人的健康状况。它的百万用户报告说,特别是男性和年龄较大的参与者,经能力调整后的寿命显著减少[17]。这些潜在的利益促成了最近自行车共享可行性研究和政策的上升,以促进美国自行车业的发展。为了确保这些项目的成功,研究现有公共自行车项目的运行情况有助于确定提高自行车共享方案实施效率的功能。例如,对中国自行车股份计划的比较显示,政府主导的投资强化的自行车道和技术先进的设备大大提高了自行车共享计划的性能[18]。与仅供用户使用的系统相比,向非注册用户提供公共自行车可以增加出行次数,并在停靠站之间引入新的流量模式[12]。研究还提出了许多特定的车站变量(低洼的土地利用、人口密度、接近公交、距中央商务区的距离、自行车道和自行车基础设施[6、7、15]等)和城市范围的变量(车站密度、天气、人口统计学、对自行车的态度)。骑自行车的人。尽管自行车有着共同的使用模式和趋势城市之间的差异很大,文献中的比较研究相对较少。但是,联合分析Di-er-ent Bikeshare项目可能会带来宝贵的见解,这些见解可用于改进或扩展现有服务或为新方案制定规划决策[19]。进一步更重要的是,在比基尼网络研究中,非技术人员无法进行分析。本文旨在通过一个基于Web的交互式视觉分析应用程序来满足这些需求,该应用程序可以同时研究来自美国多个城市的自行车交通数据。具体地说,我们关注的是根据日期、时间、行程持续时间和用户数据等过滤器的使用模式检测网络中的子社区。我们使用最大群检测来识别bikeshare网络中最相互连接的部分,以及基于模块化的社区检测来发现子社区。另外,我们使用ST-DBSCAN来集群类似的旅行是该算法的新应用。城市规划者可能能够利用这一工具来改善自行车基础设施,或者为扩大自行车市场体系确定目标区域或人口统计。

2. 相关工作

自行车被认为是一种经济、环保、健康的城市交通方式,因此,许多研究人员试图确定可能促进交通发展的因素。它被城市居民采用。这项工作大部分是通过调查进行的,例如,Dill和Carr利用美国50个城市的人口普查数据,统计分析自行车通勤者数量与城市密度或平均人口年龄之间的相关性[4]。然而,随着现代双循环共享系统的出现,在停靠站进行的自动数据收集使自行车运输的定量评估成为可能。早期关于自行车共享系统的研究主要是通过从车站占用数据中提取时空活动模式来描述系统行为。这些研究中的许多都是从对接站的时间占用情况分组开始的。Froehlich、Neu-mann和Oliver是第一批分析自行车共享使用情况的人,并试图利用他们的研究结果推断出城市中不合理的人类流动模式[8]。Kaltenbrunner等人认识到此类研究有可能改善现有自行车共享计划的性能。进行了一项类似的研究,利用采空站的活动周期,对采空站的发生进行短期预测[10]。Vogel等人还通过拾取和返回活动配置文件对站点进行聚集,并尝试通过检查站点的环境[14]。事实上,许多研究试图确定ECT扩展底座活动([15,7])的因素,显示对扩展底座的复杂依赖性。人口密度、人口密度、公共交通、海拔高度、邻近企业和工作密度。

与这些研究不同的是,Oamp;apos;Brien等人的研究主要集中在一个自行车共享系统上。分析了来自世界各地的38个系统,以建立基于时间使用模式的自行车共享系统分类[13]。这项工作还包括基于系统属性(例如站点数量、系统紧凑性比率、工作日和周末使用高峰数量等)的全球自行车共享的分层集群。这项研究强调了绘画的价值

比较自行车共享系统,了解城市参数和系统特定参数。迄今为止所讨论的文献大多进行了分析。使用站点占用数据。然而,这排除了对特定站点之间的链接的检查,这可能需要对自行车流量进行更精确的测量。Borgnat等人能够获取行程水平数据对里昂自行车共享系统的特点进行了广泛的探索性研究[5]。在整个系统范围内,他们对该计划的受欢迎程度、天气、节假日和一周中的某一天的租金进行了建模。此外,跳闸数据的可用性使它们能够执行一种基于分层模块的社区检测和k-均值聚类方法,根据边缘在特定高活动时间的权重对边缘进行分组。因此,由于跳闸数据的可用性,需要使用图论算法来探索网络特性,并扩大站点“群”的概念。在我们的工作中,我们已经实施了基于此目的的群体检测和社区检测,以及ST-DBSCAN[3]在集群类似旅行中的新应用。

近年来,许多自行车共享组织将车站和出行数据作为数据可视化挑战的一部分公开提供。这表明,自行车共享提供商对数据分析结果清晰呈现的需求日益增长,这一问题迄今为止很少受到信息可视化和视觉分析界的关注。即使只是简单地实现站点间的虚拟化出行也具有挑战性,因为节点之间的大量可能连接和站点的不均匀地理分布可能导致虚拟化混乱,并由于视觉显著性造成误导性印象。

Wood等人在伦敦自行车共享系统中,开发了一种交互式视觉化出行方式。[16]试图最小化因以增加频率的顺序绘制曲线的方式显示行程而导致的视觉混乱的后果,从而使被重叠遮蔽的链接最不常见。作者最近使用可视化技术研究了有关伦敦自行车赛美国年龄的具体问题,如通勤者[2]或男女用户[1]的行程。因此,很明显,交互性和灵活的查询可以促进探索各种与使用相关的问题。

我们的工作通过将这些研究的许多方面结合起来,创建一个针对Bikeshare方案管理者和类似的重新搜索者的可视化分析工具。我们相信,一个交互的应用程序运行各种数据过滤器,将允许界面用户快速提出感兴趣的问题。我们还增加过滤后的数据的可视化表示,可选择执行社区检测、集团检测和行程聚类。最后,应用程序有一个并排的布局,以方便多个城市之间的比较。

3. 数据采集

作为数据可视化比赛的一部分,许多自行车共享组织已经公开了他们记录的系统数据。我们从三个这样的组织获得了站点和旅行数据:总部位于波士顿的Hubway、华盛顿特区的Capital Bikeshare和芝加哥的Divvy。数据包括站点信息和跳闸日志。前者包含站点ID、名称、坐标和容量,而日志记录了行程起点和终点站、自行车结账和返回时间戳、行程持续时间和用户信息。在芝加哥,注册用户占芝加哥旅游的53%,波士顿有记录的旅游占64%,华盛顿有记录的旅游占80%。数据被清除并输入到sqlite数据库中。

4. 算法

在设置了日期、时间、行程持续时间、用户类型、年龄和性别的过滤器后,可以选择行程数据的一个子集并构建一个有向图或网络,其中节点是扩展底座,边缘是站间行程,边缘权重对应于站对之间的行程数。随后,我们可以将各种图论算法应用于该网络,以研究其连通性。

4.1 最大值检测

在给定出行数据子集的情况下,选择最大群检测来确定网络的最大互联部分。将加权有向图结构转化为加权无向图,其权值小于最小交通门限的边缘不完整。然后求出高交通图的最大值。这一计算可能有助于确定服务于紧密联系的次社区或城市中一个独立的地区。

4.2 Louvain模块化优化

采用贪婪的模块化优化方法(Louvain算法[4])进行社区检测,以寻找不一定形成完美群体但仍然高度连通的站点群。首先,Louvain方法通过在本地优化模块化来寻找“小”社区。然后将节点聚集到同一个社区,构建一个节点为社区的新网络。重复这些步骤,直到获得最大的模块化,并生成社区的层次结构。选择这种方法是为了找到比平均连接更多的台站组,这可能意味着存在隐藏的子市。

4.3 ST-DBSCAN扫描

我们选择ST-DBSCAN[3]来聚类类似的旅行,因为它能够将数据的时间和其他非空间特性合并到基于密度的空间聚类中。DBSCAN算法的核心是使用邻域定义密度。在我们的实现中,ST-DBSCAN利用空间(旅行的地理位置)和时间(旅行的开始和结束时间)信息在执行集群之前找到“相似”的旅行。这种方法的目的是通过将一组相邻的站点和另一组站点之间的行程分组来提取一致的流模式,这些行程发生在一天中大致相同的时间。

5. 可视化

我们创建了一个可视化工具来比较不同城市自行车使用的模式。为了实现这一点,我们设计了我们的应用程序,用各种过滤器并排显示两个地图,允许用户调整他们希望比较的程序的哪个方面。车站由其大小与在该站开始或结束的行程数成比例的圆圈,相对于显示的总行程数。圆圈的颜色编码了入站和出站跳闸的比率,其中“下沉”型站点的颜色更为红色,“源”型站点的颜色更为蓝色。点击一个站点可以显示数据和从那里开始和结束的边缘。我们的三个算法有单独的面板和一个站点活动查看器面板。

图1:可视化工具。左列包含用于在可视化组件和过滤器之间切换的选项卡。

地图和站点标记在一个用于创建地图的开源JavaScript库Spealet中实现。个性化地图瓷砖由Stamen设计提供(非商业用户免费)。d3的缩放特性用于确定单个路径的颜色和宽度。过滤小部件和逻辑是通过jquery和jquery ui的混合实现的。具体来说,jquery ui提供了一个calen-dar小部件和范围定标器,帮助用户选择日期和时间间隔。一旦过滤参数通过小部件被选中,它们将通过jquery-ajax调用发送到服务器,在服务器上它们将被传递到rel-evant-python脚本。结果以JSON格式发送回客户机进行可视化。

6. 实验与讨论

在设计我们的可视化工具时,我们决定专注于提供我们的算法的可视化简单化表示,并尽量减少对结果的解释。我们的目的是让人们更深入地了解我们考虑使用我们的方法作为工具的城市,同时试图限制误解的可能性。为此,我们的虚拟化基于基本形状、颜色和大小,文本仅限于鼠标单击时提供的站点详细信息。我们工具的四个组件有一个单独的可视化:一个用于每个算法,一个用于探索性分析,与单个组件的焦点保持一致。在应用可视化更正之前,将清除每个可视化海绵状的。我们测试了我们的视觉效果波士顿自行车共享系统提供的数据,华盛顿特区和芝加哥。

6.1 探索性分析:波士顿的深夜骑手

我们为我们的工具开发了一个探索性的分析组件,让用户能够使用我们的过滤和可视化功能发现或考虑数据中的模式。在这个组件中,一个圆代表地图上的每个站点。其半径与该站的出行次数相对应。我们使用对数比例的总旅行次数,以确定确切的半径大小。颜色表示每个站点的入站和出站跳闸的比率(以梯度表示)。所有进站的车站将是红色的,而所有出站的车站将是蓝色的。黑色被分配给所有没有车站的行程。在这里,我们用波士顿的自行车共享计划演示了如何根据数据过滤应用程序的能力,有助于识别子群体中的系统使用趋势。这一特殊情况对计划主管寻求促进系统的发展可能具有实际意义。

图2:波士顿男

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[431138],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。