三种不同的旅游预测方法的比较外文翻译资料

 2022-04-03 10:04

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


三种不同的旅游预测方法的比较。

Vincent Cho

摘要:

预测在旅游规划中起着重要的作用。对涉及大量资金的旅游项目的推广需要对未来需求和市场渗透的估计。如果能够分析当前和过去的旅游流量并预测旅游需求变化的性质,那么发展旅游业就会容易得多。这些预测方法需要历史数据。本文研究了三种时间序列预测技术的应用,即指数平滑法、单变量ARIMA和Elman的人工神经网络模型(ANN),以预测不同国家到香港的旅游需求(即到达人数)。指数平滑和ARIMA是两种常用的统计时间序列预测技术。第三种方法,神经网络,是一种来自计算机科学的人工智能技术。根据本文的分析,神经网络似乎是预测游客到来的最佳方法,尤其是那些没有明显模式的系列。

  1. 简介

20世纪,世界各地的旅游业稳步增长。组织水平、运输方法和在目的地的设施都得到了加速的改善。信息高速公路的到来和大众传媒的显著变化,增强了旅游业的吸引力,在竞争的价格下,对优质服务的需求也越来越大。要想成功,在这个领域的企业家必须知道如何分析和解释现有的数据给他或她的优势。

预测在旅游规划中起着重要的作用。对涉及大量资金的旅游项目的推广需要对未来需求和市场渗透的估计。如果能够分析当前和过去的旅游流量并预测旅游需求变化的性质,那么发展旅游业的承诺就会容易得多。

本文研究了三种时间预测技术的应用,即指数平滑法、单变量ARIMA和人工神经网络(ANN),以预测不同国家到香港的旅游需求(即到达人数)。指数平滑和ARIMA是两种常用的统计时间序列预测技术。第三种方法,神经网络,是一种来自计算机科学的人工智能技术。根据本文的分析,神经网络似乎是预测游客到来的最佳方法,尤其是那些没有明显模式的系列。

  1. 背景

旅游业对交通、住宿、餐饮、娱乐和零售行业都有好处,在过去的几十年里,旅游业一直在蓬勃发展。1999年,全球国际旅游收入约为4,550亿美元,约为6.64亿人次。根据世界旅游组织(2000年)的数据,到2020年,世界各地的国际游客数量预计将达到16亿,旅游收入将超过2万亿美元(世界贸易组织,1996年)。旅游业是发展最快的产业之一。1999年,东亚和太平洋地区的旅游业增长尤为迅速,旅游人数增长了11.5%。东亚和太平洋地区的游客达9750万人次,旅游收入超过734亿美元(WTO, 2000)。

香港作为印度--中国和东南亚的一部分,也是通往中国的门户,从旅游业的发展中获益良多。在1999年和2000年,分别有11.3万人次和1310万人次。在货币方面,对外汇收入作出最大贡献的旅游收入,分别在1999年和2000年分别为56.2港元和615亿港元(香港旅游协会,1986-2000)。

由于全球经济衰退和1998年东亚经济危机,香港的所有行业都经历了衰退,尤其是在危机过后的旅游业。香港大部分酒店的入住率平均约为73%,而1998年1 - 7月来港的游客数量则下降至540万,而1997年同期为640万(香港旅游协会,1986-2000)。最大的下降,约为57.6%,是来自韩国和印度尼西亚的入境游客人数(香港旅游协会,1986-2000)。这对香港的零售店、餐馆和酒店都有直接影响。

在这项研究中,来自六个国家的游客:美洲、英国、日本、韩国、新加坡和台湾。最后,这里提出的预测方法可以使人们更准确地预测旅游业,并帮助制定各种旅游活动的规划。例如,本文的研究结果表明,1998年以谨慎的折扣为目标的日本市场可能有助于刺激该市场的一些需求。

三、方法论和分析

本研究比较了指数平滑、季节性ARIMA和ANN的预测。下面描述了所选的预测方法。

3.1. 指数平滑法

指数平滑法是一种试图从不规则变化中分离趋势或季节性的预测方法。当描述时间序列的组件可能随着时间慢慢变化(Yaffee amp; McGee, 2000)时,它被发现是最有效的。在指数平滑法中,一个新的估计是对当前时间周期的估计值加上在当前时间内产生的随机误差的蒸发。当用于预测时,指数平滑使用过去数据的加权平均值。随着时间的推移,预计最近的观察结果将呈指数递减。

大多数游客会受到经济环境和季节性因素的影响,例如天气或公众假期。如果一个季节因素存在于一个系列中,那么一个人就会期望在几个月之间出现大的波动。例如,在某些季节,如在原籍国的夏季假期,会有大量的游客来香港。相比之下,在秋季,游客人数可能会减少,因为他们的假期更少了。因此,在相邻时段或几个月的游客之间的相关性预计会很低。另一方面,大多数经济周期都是以年为单位的,经济指标在几个月之间波动更慢。因此,如果经济因素对游客的到来有强烈的影响,人们就会期望邻近的季度之间有更高的相关性。结果预测曲线将尝试跟随实际的曲线与一个月的时间间隔。为了适应趋势和季节性,冬季模型使用三个参数a;和g;计算预测。模型给出如下:

是预测在接下来的时间内,t 1;a(t)平滑估计的水平在时间t;b(t)平滑估计斜率在时间t;平滑估计(t 1)月季节在时间t 1-L;L是季节性的周期性。若要更新本系列的平滑部分,请使用

是水平的权重因子;是趋势的权重因子;是季节分量的权重因子。乘法冬季模型由线性趋势和倍增季节因子组成。该模型假设季节波动与水平成比例,但误差不相等。最近的观察是由其季节性调整因素,:如果很大,更多的重量给最近的观察;这使得级别可以更快地更新。对于大型 对最近的坡度估计值给出了更多的权重,而小 则给出了之前的斜率估计值。同样地,大的 给最近的季节因素的估计提供了更多的权重,而小则会使之前对季节因素的估计更有分量。三个平滑参数的每一个都用它自己的指数平滑方程进行更新。这些平滑方程组合在一起,将预测方程的组成部分与前一个组件的值相结合。

为了找到,和的最优值;选择了通过网格搜索提供最小平方和的值。网格搜索采用了一种尝试和错误的方法(SSE),选择了三个参数的组合。网格值以0开始,以1结束,以0.01递增。因此,网格生成101*101*101=1,030,301模型,每个参数取值范围为0、0.01、0.02hellip;等等,最多为1。产生最小的SSE的参数被记录并用于为该系列制定模型;桌面统计计算的出现使今天的过程变得更加容易。

四、ARIMA

ARIMA模型是灵活的,在timeseries分析中被广泛使用。ARIMA(自回归综合移动平均)结合了三种类型的过程:自回归(AR),差分消除了序列的集成(I)和移动平均(MA)。这三种过程中的每一种都有自己特有的应对随机扰动的方法。由此产生的一般线性模型(Pankratz 1983, pp. 281)是:

是时间点t的静止数据点;B二次变换算子,;L季节周期;是时间点t的当前扰动; 是;季节性算子; 是 ;季节性算子; 是 季节性算子;是 季节性算子; 是;非季节性差分算子;是季节性差分算子。

识别是一个关键的步骤,构建一个模型,p是AR秩序,这表明f的参数的数量;d是数据序列的个数必须有差异,以产生一个静止的序列Z;q的MA序,表示的参数个数;sp是表示的参数个数的季节AR阶;而sq是表示的参数个数的季节MA顺序;而sd则是数据序列需要以不同的方式来诱导一个季节性平稳序列的次数。

传统上,识别方法是应用于一组数据的粗糙过程,用来表示值得进一步研究的表征模型。这里的具体目标是获得p的值的一些概念;d和q在一般线性ARIMA模型中需要,并得到参数的估计。

这些参数通常通过检查自相关函数(ACF)和部分自相关函数(PACF) (Box, Jenkins,amp; Reinsel, 1994, pp. 64-67)的行为来确定。静止系列的ACF和PACF应该显示一个截止或快速死亡的模式。在实践中,d和sd的确定需要猜测可能值之间的不同组合,直到实现ACF和PACF的期望模式。下一步将是参数、p和q的识别;这涉及到ACF和PACF行为的研究。在这些过程中,我们可以建立一个试验性的ARIMA模型。然而,所有的参数都是由观察和主观猜测决定的,这是相当不可靠和不准确的。

4.1参数估计算法

在估计ARIMA模型参数的缺点上,作者设计了如下算法(图1).

该算法尝试了所有参数的组合,限制在0到2之间的整数。对最小拟合误差的组合进行搜索。参数的范围限制被设置为将搜索限制在一个合理的范围内。大于2的参数在实际中很少使用。

例如,一系列来自美国的游客被建模为AR 令p=2;MA令q=0;sp=2和sq=1与差分d=0季节性差分sd=1:对应的拟合误差在所有不同的参数组合是最低的。此外,解决方案空间受到限制,因此估计系数都在95%的预定置信范围内。

4.2人工神经网络(ANN)

埃尔曼的ANN模型(Elamn, 1990)是用来预测到达的。Elman的网络是一个经常性的网络,隐藏层的输出是对自身的反馈,因此它特别适合于合适的时间序列(Jhee amp; Lee, 1996)。模型如图2所示。时间t 1中隐藏层的激活被复制到上下文向量中,这是时间t网络的输入:这相当于将隐藏的层完全地、重复地连接起来,并沿着经常的连接在时间上向后传播一个步骤。因此,网络对新输入的反应是新输入和前文的函数。在任何给定时间内存储在上下文向量中的是所有前面输入的压缩跟踪,而这个压缩跟踪会影响网络对每个后续输入的响应方式。

4.3. 数据收集

游客到达香港统计得到从香港旅游协会的年度报告(1974 - 2000),和国家如美国、英国、日本、韩国、新加坡和台湾(如图3所示)被认为因为他们贡献大部分游客来自世界各地到香港。收集数据的时间为1974年1月至2000年12月。

从中国内地来的游客每月统计数字仅在上世纪90年代后才有记录。虽然越来越多的中国内地游客到香港旅游,但由于没有足够的数据让我们在分析中建立模型,中国并未纳入这篇论文。

收集的数据分为两组,训练数据和测试数据,以证明三种预测方法的性能。为了获得更可靠、更准确的结果,一个长时间的训练周期。根据这些考虑,从1974年1月至1998年12月的期间为培训期,1999年1月至2000年12月为测试期。

五、结果与讨论

5.1. 指数平滑法

指数平滑是通过使用计算机软件来运行的,是一个强大的统计软件包。 的参数通过网格搜索得到的是指数平滑的表1。参数平滑了水平方程。当值较低时,说明相应级数在训练期间是相当稳定的;另一方面,高值表示到达的波动较大。如表1所示,趋势平滑的参数;因为所有级数都是零。它表明,在训练期间,六个级数的斜率是恒定的,或者趋势可以用一条直线表示。季节效应被季节参数捕获;季节性的方程。这些参数 都是相互关联的。例如,的大值往往是的低值,反之亦然。

从表1中,英国和台湾的模式相似,值高,值为零。因此,人们可能会怀疑这些国家的游客数量在很大程度上取决于最近的入境人数,其趋势是持续的趋势和稳定的季节性影响。另一方面,低、高值的指数平滑模型表明,美国、日本、韩国、新加坡等国可能受到季节因素的强烈影响。

5.2.ARIMA

也使用了ARIMA的分析。用于估计参数的算法如图所示。使用嵌入在中的脚本语言(SAX Basic)中的程序执行。利用训练周期,使用描述的搜索算法对参数进行估计,如表2所示。利用这些参数,推导出Eq.(2)的系数(表2)。

一个常见的因素在所有国家中都是非零的。这将支持前一个月对当前一个月的影响。除日本外,所有系列都需要不同的或季节性的差异来产生平稳序列进行分析。这一系列的韩国需要区别对待;而美国、英国、台湾、新加坡等国则需要季节差异,因为日本系列不需要区别,所以它的模型看起来是最复杂的(p=2;q=2;sp=1;和sq=2)。

5.3. 人工神经网络

6系列的所有ANN模型都具有如上所述的相同结构。这些模型是在和它的神经网络模块的帮助下实现的。在进入网络之前,该系列的输入被标准化到范围(-1,1)。当误差平方和达到0.005时,循环网络的训练过程就停止了。误差率为0.005,达到了较好的精度,避免了模型的过度拟合。

5.4. 三种预测方法的比较。

通过三种预测方法对测试期游客的预测进行了预测,表3给出了结果。为了比较1999年1月至2000年12月期间三种方法的预测性能,计算出了以下精度指标:均方根误差(RMSE)和平均绝对百分比误差(MAPE) (Gaynor amp; Kirkpatrick, 1994, pp. 13-14)

RMSE被定义为

MAPE被定义为

其中是t时段的预测误差;的实际值t,以及在估计周期内的预测观测值n。

ANN的结果,在最小误差的情况下,似乎给出了三种方法的最佳性能。特别是,这是对日本和韩国等国的最好预测。这两个系列在图3中没有明显的模式,通常时间序列方法对此类数据几乎没有什么作用。除英国外,安在预测所有系列节目中表现出色。对于来自英国的游客来说,指数平滑似乎是最好的预测指标。这可能不是巧合,如图3所示,1997年和1998年,来自英国、日本和韩国的游客数量大幅下降,这是亚洲经济危机的时期;但危机过后又增加了。这个系列重复了几年前发生的模式和规模。虽然指数平滑模型基本上是过去观测的加权平均值,但这三个国家的方法表现良好也就不足为奇了。实际上,通过指数平滑法预测这三个级数的准确性要比ARIMA的预测好。

在这三种预测方法中,ANN虽然训练时间最慢,但却是最准确的。这表明,ANN更合适,可以用于预测游客数量的波动(图4)。

六、结论

本文研究了指数平滑、ARIMA和人工神经网络三种预测方法,并应用它们预测了来自6个国家(美国、英国、新加坡、日本、台湾和韩国)到香港的游客人数。结果发现,安的表现优于指数平滑和ARIMA。除了英国,安对所有游客到达系列的预测都是最好的,而英国最好的方法是指数平滑法。

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[468251],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。