预测个人消费:基于调查的指标与谷歌趋势外文翻译资料

 2023-01-08 11:01

预测个人消费:基于调查的指标与谷歌趋势

作者:托尔斯滕·施密特、西蒙·沃森

国籍:德国

出处:鲁尔经济文献第155期 第3-21页

摘 要

在本研究中,我们根据谷歌趋势提供的搜索数据查询时间序列,从而引入了一种新的个人消费指标。该指标基于的因子是从谷歌趋势应用搜索的消费相关搜索类别中提取的。我们根据两项由调查得到的最常见的指标——密歇根大学消费者信心指标和世界大型企业联合会消费者信心指标,来评估这项新指标的预测表现。结果表明,在几乎所有的样本内和样本外预测实验中,谷歌指标都优于调查得到的指标。这表明,结合谷歌趋势数据得到的模型,可能会对学者预测个人消费有显著的帮助。

关键词:谷歌趋势;个人消费;预测;消费者情绪指标

1引言

由于个人消费约占美国国内生产总值GDP的70%,因此及时了解有关个人家庭的支出信息对于评估和预测整体经济活动非常重要。美国的个人消费数据每月公布一次,比即时数据滞后一个月。因此,高频率的领先指标不仅有助于预测未来,也有助于预测当月的情况。在宏观经济动荡并具有很大的不确定性且过去其他的宏观经济变量价值失去预测能力时,这些指标的高频率和发表的领先地位对经济预测者十分有用。

基于调查的情绪指标,是通常用于预测消费的主要指标。这些指标要求家庭评估他们自己以及国民经济当前和即将到来的经济状况,并试图从经济和心理两个方面来解释消费者的行为。根据长期以来许多文献的记载,美国消费者情绪指标与美国消费之间存在很强的相关性。事实上,最常见的基于调查获得的消费指标——密歇根大学的消费者信心指数(MCSI)和世界大型企业联合会的消费者信心指数(CCI)。尽管他们时间领先程度似乎有所不同,但与实际消费联合起来看相当显著(图1)。然而,关于这些指标收集信息的能力的实证文献几乎没有达成共识,这些信息尚未在收入、财富和利率等宏观经济基本面中得出。Fuhrer(1993)发现MCSI中大约70%的变异可以用其他宏观经济变量来解释,这表明大部分情绪可能仅仅反映了受访者对一般经济状况的了解。指标可能无法准确地反映出预期与实际支出决策之间的联系。Carroll(1994)等人和Ludvigson(2004)在样本回归中发现,消费者信心指标对美国消费具有解释力,而对其他宏观经济变量的影响则不那么明显。其他包括Croushore(2005)使用实时数据进行样本外预测实验的研究则发现MCSI和CCI在预测消费者支出方面没有显著价值。

本文介绍了一种利用谷歌趋势提供的互联网搜索行为数据而构建的新的个人消费指标。由于互联网的日益普及,可以肯定的是,有许多人使用网络搜索引擎来收集他们打算购买的商品的信息。在2008年,美国电子商务零售总额(不包括旅游)为1323亿美元,占零售总额的3.5%。这一比例可能看起来相对较小,但美国市场研究公司eMarketers估计,86%的互联网用户是在线购物者,这意味着他们在网络上对商品进行研究和比较,但不一定选择在网上购买产品。因此,eMarketers估计,受在线研究影响的线下销售额可能是线上销售额的三倍。由此可以得出,有关搜索查询的数据可能更多地与个人家庭的支出决策相关,而非情绪指标。宏观经济变量表明了消费者的消费能力,基于调查的指标试图可以捕捉到消费者的消费意愿(Wilcox, 2007),而谷歌指标的特殊之处在于,它旨在通过使用与消费相关的搜索查询量,为消费者的消费准备提供一种度量。谷歌趋势数据的早期应用包括Choi和Varian(2009a和2009b),他们使用谷歌Insights搜索分类,对零售、汽车销售、房屋销售、旅行和首次失业申请进行了临近预报实验。Ginsberg等人(2009)使用大量谷歌趋势搜索查询,来估计美国当前的流感活动水平。Askitas和Zimmermann(2009)发现,与求职活动相关的特定查询可用于预测德国失业率。Suhoy(2009)在以色列的工业生产、零售贸易、贸易和服务收入、消费者进口和服务出口以及商业部门就业率方面,测试了谷歌趋势查询的预测能力。

为了使用谷歌数据预测个人消费,我们从谷歌趋势数据搜索应用程序提供的网络搜索类别的时间序列中提取了常见的未观察到的因子。我们通过测试谷歌因子在多大程度上改善了一个简单的自回归模型,与常见的基于调查的情绪指标相比,评估了新指标对经济预测者的有用性。根据现有的关于消费指标的文献,还应评估个人消费的任一指标是否有能力改进已经包括其他宏观经济变量的预测模型。因此,我们使用一个扩展的基线模型重复这个练习,该模型包括与消费者支出相关的其他几个宏观经济变量。我们使用2005年1月至2009年9月的月度数据进行样本内和样本外预测实验。结果表明,在几乎所有的实验中,谷歌指标都优于基于调查的指标。

本文的其余部分结构如下:下一节将介绍数据和其相应的指标。第3节介绍了评估谷歌指标预测性能的实证方法,第4节讨论了结果,第5节对全文进行了总结。

2 指标

谷歌趋势提供了通过谷歌进行的相对搜索量的索引。其搜索解析应用程序提供了搜索查询的聚合索引,使用自动分类引擎将搜索查询分为605个类别和子类别。我们在其中选择了56个我们认为最适合东亚银行国民收入和产品账户个人消费支出产品类别的消费相关类别。谷歌趋势数据每周提供一次,但因为消费数据仅按月提供,所以我们对此计算月平均值。然而,谷歌的时间序列没有经季节性调整,要计算出准确的季节性因素几乎是不可能的。因为数据只有在2004年开始才可以使用,而且由于房地产危机和随后的金融危机,过去两年的时间数据一直动荡不安。因此,我们使用的是同比增长率,而不是经季节性调整的数据水平或月度增长率数据。当然,这种方法的一个缺点是,我们失去了12个月的观察结果。

为了在预测模型中尽可能多地使用谷歌数据中的信息,同时又不超出预测模型的自由度,我们从谷歌数据中提取常见的不可通过观察得到的因子,并将这些因子作为外生变量进行回归。同时我们采用非加权最小二乘法提取因子,该方法的优点是它不需要正定色散矩阵。此结果不能得到保证,因为某些搜索查询可能存在负相关性。为了选择因子的数量,我们最初使用了Kaiser-Guttman准则。根据样本周期的不同,这个标准建议使用11到13个因子来解释83%到94%的方差。正常的指标表明,所得模型与数据较为吻合(表1)。然而,由于样本周期相对较短,我们需要进一步减少因子数量,以避免过度拟合预测模型。因此,我们对每一个单一因子和2到4个因子组成的所有组合的方程进行估计,并进行短时预测和提前一个周期的预测。使用具有最大特征值的四个因子,得到了最佳结果。在下文中,我们仅将这四个因子与其他指标进行比较。

我们采用的基于调查的指标为密歇根大学消费者信心指数(MCSI)和世界大型企业联合会消费者信心指数(CCI)。这两个指数都试图衡量同样的概念,即消费者信心,并且两者都基于五个问题,包括当前条件和期望组成部分。主要区别在于,CCI更重视劳动力市场状况,而MCSI则采访调查了家庭的财务状况以及他们目前对大宗购买的态度。因此,CCI略微滞后于MCSI,因为它与失业率的关系更大,而失业率通常滞后于商业周期。由于构造方法的不同,CCI显示的移动也比MCSI更大。由于所有这些差异,尽管这两个指标总体上仍然高度相关(图1),但都可能产生相互矛盾的信号。所以为了更好地与谷歌指标进行比较,我们还使用了同比增长率,而不是基于调查的指标水平。

3 预测实验

为了确定谷歌因子相对于调查得到的指标的预测能力,我们首先估计了一个简单的消费增长自回归模型,作为基线模型:

其中,C表示为实际个人消费的月度同比增长率,h是预测范围(0表示现在,1表示1个月前的预测)。我们使用施瓦兹信息准则来确定自回归的顺序,允许最多三个滞后。时间聚合和重叠周期可能会在估计中引入MA(1)误差。因此,我们将误差项建模为MA(1)过程。

接下来,我们将MCSI,CCI和谷歌因子添加到基线模型中,以了解仅通过这些指标分别能在多大程度上改善模型的预测能力:

其中是相应的指标,同样允许最多三个滞后。为了评估这些指标提供的信息是否超出了通常嵌入预测模型中的其他宏观经济变量,我们估计了一个扩展的基线模型,其中也包括宏观经济变量。这些变量的选择确实有些武断。因此我们采用了Bram和Ludwigson(1998年)和Croushore(2005年)也使用的模型。它增加了方程式(1),个人实际收入y、三个月国库券i的利率和股票价格s(由标准普尔500指数测量)。最后两个变量具有一个月的发布领先优势,因此可以用于现在的预测。对于所有宏观经济变量,我们也使用同比增长率。

最后,对扩展后的基线模型再次进行了相应指标的扩充:

我们进行了样本内和样本外预测,以确定这些指标在多大程度上有助于预测消费者支出的变动。在样本预测中,测试从2005年1月到2009年9月的整个样本期内各指标的预测能力,而样本外测试则调查该预测能力在若干个子时期的稳定性。为了检验哪个指标对基线模型的改进效果最好,我们计算了与基线模型相比,各指标增广方程的未解释方差(增量)的相对减少量。我们还计算了F统计量,来检验各个指标的系数和它的滞后值是否为零。最终该检验可以表明,未解释方差的相对减少是否具有统计学意义。

同时,我们使用递归方法进行样本外实验。首先我们用2005年1月至2007年12月的数据估计模型。然后对2008年1月到2009年9月进行样本外预测,每次增加一个月,重新估计模型并计算当前(现在)或下一个月的一系列预测。指标增广模型的预测由其各自的均方根预测误差(RMSFE)与其他模型的比值来评估。并通过Harvey-Leybourne-Newbold(1997)对Diebold-Mariano(1995)检验统计量的修正来确定显著性。

4 实验结果

表2显示了2005年1月至2009年9月期间指标增强模型(2)相对于基线模型(1)的样本内评估结果。它报告了调整后的的增量,该增量具有相应指标的基线方程和用于测试的F统计量。指标的系数及其滞后值都为零,且所有指标都显著改善了基线模型。因为我们使用的重叠增长率和因变量的滞后已经解释了变量的很大一部分,所以增量普遍较小。谷歌增强模型实现了临近预报的3个百分点的最高增量,和对未来一个月预测的2个百分点。由于两个预测区间的都增加了2个百分点,CCI指标的表现略差,MCSI指标则差很多。如果使用扩展的基线模型(3)作为相关基准,则指标的信息内容会减少,但仍然显著。在这两种预测水平下,所有指标都将调整后的提高了一个百分点。但MCSI除外,其一个月前预测的增量现在已接近于零。

图2和图3分别显示了指标增广模型(2)和(4)的样本外预测性能,并将预测值与实际消费水平进行比较。图2显示,谷歌指标是2008年12月消费触底后唯一准确反映拐点的指标。其它模型的预测在触底后的一个月表现尤为糟糕。这个结果强调预测模型不应只着眼于调查得到的指标。如果将宏观经济变量纳入基线模型中(图3),那么使用基于调查的指标进行增强的模型表现明显更好。表3中报告了所有指标增强模型的RMSFE,以支持这些直观印象。一旦模型中包含其他宏观经济变量,基于调查的指标的RMSFE就会大幅下降。对于谷歌指标来说,情况就不那么清晰了。就目前而言,包括宏观经济变量在内的预测误差略有减小。然而,对于一个月前的预测,情况则恰恰相反。有趣的是,有几个模型预测下个月的表现比预测当前月的要好。

表4和表5比较了指标增强模型和基线模型的精度。此外,还提供了指标增强模型等预测精度的测试统计数据。第一项报告了MCSI获得的RMSFE与相应基线模型的RMSFE之比。第二项记录了CCI的RMSFE与基线模型的RMSFE之比。并对指标增广模型进行了比较。低于1则表示第一个模型的性能优于第二个模型。Harvey、Leybourne和Newbold(1997)对Diebold-Mariano(1995)测试小样本的预测精度进行了统计,并写在第二栏。修正后的Diebold-Mariano统计数据仅用于指标增广模型的比较,因为它们只适用于非嵌套模型。该统计数据具有学生的t分布,并显示RMSFE的差异是否具有统计显著性。负号表示第一个模型的预测误差小于第二个模型。

表3显示,如果使用基线模型,则谷歌指标的性能显著优于所有其他模型。然而,与CCI增强模型相比,改进的Diebold-mariano统计数据效果并不显著。如果加入宏观经济变量(表5),所有指标的相对预测能力都会下降。对于这两种预测水平,MCSI甚至都不如基线模型。因此,对于MCSI,我们的结果更倾向于Croushore(2005)的结论,即一旦将其他宏观经济变量包括在内,该指标在预测方面没有显著价值。然而,添加了CCI和谷歌因子后,扩展基线模型的RMSFE仍显著降低,CCI在短时预测中表现最佳,谷歌指标在对未来一个月的预测中表现最佳。然而,这两种预测模型的差异已不再显著。

5 总结

研究表明,谷歌趋势是预测个人消费的一个非常有前途的新数据来源。在几乎所有的实验中,谷歌指标的样本内和样本外预测能力均优于传统的基于调查的指标。其他类别选择方法可能会进一步提高指标的预测能力。自2008年以来,谷歌还专门为产品搜索提供了数据,并且分成了各个相应的类别,理论上更适合于消费预测,因为它们与购买的相关性高于此处使用的网络搜索查询。然而,目前甚至没有2年的可用数据,这迫使我们参考网络搜索类别获取至少2年的数据。最终,采用季节性调整的谷歌数据可能也比使用同比增长率更合适。不过,由于准确的季节调整也需要更多的时间,所以本文没有进行季节性调整。鉴于数据库的时间跨度很短,因此本文只能提出初步的见解,一旦有了较长的时间序列,就一定会有改进的余地。然而,该研究表明,谷歌趋势数据今天已经为消费者

剩余内容已隐藏,支付完成后下载完整资料


Forecasting Private Consumption: Survey-based Indicators vs. Google Trends

Author:Torsten Schmidt、 Simeon Vosen

Nationality:Germany

Source:Ruhr Economic Papers #155 Pages 3-21

Abstract

In this study we introduce a new indicator for private consumption based on search query time series provided by Google Trends. The indicator is based on factors extracted from consumption-related search categories of the Google Trends applica- tion Insights for Search. The forecasting performance of the new indicator is assessed relative to the two most common survey-based indicators - the University of Michigan Consumer Sentiment Index and the Conference Board Consumer Confidence Index. The results show that in almost all conducted in-sample and out-of-sample forecast- ing experiments the Google indicator outperforms the survey-based indicators. This suggests that incorporating information from Google Trends may offer significant benefits to forecasters of private consumption.

JEL Classification: C53, E21, E27

Keywords: Google Trends, private consumption, forecasting, Consumer Sentiment Indicator

November 2009

1 Introduction

Since private consumption represents about 70 percent of US-GDP, timely information about private household spending is important to assess and predict overall economic activity. Data on private consumption for the US are published monthly and with a lag of one month. Leading indicators with high frequency can therefore be helpful not only in predicting the future but also the present month (nowcast). The high frequency and the publication lead of these indicators are of particular usefulness to economic forecasters in times of macroeconomic turbulences, great uncertainty or unique shocks when past values of other macroeconomic variables lose predictive power.

The leading indicators that are typically used to predict consumption are survey- based sentiment indicators. These indicators try to account for both economic and psychological1 aspects of consumer behaviour by asking households to assess their own and the national economyrsquo;s current and upcoming economic conditions. The empirical literature has long noted a strong correlation between consumer sentiment indicators and consumption in the US. Indeed the co-movement of the most common survey-based consumption indicators – the Michigan Universityrsquo;s Consumer Sentiment Index (MCSI) and the Conference Boardrsquo;s Consumer Confidence Index (CCI) – and real consumption looks quite remarkable although the time-lead of the indicators seems to vary (figure 1). However, there is little consensus in the empirical literature about these indicatorsrsquo; ability to collect information that is not already captured in macroeconomic fundamentals such as income, wealth and interest rates. Fuhrer (1993) finds that roughly 70 percent of the variation in the MCSI can be explained by other macroeconomic variables, suggesting that large part of sentiment might simply reflect respondentsrsquo; knowledge of general economic conditions. A possible weakness of the survey-based indicators could be that they do not accurately capture the link between expectations and real spending decisions. Carroll et al. (1994) and Ludvigson (2004) find in in- sample regressions that consumer sentiment indicators nevertheless have explanatory power for US consumption additional to that contained in other macroeconomic variables. Other studies, including Croushore (2005) who uses real-time data for out-of-sample forecasting experiments, find that the MCSI and the CCI are not of significant value in forecasting consumer spending.

This paper introduces a new indicator for private consumption which is constructed using data on internet search behaviour provided by Google Trends. Due to the increasing popularity of the internet it is certain that a substantial amount of people also use web search engines to collect information on goods they intend to buy. In 2008,U.S. e-commerce retail sales (excluding travel) totalled $132.3 billion or 3.5% of total retail sales.2 This share may appear relatively small but the U.S. market research firm eMarketers estimates that 86% percent of the Internet users are online shoppers, which means they research and compare but not necessarily purchase products online.3 As a result, eMarketers estimate store sales influenced by online research to be three times higher than e-commerce sales. Data about search queries could thus be more related to spending decisions of private households than sentiment indicators. While macroeconomic variables indicate consumersrsquo; ability to spend and survey-based indicators try to capture consumersrsquo; willingness to spend (Wilcox, 2007), the Google indicator intends to provide a measure for consumersrsquo; preparatory steps to spend by employing the volume of consumption related search queries. Earlier applications of Google Trends data include Choi and Varian (2009a and 2009b) who conducted nowcasting experiments for retail sales, auto sales, home sales, travel and initial unemployment claims using categories of Google Insights for Search. Ginsberg et al. (2009) used large numbers of Google Trends search queries to estimate the current level of influenza activity in the US. Askitas and Zimmermann (2009) found selected queries associated with job search activity to be useful in forecasting the German unemployment rate. Suhoy (2009) tests for Israel the predictive power of Google Trends queries for industrial production, retail trade, trade and services revenue, consumer imports and services exports, as well as employment rates in the business sector.

To use Google data for forecasting private consumption, common unobserved factors are extracted from time-series of web search categories provided by the Google Trends application Insights for Search. We assess the new in

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[272319],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。