使用Google数据和多变量模型预测德国汽车销量外文翻译资料

 2022-07-02 22:35:27

英语原文共 39 页,剩余内容已隐藏,支付完成后下载完整资料


使用Google数据和多变量模型预测德国汽车销量

Dean Fantazzini Zhamal Toktamysova

莫斯科州立大学莫斯科经济学院,Leninskie Gory,俄罗斯莫斯科119992

俄罗斯莫斯科高等经济学院经济学院

摘要:由于开发和生产过程所需的时间过长,长期预测对于汽车行业来说至关重要。考虑到这一点,本文提出了使用经济变量和Google在线搜索数据预测月度汽车销量的新多元模型。使用10个德国汽车品牌在2001年1月到2014年6月期间的月销量,实施了对预测范围外的样品的未来2年的预测和比较。包括谷歌搜索数据在内的模型在统计上优于大多数汽车品牌和预测值的竞争模型。在考虑了非线性模型、不同的样本外预测、方向精确性、Google数据和其他汽车品牌的变化性等多项鲁棒性后,这些结果也成立。

关键词:汽车销售 预测 Google Google趋势 全球金融危机 严重衰退

1.引言

汽车销售的长期预测在汽车行业中扮演着重要角色。准确的预测可以帮助企业提高市场表现,减少损失,并更有效地规划制造流程和营销策略。艰难的竞争,重要的投资以及对快速模型更新的需求是汽车行业的特点,它使得预测成为销售和生产过程中至关重要的因素。像其他复杂的行业一样,它的特点是产品开发周期长,从12个月到60个月不等。因此,有效的生产计划需要准确的长期销售预测。不准确的预测可能会导致一些负面影响,如库存积压或生产供应短缺,不同的劳动力活动成本高昂,制造商声誉丧失甚至破产。

影响汽车行业的经济因素有多种,可以大致分为三类。第一类包括产品的技术方面:质量,创新和技术,发动机的性能和经济性,功能性,安全性,空间管理,设计和美学(Lin and Zhang, 2004; Sa-ngasoongsong and Bukka- patnam, 2011)。第二类包括促销和销售因素,包括批发和零售价格,客户服务,广告活动和品牌形象(Landwehr et al., 2011)。这些因素是很重要的,但通常不会产生长期影响,大多数情况下汽车生产商可以管理和控制它们(Dekimpe et al., 1998; Nijs et al., 2001; Pauwels et al., 2002, 2004)。第三类包括组织问题,政治问题,全球经济增长,生态和自然力量,社会文化影响和消费者行为等一般超出制造商控制的各种政治、经济和社会环境因素。这些因素在汽车销售预测中的使用相当有限,请参阅Bruuml;hl et al. (2009), Shahabuddin (2009), Wang et al. (2011) and Sa-ngasoongsong et al. (2012) 。此外,大多数以前的研究都集中在短期的汽车动态销售,预测通常少于4个月,而汽车销售预测需要时间尺度,持续时间长达一年或更长。

随着越来越多的互联网用户(International Telecommunications Union, 2014)以及谷歌作为获取汽车信息的搜索引擎越来越受欢迎,我们建议使用谷歌搜索数据作为汽车销售长期预测的领先指标。在这方面,谷歌搜索在所有搜索引擎中占有54%的市场份额,在全球领先(Net Applications,2014)。自2004年以来,它提供了一种叫做Google趋势的工具,该工具提供给用户在特定搜索查询中,在给定地理区域和给定时间的相对感兴趣的信息(数据每周或每日可用)。此外,Google趋势可以将查询归入不同的搜索类别(汽车,电脑,金融,健康等)。近年来,全球研究人员开始利用在线搜索数据来产生实时预测,其中官方信息的发布具有滞后性(例如“临近预报”),或者仅仅作为预测目的的额外变量,参见Choi and Varian (2012); Askitas and Zimmermann (2006); Suhoy (2009); Ginsberg et al. (2009); Da et al. (2011); D#39;Amuri and Marcucci (2013); Fantazzini and Fomi- chev (2014)提供了一些最近的应用。

考虑到这一点,我们提出了一套德国汽车销售长期预测模型,该模型考虑了经济变量和在线搜索查询。德国是全球第三大汽车生产国(2013年约为1400万辆,占世界总产量的20%),在欧洲绝对领先(占欧洲总产量的31%),请参见德国汽车行业(GTAI, 2014)和德国贸易和投资组织(VDA, 2014)获取更多详情。对于互联网用户来说,德国在欧洲的用户数量(欧洲用户的12.3%)居于世界第七。2014年6月,德国有超过7100万人至少每月访问一次网络,占成年人口的88.6%(Internet World States, 2014)。

本文的第一个贡献是一组包含Google数据和经济变量的多元模型。到目前为止,绝大多数文献都使用Google数据作为短期预测的单变量模型的外生变量。鉴于汽车行业需要长期预测,简单的单变量模型并不足够,并且需要多变量模型才能为所有变量提前多步预测,包括Google数据。此外,我们考虑非季节性数据的多变量模型、经济文献中常用的方法以及未经季节调整的数据,这在实践中更为常见,因为规划和生产部门倾向于使用原始数据。

我们的论文的第二个贡献是对德国10个汽车品牌的大规模预测,我们计算了未来1个月至24个月的样本外预测。我们的研究结果显示,包括汽车销售,Google数据和经济变量在内的模型在大多数汽车品牌的中期表现都优于其他车型,而多元模型(包括汽车销售和Google数据)的表现优于其他模型的长期预测24步。从长远来看,使用简约模型对于获得精确的预测至关重要,并且使用Google搜索数据代表了一种简单而强大的方式来总结大量可用信息(另请参阅Fantazzini and Fomichev, 2014)。

本文的第三个贡献是一组鲁棒性分析,用于验证我们的结果在考虑非线性模型、不同的样本外预测、使用方向精度作为主要评估工具、Google数据在不同日期下载和其他汽车品牌情况下是否仍然成立。

本文的结构如下:第2节描述了数据和样本内分析,第2.1节报告了预测模型及其样本外的表现,在刚刚结束的第4节和第5节中讨论鲁棒性。

2.数据和样本分析

根据联邦汽车运输管理局(Kraftfahrt-Bundesamt)的新闻稿,我们分析了德意志联邦共和国的新车注册情况。这些数据涵盖了2001年1月至2014年6月共162次观测结果。数据包括每月按车型分类的新车注册数量和从2001年开始按品牌注册乘用车的新数据。由于不同原因,某些汽车品牌的信息被截断:某些品牌仅在2001年以后出现;有的品牌数据在2014年之前被停止记录;或者由于每月登记数量较少,所以登记统计数据未发布。我们的汽车品牌是根据新车注册的时间长具有可用性以及它们在“汽车品牌”Google子类别中的选择而选定的。此外,汽车品牌也被选中用以反映国内外汽车生产商。

自2001年以来,只有22个品牌的月度数据持续存在,并且出现在Google趋势中。我们通过记录每个品牌的平均销售量以及使用对具有欧几里得距离的数据计算k均值的分类方法将这些品牌分成集群。我们想确定大,中,小型汽车制造商,并将所有品牌分为三个集群。K均值聚类法允许我们定义先验群的数量,并最小化群内距离,同时最大化群间距离(参见例如Hartigan, 1975)。选择最初的k个聚类中心来最大化初始距离。数据排列到最近的聚类中心,因此形成k个聚类。接下来,选择新的聚类中心作为聚类的质量中心。重新计算后,数据再次分配给最近的集群中心。当所有质心都稳定后,程序结束。我们发现了三个由以下品牌组成的集群:

bull;大卖家:大众,欧宝,福特,宝马,奥迪(平均月销售额在19523至53820之间);

bull;中型卖家:雷诺,丰田,标致,现代,菲亚特,马自达,雪铁龙,日产(平均月销售额在4976至14074之间);

bull;小卖家:捷豹,起亚,路虎,保时捷,斯巴鲁,本田,沃尔沃,三菱,铃木(平均每月销售额在355至3351之间)。

我们还将2001年1月至2014年6月的月度销售数据与K均值聚类法结合使用,并将同一部门划分为三个集群。

为了空间利益和保持经验分析的计算方便,在整篇论文中,我们将考虑三个大卖家(大众,欧宝,宝马),三个中型卖家(丰田,菲亚特,雪铁龙)和四个小卖家(捷豹,起亚,三菱,铃木)。其余12个品牌将在4.5节中进行鲁棒性检验。

月销售情况如图1所示(右侧纵轴)。汽车销售受到季节性波动影响,所有汽车品牌在年内都会出现几个高峰,最大的一个在春季末期发生。总的来说,冬季汽车销量下滑。人口普查X-12季节性测试发现,所有品牌都表现出稳定的季节性趋势,没有季节性移动的迹象。

第二个数据来源于Google趋势,该数据可以从www.google.com/trends/下载,使用特定的“汽车和车辆”类别及其“汽车品牌”子类别。Google指数(GI)是查询特定类别(本例中为汽车品牌)的数量与给定时间点所选区域的比率。这些数据是德国在2004年1月至2014年6月期间收集的。数据的频率为每周,并通过取平均值转换为一系列月度数据。虽然关键字的谷歌指数被规范化为0到100之间,其中100是搜索查询的高峰期,但类别的谷歌指数以2004年1月第一次观测的百分比变化表示,使他们可以既可以为正,也可以为负。他们的情形如图1(左纵轴):值得注意的是,谷歌指数的转折点能预计所有汽车品牌的汽车销量。初步证据表明,Google数据对于中长期预测来说可能有所帮助。

此外,根据Shahabuddin (2009)Sa-ngasoongsong et al. (2012),我们列出了一些与汽车销售有关的经济变量。假设这些变量反映了国民经济状况以及影响消费者购买汽车决策的因素。表1列出了选定的经济变量及其描述。收集2001年1月至2014年6月的数据。所有的数据,除了建筑施工订单(仅适用于季节性调整数据)之外,都显示出某种形式的季节性特征如夏季高峰期和年底低谷。季度GDP数据通过二次匹配平均程序转换为月度数据,而Euribor的日常数据通过平均值转换为月度数据。他们的情况在图2中给出。

季节性行为数据是根据美国人口普查局制定的人口普查X-12调整计划进行季节性调整的。但是,我们也考虑了原始数据,因为它们在实践中更为常见且让生产计划人员和营销经理更感兴趣,他们的决策基于具有季节性的实际数据。

所有数据都被转换成对数数据以减少变异性,并将非线性模式转换为线性模式(见Sa- ngasoongsong et al., 2012)。 汽车注册,Google数据和经济变量(季节性调整数据和原始数据)的描述性统计数据不是为了利益而报告的。为了选择每个汽车品牌的最佳多变量模型,我们遵循Sa-ngasoongsong et al. (2012) 就美国汽车市场案例所讨论的结构关系辨识方法。 简而言之,第一步是使用单位根检验来确定整合的顺序; 如果所有变量都是平稳的,则使用VAR和VARX(具有外生变量的向量自回归)模型。第二步使用Hall et al. (2002)中的弱连续性连续复位方法确定每个变量的外生性,书中认为弱外生性的每个变量都不会拒绝测试,然后重新测试剩下的变量,直到所有弱外生变量被识别。对于非平稳变量,采用协整秩检验的方法来确定内生变量之间是否存在长期关系:如果是这种情况,则使用VECM或VECMX(具有外生变量的向量误差修正模型)模型,否则应用VAR或VARX模型。最后一步是计算所选模型的脉冲响应函数,以追踪单位冲击对未来汽车销售价值的影响,然后计算样本外预测值(详见

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可: Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版