基于NPS数据挖掘的电信行业客户忠诚度提高的研究外文翻译资料

 2022-04-29 21:56:57

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


基于NPS数据挖掘的电信行业客户忠诚度提高的研究

摘要:近年来,电信公司对客户关系管理采用了NPS (净推荐值)的概念,但既没有明确的理论研究,也没有具有指导意义的实例研究。然而,本文总结了通过实例案例分析来提高客户忠诚度的方法,通过NPS数据挖掘,对远程企业具有广泛而实际的意义。首先,本文发现一些顾客忠诚度驱动力量,相对于客户消费,如呼叫持续时间、使用的数据、ARPU等等,通过一些基于信息增益和xg-boost决策树模型的创新推理分析,所以电信公司可以在大数据预测个人客户和每日形式监控的作用,这将节省大量NPS调查成本。其次,本文总结了客户群体特征如何影响NPS与财务绩效的关系。以ARPU值为绩效目标,将样本客户分为6组,基于k-means聚类对其特征进行总结,并给出每组的针对性建议。

关键词:净推荐;NPS;客户忠诚度;数据挖掘

1 介绍

净推荐是Fred Reichheld(2003)为企业的良性利润和实际增长提出的“客户忠诚”的概念[1]。这可以用一个问题来衡量:“你向朋友或同事推荐X公司的可能性有多大?”最初的描述使用了一个10点的响应尺度[2],例如,在0到10的范围内回答9或10的人是发起人,而低于这一标准的是被动的或者诋毁者。发起人和诋毁者是影响实际产品声誉的客户,他们在客户总数中所占百分比的差异是NPS(净推荐值)。

虽然学术界[3] [4] [5]和市场[6]的研究人员对这一说法进行了辩论,但许多公司都采用了NPS,证明了忠诚作为一种重要的价值驱动因素的重要性[7]。一些研究表明,以客户为基础的措施和WOM(口碑)[8] [9]之间存在着很强的正相关关系,而且,定期监测NPS作为了解未来财务绩效的前瞻性指标是有效的[10] [11]。近年来,电信也为客户研究引入了NPS,然而,相关的学术研究仍然很少,主要围绕着研究组织[12],评价手段[13],或对NPS调查数据的一个小样本进行描述性统计分析[14]。

因此,本文试图有效地结合大规模数据和精细管理的实际情况,为挖掘NPS数据提供一些建议,以提高客户忠诚度,在新形势下赢得口碑。

2 研究背景

2.1 理论背景

基线模型来源于欧洲客户满意度指数(ECSI)模型,该模型是一个完善的衡量和解释顾客满意度和相关结构的框架[15] [16],而顾客满意度与忠诚度并无显著相关[17] [18]。ECSI评级框架如图1所示。

图1 ECSI评级客户结构模型

然而,值得注意的是,ECSI并不一定适用于事实上是垄断市场[19]的中国电信行业,在这里没有选择不满意的客户,所以他们必须是“垄断的忠诚”。基于上述原因,我们将变量“满意度”从基线模型中引入,而忠诚度调查设计是基于基本的净推荐问题,而不是基于ECSI评分的问卷。

2.2 概念模型

然后,根据研究,定期监测CSI[20] [21]或NPS[22] [23]作为了解未来财务绩效的前瞻性指标是有效的[24],另外,年龄、性别和使用时间对其有调节作用[25]。我们有理由认为,以客户为基础的措施与金融绩效之间存在调节关系。概念模型如图2所示。

图2 概念模型

如果忠诚度真的是一种衡量经济增长的指标,那么我们应该第一步找到如何根据其他与客户相关的特征或绩效指标来预测NPS分类,然后如何影响企业的忠诚度,进而影响公司的发展。这就引出了如下的研究问题:

问题1:是否可以根据其他与客户相关的特性或性能指标来预测单个客户的NPI?

问题2:户群体特征是否可能影响NPS与财务绩效的关系?

这项研究的目的有两个。首先,客户的推荐评分(即意图推荐)是否可以根据客户的实际客户相关特性进行预测,这将在第三章中探讨。其次,通过充分利用规模(即0到10的规模),将在第4章将调查被分配到相同NPS类别的客户(即推荐者、被动者或诋毁者)是否对分配给其他类别的客户的财务表现具有同质性。

3 特性贡献

3.1 方法

为了研究提高NPS的策略,首先我们必须弄清楚是什么因素影响了单个客户的推荐评分。因此,本文试图通过基于IG(信息增益)和基于决策树模型的推理分析来分析顾客忠诚度的驱动因素。

在模型构建中,本文选择了常用的增强决策树模型来预测客户的角色(推动者、被动者或贬低者),并收集每个特征的信息增益来比较其对客户推荐的贡献。

摘要提高决策树分类器属于集成学习模型,它是最常用的非线性分类器,因为它具有较低的拟合风险。它的基本思想是将成千上万的树模型与低分类精度结合起来,成为高精度的模型。本文利用xg-Boost算法实现了增强模型,对连续值特征具有较高的容忍度,对预测精度和速度有较高的预测精度,甚至无需对决策树进行修剪。

3.2 数据和样本

一个独特的数据集结合了客户的推荐得分和他们的特征或行为数据被用来测试研究问题。

通过发送短信,如“亲爱的客户,我们真诚地邀请您参加本次调查活动”进行了网络启动调查。我们想知道,你愿意向你的亲戚和朋友推荐电信A吗?请以0 - 10的比例回答,更大的分数意味着你更有可能推荐它。免费回复的。”短信通过热线扩展端口发送给移动通信客户,其月平均的ARPU高达10元。调查共进行了6次,但确保每位客户收到的短信不超过2次,共收集了90935份有效评分。然后,从BOSS amp;CRM系统中匹配消费者的个人数据,有5个类有35个特征的样本数据集,其数据框架如表1所示。

表1 样本数据结构图

为了减少空值对模型的干扰,我们选择连续3个月的数据在44610的规模上建立模型,80%的数据被选择为训练集(35688),剩下的20%作为测试集(8922)。该模型是用python语言实现的。

3.3 描述性统计:相对特征的重要性。

根据客户反馈的推荐程度,客户分为3个角色,即9到10个是启动子,7到8是被动的,0到6是批评者。然后使用xg-boost来分析35个特性的信息增益,除了NP到客户角色,他们的贡献如图3所示。

图3 每个特征对预测客户分类的贡献

根据图3,在可能决定个人客户推荐程度和角色的因素中,语音通话时长(CD)的贡献最大,其次是平均数据流量(AF, 2GAF, 3GAF, 4GAF), ARPU,超出语音/短信计划(EC)的额外成本。此外,消费者的语音/短信计划(SM)、职业团体(CG)、支付的数量(PM)等,对客户的角色分类也有不同程度的影响。显然,更多的客户使用电信的产品或服务,他们将会接触到更多的联系,这将通过其网络质量、通话质量、服务成本和其他经验点间接影响到电信的客户忠诚度和声誉,并最终体现在他们的推荐意愿和角色上。因为,相对于消费的特征,如通话时长、网络流量的使用、ARPU等,与角色分类有较高的非线性关系,即它们的信息增益较高。

值得注意的是,2G/3G/4G数据使用量的信息收益依次递减。可以推断,在大规模用户选择4G的条件下,仍然使用3G或2G的客户群体具有较高的群体异质性,在客户忠诚度或WOM上显示出极化,而4G用户群则相对稳定的忠诚度和WOM更为均匀。

此外,语音/短信计划之外的额外费用对客户的推荐程度有很大的影响。可以推断出,当额外的成本出现时,顾客可能会觉得服务费用太高或不合理,进而影响他们的忠诚度和WOM。因此,电信应更加重视引导客户选择合适的语音/短信计划,从而促进客户的ARPU,有效地避免用户体验或感知不良的出现,从而提高客户的忠诚度和品牌声誉。

3.4 结果:预测模型

在3.3的基础上,我们得到了一个分类决策树,它可以通过不断地监督和迭代训练集上的模型来预测客户的角色(在附录中给出了决策树结构的过程表达式),其训练集的准确率为82.46%。然后利用分类器来预测客户在测试集上的作用,并以71.24%的准确率得到相对有效的预测,而混淆矩阵如表2所示。

表2 客户角色预测的模糊矩阵

考虑到缺陷或缺乏原始数据,例如,在每个调查数据中提取不完全相同的,或者是样本在每个功能有不同程度的缺失,等等,因此,在实际的业务数据完成,准确率应该有更大的进步,和分类预测模型将更加可靠和可行的。

在客户推荐的角色上构建预测模型确实很有帮助。另一方面,可以将调查成本节约在NPS上。另一方面,通过在业务分析系统中对模型的固化,使得电信更容易形成和日常的大规模滚动监控。但值得注意的是,NPS数据的整合只是一个开始,对于员工来说,通过进一步的电话调查或实验设计来理解和分析两者之间的因果关系更为重要。毕竟,我们的最终目标是找到合适的方法来优化现有的流程并改进用户体验。

4 标记客户的NPS和性能

如上所述,理解或分析NPS数据与业务开发之间的因果关系更为重要,但也更为困难。因此,NPS的经济效益可以通过进一步发掘细分客户根据当前的性能目标和消费者的行为、活动、地区等。然后我们可以采取适当的策略来发现和解决核心用户的痛点,并发展推动者、减少批评者或提高被动者等等,来实现经济增长。

4.1 方法:客户分类

为了进一步细分客户群体并对其特征进行标注,本文采用k-means聚类将客户划分为6组,并总结了每一种专业聚类的特点。

在数据处理中,本文选取了样本数据中的数值变量和排序变量(如数据流的使用、ARPU等),即从13个维度进行聚类和分类。删除空值后,总共有77150个有效数据。此外,每个属性都被规范化以标准化变量。在聚类方法中引用了elbowe原则,系数K确定为6。本文使用python和get k-means聚类结果如图4所示。

图4 6个客户群体的K-means聚类结果

根据聚类结果和其他各簇的年龄分布情况,可以归纳出六组的标记如下:

第一组:有效的4G消费群。他们拥有最高的ARPU,因为平均数据的使用率最高,而且超出了语音/短信计划的额外成本,主要使用4G网络。这是一个非常普遍的群体做超预算消费和支付最频繁的账单。

第二组:传统2/3G人群。他们主要使用2/3G和语音/短信计划,成本较高,但数据流量较少,因此他们每月对数据使用的需求最大。这个群体的整体年龄是中年人,他们习惯于通过实体的商务大厅而不是虚拟的联系方式来查看账单的余额或者改变语音/短信计划,所以他们很可能面临双重的停止服务的警告。

第三组:沉默的计划人群。他们通常不会拨打热线咨询或业务,因为语音或数据计划足够他们处理日常使用。这一群体的总体ARPU相对较低,因此,由于他们较低的活动和对电信的依赖,更换SIM卡的成本也更低,这是更容易失去的客户。

第四组:困惑和预付费人群。这样的客户是相对最忠诚的客户,他们习惯于预付定金,这样他们的账户就足够有先见之明,而且不太可能被终止。但是这些慷慨的客户的共同问题是他们不熟悉计划和其他业务设置的细节,这导致了更多的数据订单和热线电话。

第五组:电话交谈的人群。这些客户主要是相对频繁的充值支付业务人员,其重要特征是高通话时间和高ARPU。

第六组:严格的预算人群。他们有最低的平均数据使用量或通话时长,而对叠加数据计划的需求则更少,这导致了低消费和ARPU。然而,他们非常忠诚,使用时间更长,SIM替换成本更高,尽管他们是沉默的和不活跃的。

4.2 结果:识别性能

为了找到最有价值的用户根据当前的性能目标和NPS,六个客户群体的NPS和ARPU值画在坐标图,然后是NPS-ARPU象限(图5)和对应的关系表(表3)。此外,据Satmetrix NPS基准研究在2010年,法国电信的平均为-1%,最高为23%,所以我们可以设置NPS的阈值水平为23%,也就是说,一个NPS超过23%意味着它拥有更高的客户忠诚度。

图5 6个客户群体的NPS-ARPU象限图

表3 6个客户组的统计表

第四象限:低的NPS和高的ARPU客户,应该专注于改善体验。在这篇论文中,他们是第二组,需要给予最优先的关注,尤其是在对日常服务经验或意见收集的反馈中,因此,电信可以在改进中提出针对性的参考,并及时停止不良的经验。

第一象限:高NPS和高ARPU客户,应注重预防。摘要Ⅰ和Ⅴ组,我们应该注意数据监测和预警,避免不良的经验。

第二象限:高NPS和低ARPU客户,应注重活动市场。在这篇论文中,他们是沉默的集团和集团,我们应该通过推荐有针对性的语音/短信计划以及捆绑销售等促销活动来促进消费和传播。

第三象限:低NPS和低ARPU客户,应注重客户保留。本文似乎他们沉默Ⅲ组最低的忠诚和对产品的依赖。在资源充足的情况下,我们应尽一切努力提供贴心的客户关怀活动或有针对性的建议,如语音/短信计划的更换,这将有助于改善NPS,避免客户流失和流失。

5 结论

首先,从个人客户推荐意愿的角度出发,通过基于IG(信息增益)的表示分析和基于决策树模型的推理分析,试图分析顾客忠诚度的驱动因素。一方面,我们发现更多的顾客使用产品或服务的电信、接触越多,他们将经历导致的功能相对消费,如呼叫持续时间、使用数据流,ARPU,等等,有更高的非线性关系的角色分类,也就是说,他们的信息增益高。另一方面,我们构造一个classifi阳离子决策树可以预测个体客户的作用与分类器的准确率是82.46%在训练集和测试集的71.24%。虽然其准确性仍是有限的,因为原始数据的缺点,电信NPS可以有效地节省调查费用,并形成日常监测在大型数据。

然后,为了帮助电信公司根据业务需求进一步细分客户群体,本文采用k-means聚类方法将客户划分为6组,并总结了每个具体集群的特点。另外,为了根据当前的性能目标和NPS找到最有价值的用户,本文绘制了6个客户群体的NPS- arpu坐标图,并试图

全文共10653字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[12960],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。