电子商务中基于生命阶段的推荐外文翻译资料

 2022-10-29 09:10

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料



电子商务中基于生命阶段的推荐

江鹏 朱亚东 张奕 袁泉

中国北京阿里巴巴公司

美国圣克鲁斯加州大学

{jiangpeng.jp, edgewind.zyd, yuanquan.yq}@alibaba-inc.com

{yiz}@soe.ucsc.edu

摘要

虽然市场研究人员和社会学家已经认识到生活的阶段对消费者的购买行为的巨大影响,但是现有的推荐系统没有考虑到这种影响。在本文中,我们发现,在许多电子商务类别的生命阶段和购买行为之间的显着相关性。例如,对于一位妈妈而言,当她的孩子在不同年龄段的时候,她会寻求不同的产品。基于此,我们将生命阶段的概念引入到推荐系统中,提出了预测用户当前生命阶段并相应推荐产品的方法。基于长期以来所观察到的购买数据,我们提出了一个新的最大熵Semi Markov模型去划分和标签消费者所处的生命阶段。母婴类产品的生命阶段的过渡是确定性的,我们开发了一个有效的近似的解决方案用于大规模逻辑回归和维特比算法。我们还提出了高斯混合模型用于处理拥有多个孩子的消费者的生命阶段的预测问题。我们将预测到的生命阶段信息整合到最大在线购物网站——淘宝网的推荐系统中。在线和离线的实验都证明了基于推荐方法的生命期提出的有效性。

类别和主题描述符

H.2.8(数据库管理):数据库应用程序——数据挖掘

关键字:

电子商务 推荐系统 生命期

  1. 引言

推荐系统取得了商业上的较大成功,也是数据挖掘的最大实际应用之一。例如,淘宝、亚马逊、沃尔玛等在线网店根据用户的历史购买记录,为用户额外推荐指定的产品和服务。众所周知,这些推荐十分重要,并且对消费者的在线购物体验有很大的影响。因此学者和行业数据挖掘社区的研究人员探索了所有可能的方法,花了大量的精力去进一步改善推荐系统。大多数现有的推荐方法主要可以分为两类:基于内容的方法[1,2,3]和协同过滤方法(4、5)。基于内容的过滤推荐方法是通过分析用户之前偏好的物品的内容特性,从而推算用户会喜欢什么,而协同过滤方法是假定用户对某些物品有偏好,那么他们可能对于其它物品也有类似的偏好。

另一方面,市场研究者和社会学家多年来认识到生命阶段对消费者购买行为的重要性。例如,消费者经历不同的生活阶段,如光棍阶段(即年轻和单身),新婚夫妇(年轻,没有孩子),全巢(已婚夫妇与依赖的孩子),空巢(即没有子女的老年夫妇同居)。全巢期可以进一步分为一些子阶段,这很大程度上取决于抚养的孩子的年龄,而空巢阶段可以进一步分为子阶段,如仍在就业,退休了,独自在世(即鳏寡)等。众所周知,持久性产品和短期消费品对生命周期阶段的变化非常敏感.。

在我们的电子商务系统中,我们还发现生命周期阶段和消费者购买行为之间的强相关。例如,一个女人会在怀孕阶段购买母体维生素,然后在婴儿出生时买一辆婴儿车.。在不同的人生阶段,妈妈们会有不同的购物需求;见图一,图中显示了用户的需求和利益是动态的,具体由她目前的生活阶段而定。因此,明确的建模和预测生命阶段对于预测产品购买时间是非常有用的。我们希望基于额外信息的推荐能够提高推荐效率。不幸的是,大多数现存的方法不考虑生命阶段的概念,而这个概念却存在于电商领域中。

在本文中,我们将人生阶段的概念引入到电子商务推荐系统中。该系统首先预测用户当前的生活阶段,然后基于预测和计划的概率模型,向用户推荐产品,这可以明确地将人生阶段信息合并到电子商务推荐系统中。

为了预测用户的人生阶段,我们提出了一个新的最大熵Semi Markov模型,根据用户过去的购物信息去细分和预测随机的生命阶段。此外,我们为划分人生阶段和生命阶段过渡更为确定的母婴领域开发了一个实用高效的大规模的行业解决方案。更具体地说,我们利用逻辑回归分类器预测相关的标签和每个行为序列的概率,通过维特比算法有效地划分整个序列。我们也通过高斯混合模型处理多孩子家庭的问题。

基于评估的有效性提出的人生阶段,我们进行了离线和在线的广泛实验研究母婴域。一个庞大数据集上的离线实验结果表明,该方法可以显著提高预测的精度。在线实验结果也证明了将人生阶段的概念引入到推荐系统的有效性。这个项目被集成到最大的在线购物网站——淘宝网上。图二是一张母婴产品推荐系统的快照。在图二中,左侧垂直导航菜单包含几个生命阶段:怀孕了,新出生6个月,6 - 12个月,1 - 3年3 - 6年,第6 - 14年,这些描述了儿童的自然发展过程。系统自动预测客户(即系统选择)的生活阶段。右侧为对应于所选择的人生阶段的不同产品。

本文的主要贡献是:

  1. 将生命阶段的概念引入电子商务推荐系统;
  2. 针对随机生命阶段的划分和预测,我们提出了一种新的最大熵Semi Markov模型;
  3. 我们为划分人生阶段和生命阶段过渡更为确定的母婴领域开发了一个实用高效的大规模的行业解决方案;
  4. 我们提出了一个可以明确地将人生阶段的信息合并到电子商务推荐系统中的概率模型。
  5. 我们提出了一种基于高斯混合模型的处理多孩子家庭问题的建模方法。
  6. 我们通过离线和在线两种实验验证了人生阶段概念的有效性。

本文的其余部分组织如下:下文首先在第二部分的分析中提供了一些例子;其次,在第三节提出了以生命阶段为基础的推荐方法;接下来第四节是对多孩子情况进行分析和建模;第五届介绍了实验结果;第六节介绍了相关工作;第七节总结。

Pregnancy New born to 6 months 6 to 12 months

图一:婴儿不同成长阶段的需求变化表

Life-stage based Recommendation

Predicted Life

Stage

图二:淘宝网基于生命阶段的推荐系统快照

  1. 生命阶段和消费者行为模式

在本段中,我们广泛地定义生命阶段,并且假设每个生命阶段都有特定的任务,这也是各种购物选择产生的原因。此外,消费者从一个人生阶段过渡到新的人生阶段可能会出现显得购买任务。基于我们广泛的定义,生命阶段的概念存在于许多电商领域,例如家庭装修,买车和婚礼策划。

2.1 多个行业的数据分析

我们在淘宝网上的多个行业进行了详细的数据分析。我们发现我们发现生命阶段的概念能够在用户的购买行为中被发现。家庭装修的结果如图三所示,这表明当一个人开始装修房子,他或她会首先购买瓷砖地板和乳胶涂料之类的东西;接下来会是餐桌和床之类的家具;当上述装修完成,这个人可能会买甲醛清洗喷雾和床上用品进行最后的装饰。对于其它包括多阶段的复杂事件,我们也发现了类似的时间性的采购模式,比如婚礼策划和汽车采购。

2.2 母婴产品域

尽管提出的想法和主要模型可以应用于各种事件,但本文所描述的实验和大型解决方案仅针对于母婴产品领域。在母婴产品领域,人生阶段对消费者行为的影响是最为明显和重要的。在一个婴孩的不同成长阶段,母亲需要为他(她)购买不同的产品。例如,在产前阶段,准妈妈们会购买孕妇装;婴儿出生后会购买婴儿奶粉。对于一个推荐系统,如何准确预测用户的生活阶段并且为之推荐合适的产品,这是一个非常重要且极具挑战性的问题。

  1. 基于生命阶段的推荐

用户的生命阶段是由一系列人生阶段组成的,每一个生命阶段都跨越了一段时间。生命阶段的变化可能改变一个人的采购需求,比如在孕产妇和儿童领域就包括了怀孕、新生儿、1-3个月大等时间段。

在我们的系统中,有两个主要任务。首先,我们标记每个用户的行为序列,这样我们可以得知用户当前的生命阶段;第二,我们的推荐基于所预测的用户人生阶段。因此基于人生阶段的推荐的关键是如何建模和预测生活阶段,如何推荐适当的产品。在这个部分我们将对每个关键点做细节描述。我们的实验关注的母婴域是一个需要更多详细描述的特殊领域。

3.1 符号

本文接下来用到的符号如下:

X:用户的行为序列。用户的行为序列X是按时间排序的用户的行动序列。在我们的系统中,用户行为包括点击、收藏、购买物品、查询、点击导航提示等等。

T:X的长度。

Xt: 在t时刻观察到的行为序列。

dt: 在t时刻,生命阶段的持续时间。

yt: 在t时刻,生命阶段的标签。

lmin,lmax: 由领域专家定义的各个生命阶段的最大最小长度。

3.2 生命阶段预测和分割的MESMM

我们考虑了几个(如隐藏Semi-Markov模型[9],[10]最大熵Markov模型,条件随机域[11],等等)可用于模拟用户生活阶段和用户操作的结构化模型。根据我们问题的特点,我们提出了最大熵Semi-Markov模型去划分和标记根据所观察到的采购数据得到的消费者生活阶段。这个模型由隐藏Semi-Markov模型和最大熵Markov模型演变而来。它类似于最大熵Markov模型,但改变隐藏状态的概率取决于进入当前状态后所经过的时间量。这个模型是一般足以模型各种场景。

在这个模型中(见图4),在t时刻人生阶段的概率yt取决于前一个时刻t-1的人生阶段yt-1,用户已经处于前一个人生阶段多长时间,以及观察到的用户的行为序列。变量d确定性变化。当生活阶段发生改变,d复位为0.否则随着时间的推移,d变小。因此d可以捕获用户在一个生命阶段的持续时间。

Emulsion Paint

Shower

Dining Table

Formaldehyde

Clear Spray

Tile

Ceiling Lamp

Bed

Beddings

Stage 1

Stage 2

Stage 3

hellip;hellip;.

图3:淘宝网家庭装修数据分析

y1

y2

y3

d1

d2

d3

X1

X2

X3

图4:划分和标记根据所观察到的采购数据得到的消费者生活阶段的最大熵Semi-Markov模型

给定一个观察到的行为序列X,我们的目标是找到最根本的人生阶段序列y1....yk以及相应的持续时间di...dk:

Xt代表在t时刻观察到的行为序列,T表示X的长度,lmin和lmax是由领域专家定义的生命阶段的最大最小长度,p(yt|ytminus;1, dtminus;1, Xt)是在给定前一个阶段yt-1,前一个阶段的持续时间dt-1,以及观察到的行为序列Xt时,在t时刻是yt的概率。用动态编程方法可以找到最优划分和标记。

3.3 母婴领域的有效解决方案

在我们的实验中,我们主要关注母婴领域基于生命阶段的商品推荐。候选阶段的标签/状态见表1,表中数据是营销专家们根据婴儿产品标准和他们的专业知识提供的。

尽管MESSMM很一般,但是学习和推理大数据和复杂特性的代价是相当高的。幸运的是,在母婴产品域,孩子生命阶段的过渡是确定性的。我们只需要找到出生日期,那么 整个序列可以通过一个确定的婴儿生命阶段模板被标记,并且确定每个生命阶段的长度

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[137550],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。