全球特定地区的主流措施:定义、分析和用于改善用于个性化推荐系统的用途外文翻译资料

 2022-08-13 03:08

英语原文共 36 页,剩余内容已隐藏,支付完成后下载完整资料


摘要

关联

基于流行度的方法在音乐推荐系统中被业界和研究广泛采用。这些方法向目标用户推荐当前在系统所有用户中流行的内容。但是,由于音乐项目的流行度分布通常是长尾分布,因此基于流行度的音乐推荐方法无法满足那些具有特殊音乐喜好且与全球音乐主流背道而驰的听众的需求。为了弥补这一差距,本文的贡献是三方面的。

主流化措施的定义

首先,我们提供了几种定量方法来描述用户的音乐偏好与主流音乐的接近程度。假设全球音乐主流与特定国家之间存在差异,我们在两个级别上定义度量:将收听者的音乐偏好与所有用户的全球音乐偏好相关联,或将它们与用户所在国家/地区的音乐偏好相关联。为了量化此类音乐偏好,我们根据艺术家播放次数(APC)和艺术家听众计数(ALC)定义了音乐项目的受欢迎程度。此外,我们采用分布为基础和排名为基础的作为减少对长尾分布的头部偏见的一种方法。最终形成了量化音乐主流的6种措施的框架。

国家之间在音乐主流方面的差异

其次,我们对音乐主流进行了深入的定量和定性研究,因为我们(1)分析国家之间的主流程度差异,(2)发现正面和负面的异常值(在特定国家/地区的流行程度明显较高和较低)分别与全球主流媒体进行比较),使用混合方法进行分析,以及(3)在与流行音乐艺术家相关的收听偏好方面调查国家之间的差异。我们使用标准化的LFM-1b数据集进行研究和实验,从中分析来自47个国家的音乐流媒体平台Last.fm的约53,000名用户共享的约8亿个收听事件。我们发现,相对于听众最多的艺术家,听众的音乐消费行为存在明显的国别差异。

评分预测实验

  1. 我们证明了我们的研究结果对改进音乐推荐系统的适用性。为此,我们进行了评级预测实验,其中我们使用建议的6种主流度指标,根据用户对音乐主流的偏爱程度来量身定制建议:通过基于分布或基于等级的方法定义,在全球或全球范围内定义国家/地区级别(针对用户所在的国家/地区)以及APC或ALC。我们的方法大致等于一种混合推荐方法,在该方法中,在执行协作过滤之前要实施人口统计过滤策略。结果表明,就评级预测准确性而言,每个提出的主流性定义都有其优点。

介绍

如今,用户生成的内容可以在网上大量获取,并且可用内容的数量每天都在急剧增加[1]。这样的消耗性内容是通用的,并且包括例如新闻,视频,音乐和照片。访问大量内容的机会也有其弊端,因为它经常导致信息[2]或选择过载[3],并且人们不知道选择什么或找不到他们感兴趣的内容。因此,推荐系统(也称为推荐系统)已成为重要的工具,因为它们可以帮助用户搜索,分类和过滤大量的各种在线内容[4]。结果,它们也有助于减少信息和选择过载问题。推荐系统在人们的日常生活中,并支持多功能活动中起重要作用,如购物[ 5 - 7 ]或消费新闻[1],电影[8,9],和音乐[10-12]。

例如,在最长的时间内,对音乐录音的访问仅限于其物理表示形式(例如,乙烯基,磁带,CD)的本地可用性。通常,家里只有一定数量的录音。现在,使用诸如YouTube,Spotify,Pandora或iTunes之类的在线音乐平台,用户可以访问数以千万计的音乐录制品[ 13 ]。音乐推荐器系统(MRS)已被业界采用,以帮助听众浏览可用音乐录制的目录,并为他们提供可能适合各自用户喜好的项目建议[ 14 ]。今天,MRS已成为一个显著的研究领域[ 10,15]。音乐行业也建立了专门针对该主题的研究团队,因为MRS是其业务的重要推动力[ 14 ]。

然而,从用户的角度来看,当前的MRS经常会产生不令人满意的推荐[ 16 ]。理想的MRS建议“在适当的时候为适当的用户提供适当的音乐” [17]。然而,这是一个复杂的任务,因为许多因素在特定情况下[影响用户的音乐喜好[16,18 ]。音乐偏好之间的关系,为的情况下,人口[19-22],人格特质[23-25],社会影响[ 26-28 ],或收听习惯[29,30]已被调查。。除了这些与人相关的特征之外,与情境相关的因素还会影响用户的音乐偏好。例子是用户的活性[31,32],时间方面[33],或天气[34]。考虑到与情境相关的因素的MRS通常称为“上下文感知MRS”,因为考虑到使用上下文和/或其用户上下文并在没有明确用户干预的情况下使系统的操作适应当前上下文的系统是称为“上下文感知系统” [35]。上下文是“可用于表征实体状况的任何信息” [36]。因此,上下文信息可以从包括用户的活动输入[37]的各种源(例如,从社交媒体上的用户的个人信息或从诸如加速度计,陀螺仪或噪声计的传感器)获得。几年前,上下文感知开始受到极大的重视研究MRS(例如,[38,39])。尽管如此,在当前的MRS中,没有足够深入地考虑影响音乐偏好的众多相关因素[16]。据我们所知,除了一些音乐播放器,用户可以指定自己的情绪或活动来相应地调整音乐推荐外,还没有向公众发布全自动的情境感知MRS [15]。相反,大多数MRS主要依靠用户-项目交互的概念(在协同过滤)或关于所述音乐项目的信息(在基于内容的过滤)[15,40-43]。在研究和实践中,大多数MRS在很大程度上都忽略了影响用户音乐偏好的各种背景因素[16]。

我们在这项工作中重点关注的MRS研究中被广泛忽视的背景是影响用户音乐偏好和消费行为的各种特定于国家的机制。举例来说,音乐的喜好是由文化方面[形44,45 ]和文化各个国家变化[46]。甚至音乐的看法跨文化变化[47-50]。此外,各国的国家市场结构也各不相同,例如,包括发行渠道和立法,补贴,广告活动,本地广播电台播放,广播中国家艺术家的配额[51-53]。例如,在欧洲国家,对流行音乐的偏好是不同的,而不是趋于一致[45]。换句话说,特定国家的方面强烈影响着用户的音乐喜好和音乐消费行为。

在这种背景下,人们可以期待音乐艺术家的知名度在各个国家之间都不同。不过,事实上,各个国家/地区最受欢迎的艺术家几乎相同。这种现象与流行的长尾分布有关。有全局高度流行艺术家强浓度(分布的短头),而且还比较少得多流行艺术家的长尾(称为“长尾现象”[54,55]。同时,有些音乐艺术家在一个国家非常受欢迎,但在全球范围内却没有达到如此高的知名度。从全球的角度来看,这些艺术家是不是很受欢迎,并在流行分布[长尾找到[18,56]。例如,在芬兰的听众中,喜欢艺术家Stam1na,Kotiteollisuus或Katariina Hanninen的用户是全国最受欢迎的消费者,而从全球的角度来看,这些艺术家的受欢迎程度要低得多,并且构成了利基市场[56]。

对于MRS,这具有以下含义:长尾现象牵连,它更可能是一个随机的用户喜欢比远不太受欢迎的项目之一非常流行的音乐项目[10,57]。其结果是,基于流行的推荐的方法广受特别MRS通过补充特别是对于冷启动情况的其他方法(考虑即用户新来的MRS [ 32,58 ])。尽管在针对倾向于通常非常受欢迎的音乐项目(即“音乐主流”)的听众定向此类听众时,这种基于流行度的建议可能会成功,但当针对具有特殊音乐偏爱而不是主流的人们时,这些建议并不令人满意[16]。以往大多数MRS方法[29,59 ]通过将每个音乐项目的各用户的消费整体消费的所有用户衡量用户对主流音乐的偏好。使用这种基于分数的方法会不成比例地对构成数据集中绝对头条的音乐项目(头部)给予特权。结果,该方法对于不太倾向于主流音乐的听众来说效果不佳,因此导致针对小众消费者的MRS性能较低(就评级预测准确性而言)。在早期的工作中[60],我们提出了一种基于分布和基于排名的方法来衡量用户对主流音乐的偏好,以抵消对流行度分布中最重要项目的偏见。在进一步的工作 18,56],我们证明了替换的音乐普及全球的角度(即,全球所有用户中考虑到普及)由国家特定的角度(即特定国家的用户中考虑到普及)是一种可行的方法,用于提供更好地满足各种用户的建议,即,涵盖更广泛音乐偏好的用户(不仅是全球热门用户)。

在目前的工作中,我们建立在在提出的框架[56,60],流线,并且将其扩展。更确切地说,我们使用测量用户的偏好主流音乐的分布和基于等级的方法(他/她的主流性)被证明有希望在早期的工作中[56,60],提高他们的定义,例如,通过正火更好方法的比较。此外,除了歌手播放次数APC),我们还会介绍歌手听众人数(ALC)作为衡量音乐流行程度的指标。我们进一步为用户的主流性定义了一个全球版本和一个特定国家的版本。总体而言,这导致我们在这项工作中分析了6种主流性度量标准(基于分布与排名的关系,基于APC与ALC的关系以及基于全球与国家的观点)。

另外,在评级预测方法中使用这些措施进行评估,我们通过让系统预测未知用户对的评级(或消费水平)并测量其预测误差来评估推荐系统的性能[61]。我们研究了在考虑用户所在国家/地区以及他们在听觉行为方面的全球或特定国家主流反馈时,为用户实现的性能差异(根据评分预测准确性)。为此,我们使用LFM-1b数据集的子集[13]生成的用户监听事件(来自47个国家/地区的53259个Last.fm用户)。在本研究中,国家被视为民族文化的代表。意识到作为国家文化的概念已经被批评为与国家等同文化和撇开种族方面[62,63],我们强调的是,旁边的文化方面也是国家的市场结构导致了用户的音乐消费偏好和行为。因此,以国家为代理似乎对当前的研究是合理的。

本文提供了三个主要贡献:

  1. 我们提供了几种量化用户主流程度的方法,即用户的音乐偏好与主流音乐的接近程度。假设全球主流与特定国家之间存在差异,我们在全球和国家层面上对主流进行量化。我们基于(i)流行度分布的相似性和(ii)用户,国家和全球偏好的个人资料之间的排名相关性来定义主流性。
  2. 我们对音乐主流进行深入的定量和定性研究,从Last.fm的用户生成的收听数据中可以看出。我们发现听众的行为和喜好在各个国家/地区存在很大差异。将这些特定国家/地区的差异与全球主流进行比较,我们发现(i)在某些国家/地区中,用户的音乐消费行为与全球相对应,从而导致特定国家/地区和全球主流的重叠;(ii)在某些国家/地区除了全球主流之外,还发展了其他特定国家/地区的主流,并且(iii)一些国家对音乐主流消费行为和艺术家受欢迎程度没有清楚的描述。此外,我们确定并讨论了积极的和消极的艺术家离群值(实质上,特定国家/地区的知名度较高和较低,
  3. 我们展示了在个性化音乐推荐过程中,考虑用户的主流程度和国家(我们用作文化背景(这里是民族文化)的代表)与单身汉相比,可以显着提高评分预测的准确性没有国家/地区信息的解决方案。

本文的其余部分结构如下:我们首先概述了工作的概念基础。然后,我们详细介绍了手头研究中采用的方法和程序。接下来,我们报告并讨论我们的研究结果。在最后一节中,我们以总结和对未来工作的展望作为结束。

概念基础

这项研究首先涉及音乐推荐系统领域,以及音乐领域的流行和主流方面,以及它们在推荐系统中的考虑。我们提供了一个概念基础,在此基础上,分别讨论了区段音乐推荐系统中有关区段音乐流行度和主流度、区段音乐推荐系统中流行度和主流度的相关工作。

音乐推荐系统

推荐系统(也称为推荐系统)是计算机系统,它基于用户的偏好为目标用户提供感兴趣的项目的建议,帮助他或她进行各种决策过程(例如,涉及哪些产品购买,听什么音乐或阅读什么在线新闻[61]。用于表示系统向用户推荐的内容的通用术语是“项目”[61]。这些项目的示例包括即将度假的酒店,在线社交网络中的朋友,在线学习平台上的练习或阅读的书籍。对于构建和维护推荐器系统,三个主要组成部分至关重要:用户,项目和与前两个匹配的算法。

在音乐推荐系统(MRS)中,用户通常是音乐收听者,项目是可以推荐的音乐实体,例如,表演者,专辑或单个音乐作品[14]。注意,还存在支持音乐创作者的MRS,例如,推荐音乐构件,例如鼓环(例如[64])。尽管如此,在这项工作中,我们仍专注于音乐消费者。推荐系统中的用户项目匹配算法通常基于以下方法之一:基于内容的过滤(CBF),协作过滤(CF)或结合了CBF和CF技术的混合方法[ 65]。CBF接近MRS开发项目内容描述符,例如,节奏,速度,仪器仪表,歌词,曲风,或风格的音乐片段的[15,40-43],建立用户档案。这样的描述符的计算或从任一音频信号推断(使用音频分析技术)[10,66,67],编辑元数据(例如,流派或发行年份)[40,68],usergenerated内容(例如,标签或条)[69,70],或注释通过web内容挖掘收集[71,72]。然后根据用户喜欢的音乐内容对用户进行建模,并根据这些内容描述符推荐类似的项目。

相反,用于MRS的CF方法不依赖于有关项目或用户的外来信息,而是依赖于用户与项目的交互。此类交互被解释为有关用户偏好的显式或隐式反馈。最常见的显式反馈类型是用户评分(例如,以5点李克特评分量表提供)。隐式偏好反馈可以从听音模式中得出,例如,听音事件的数量[13]或歌曲跳过行为[73]。CF方法为每个用户维护一个用户配置文件,该配置文件对该首选项信息进行编码。为了向目标用户推荐音乐项目,系统会根据其用户个人资料识别其最相似的用户,并建议他们听过但目标用户不知道的项目[61]。此方法称为基于用户的CF。相反,基于项目的CF会推荐与目标用户喜欢的项目相似的项目,其中相似度是根据用户评分计算的。一种替代的,通常表现更好的方法是基于模型的CF,它描述了用户和矢量空间中维度小于用户数和项目数的项目[74]。因此,可以有效地执行项目

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[236138],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。