个性化推荐系统推荐准确性和多样性的研究外文翻译资料

 2022-12-04 02:12

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


摘要:

随着网上的网络服务变得越来越丰富多彩,设计一种有效地抓取网页推荐给大家的方法变得越来越重要。在这篇文章中,我们将会通过一种名叫WSRec的网络服务推荐系统,来攻克这个重要问题。WSRec包括一个收集网络服务质量信息的网络服务,以及一个能够预测网络服务质量的高效而新颖的混合协同过滤算法。WSRec用Java语言实现并且可以被部署到现实环境中。为了研究它的预测性能,我们从网上获取了共计21197个公共网络服务,并且实施了真实环境下大规模的实验,我们在公开的情况下收集了来自遍及全球150个国家的服务对象,关于100个网络服务的150万份测试结果。这个复杂的实验分析结果表明,WSRec相对于其他推荐系统拥有更高的准确度。

1.简介

网络服务往往是一些松散耦合的软件系统,它们直接利用网络协议实现机器与机器之间的交互。越积越多的网络服务意味着我们需要一个有效的方法来选择和推荐它们,这个是一个计算服务行业需要解决的关键问题。

当面对着多个有着独特或者相似功能的网络服务,我们需要服务质量(QoS)提供的不针对特定功能的网络服务特征,来改善如何选择网络服务的问题。既然服务提供商已经不再显式声明网络服务的质量,同时一些服务质量特征(如网络延迟,调用失败率等)与服务对象的地理位置和网络环境高度相关,那么通过服务对象对于网络服务的评估我们可以获取更加准确的结果,比如服务对象是否需要网络服务同时满足他们功能和非功能的需求,但根据服务对象的观点进行评估有以下缺点:1)首先,它需要服务主动征询服务对象的意见,于是给服务对象强加了很多成本,同时浪费了服务提供商的资源。2)第二,因为有太多的候选服务,其中一些合适的服务可能甚至都没有被服务对象发现。 3)最后,大多数服务服务对象不是评估网络服务方面的专家,以及常见的上市时间限制,是的对于目标网络服务的深入研究陷入了局限。

为克服上述缺陷,我们提出了WSRec,它采用了一种有效和新颖的混合协同过滤算法,用于选择和推荐网络服务。协同过滤方法可以自动预测网络服务性能,通过使用过与某个服务对象类似的一些日常调用网络服务的服务对象的历史QoS记录,为每一个记录了历史QoS信息的服务对象预测一个网络服务的质量。通过我们的混合协同过滤方法,我们可以给一个活跃的服务对象预测网络服务的QoS性能,无需他们进行Web服务评估,并且亲自找出候选服务的列表。

当试图将协同过滤算法应用到网络服务推荐中时,这里我们有几个需要注意的难点:1)如何从不同的服务对象手上收集某个网络服务的QoS信息? 2)如何针对网页应用推荐改进传统的协同过滤算法? 3)最后如何验证推荐结果?传统的电影推荐搜索领域中,我们有很多可以用于研究推荐结果的开放数据集,比如MovieLENS1和Netfix2。但是在计算服务领域中,选择服务的大数据集很难获取,验证网络服务推荐的结果是一个巨大的挑战。

本文旨在通过应对上述挑战,发展如今网络服务推荐领域中体现最先进的技术。本文的贡献有三重:1)首先,我们提出一个系统的用户贡献机制,用来收集网络服务的QoS信息。2)然后,我们设计了一个针对网络服务推荐有效新颖的混合协同过滤算法,相对其他众所周知的协同过滤算法显著提高推荐结果的质量。 3)最后,我们在现实世界中进行了一个实验来验证我们的推荐算法。据我们所知,我们的实验在已发表的网页推荐系统的公开研究中是规模最大的。这篇文章涉及到的,共计21,197个公共网络服务都是从互联网获得的,来自超过20个国家的150名服务用户选择并且随机调用了100个网络服务。我们进行了超过150万个Web服务调用,并且获得了详细的实验结果。

本文的剩余内容如下。第二章介绍了WSRec的框架。第三章说明了我们的混合协同过滤算法。第四章展示了该系统的应用,实验以及结果。第五章呈现了相关工作,而第六章总结了这篇论文。

2 系统架构

在电影推荐的研究中,一个潜在的假设是用户对于不同电影的评分,我们可以从商业性或实验性的网络系统,譬如Amazon和MovieLens中获得。但是,在服务计算领域,我们很难获取不同的服务对象观察到的网络服务的QoS信息,这是因为:1)网络服务通过互联网来分发,它们由不同组织所有;2)服务对象通常彼此隔离;3)如今的网络服务架构不提供任何机制分享网络服务的QoS信息。但是从不同的服务对象那里获取充分的网络服务信息,对于构造要给准确的网络服务推荐系统来说是至关重要的。为了应对这一挑战,我们介绍一下Web 2.0中,关于网络服务QoS信息收集的关键概念,用户贡献。这个想法的意思是,通过将个人观察到的网络服务QoS信息贡献给WSRec,服务用户就可以获得准确的网页服务推荐服务。除了用户-贡献机制,WSRec也控制了一些分布式计算机用于监控公共可用网络服务。在本文中,我们使用由大约1000台计算机组成的位于在世界各地的分布式测试台,用于监测现实世界的网络服务并收集其QoS性能。利用以上设置,我们可以获得足够多的网络服务的QoS信息用于我们的WSRec推荐系统。

4.应用和实验

4.3表现比较

为了研究预测的表现,我们比较了我们的方法(WSRec)与其他著名的预测方法:用户均值(UMEAN),项目均值(IMEAN),使用PCC的基于用户的算法(UPCC),使用PCC的基于物品的算法(IPCC)的算法[12]。 UMEAN采纳了当前服务对象使用其他网络服务的QoS评分均值来预测这些缺失的数据,而IMEAN采用了其他用户观察当前网络服务得到的QoS评分均值来为这些活跃用户预测这些缺失的数据。等式(1)和等式(2)被分别用于计算UPCC和IPCC。

我们把150个服务用户分成两部分,一部分作为训练用户而另一部分作为活跃(测试)用户。对于这些活跃用户,通过随机删除项目值,我们改变活跃用户提交的QoS评分的数量为5,10和20,并给它们分别命名为Given 5,Given 10和Given 20。删除的QoS值将被作为预期值来研究预测性能。对于训练矩阵,我们随机删除条目将矩阵的密度分别稀释为10%和20%。我们设lambda;= 0.1,TopK = 10。每个实验都循环50次然后记录平均值。

表1和表2分别显示了采用了使用10%和20%密度训练矩阵的不同方法后的预测结果。在这两个表中,我们观察到我们的方法(WSRec)获得较小的NMAE值,NMAE值越小意味着推荐质量更好。

表1展示了WSRec的NMAE值随着给定数字的增长(从5到20)变得越来越小,表明通过给予更多网络服务QoS数据,WSRec的推荐准确性不断改善。随着训练用户人数从100增加到140,推荐准确性也表现出重大的改善,表明推荐准确性可以通过收集更多的训练数据得以增强。表2说明,通过将训练矩阵的密度从10%增加到20%,推荐准确性也能得以增强。在两个表中,预测行为的错误率都比RTT糟糕,因为错误率的训练矩阵包含了一系列的零值(所有的请求都是成功的)。在这所有不同的实验设定之下,WSRec持续的超越着别的方法。

4.6 lambda;的影响

不同的数据集可能具有不同的数据相关性特征(例如,其中一些可能通过采用基于用户的方法提供更好的预测,而其他可能的结果通过基于用户的方法提供更好的预测结果)。参数lambda;使我们的预测方法具备更多可行性和适应不同环境的能力。如果lambda;= 1,我们只从网络服务对象那里提取信息,如果lambda;= 0,我们只考虑来自物品的那些有价值的信息。在其他情况下,我们根据lambda;的值结合用户和物品两方面的信息预测活跃用户缺失的值。

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[25362],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。