英语原文共 14 页，剩余内容已隐藏，支付完成后下载完整资料

一种改进的基于优化用户相似度的协同推荐算法

Hao Chen1 · Zhongkun Li1 · Wei Hu1

在线发布：2015年9月15日

copy;斯普林格科学商业媒体纽约2015

摘要：传统的协同过滤推荐存在许多问题，如数据稀缺性，冷启动，推荐准确性和及时性。如何提高推荐的效率和质量是协同推荐的关键问题。在传统的协同过滤算法中，在计算相似度时，有时可能忽略所有项目的不同用户的评级量表。为了优化这一问题，提出了一些算法，如调整后的余弦相似度算法和Pearson相似度算法，但仍存在单个评级量表对于同一项目用户不同的问题。当用户对共同集合上的得分向量具有显着差异时，它可以导致类似的结果向量结果。这种现象的实质存在直接影响用户相似度计算的准确性。此外，它将影响目标用户的预测分数准确性。为解决该问题，提出了一种基于优化用户相似度的改进协同推荐算法。将平衡因子添加到传统的余弦相似度算法中，该算法用于计算不同用户之间的项目评级量表差异。此外，可以通过实验获得最合适的平衡因子阈值，通过一系列合理的实验来验证基于阈值的算法的有效性。实验结果表明，所提出的改进的基于用户相似度的协同过滤算法可以显着优化用户相似度的准确性，获得更好的推荐结果。

郝晨chenhao@hnu.edu.cn

1 湖南大学计算机科学与电子工程学院，长沙410082

关键词：协作推荐用户相似度评定量表差异平衡因子

· · ·

介绍

协同过滤推荐系统是推荐技术在个性化推荐技术中最成功的应用之一。随着个性化推荐技术的快速发展，电子商务的个性化推荐带来了巨大的商业利益，并为社会生活的各个领域的公众提供高效，准确和个性化的功能。在各行各业的研究人员的共同努力下，这项技术的研究和开发从未停止过。个性化推荐技术日趋成熟，协同过滤技术成为最广泛推荐的技术之一。随着商品数量和网络用户的增加，协同过滤推荐技术面临着时效性和数据稀缺等多重挑战，但这并不会完全影响协同过滤技术的普及。研究人员提高了协同过滤的质量，如基于聚类的协同过滤，协同过滤算法的概率，基于神经网络的协同过滤，协同过滤，矩阵分解，基于概率模型，贝叶斯模型等多种模型抽象，最大熵模型，吉布斯抽象，线性回归和光泽。

基于这些研究，本文利用用户评级历史信息，用户之间的单一分数数据差异以及与传统用户相似性度量算法的结合，提出了基于用户相似度改进的协同推荐算法，并验证了可行性和通过实验改进协同推荐算法。

基于用户的协同过滤算法

基于用户的协同过滤算法需要先计算目标用户与其他用户之间的相似度;之后，我们将这些最近的用户组成具有较高相似度值的邻居集。然后瞄准邻居集中的项目并预测目标用户的所有评级。然后我们必须按降序计算得分，按照推荐给目标用户的降序选择前N项得分。

余弦相似度算法

在计算用户的相似度时，用户之间主要有三种相似性度量，包括标准余弦相似度算法，调整后的余弦相似度算法和Pearson相似度算法。

余弦相似度算法公式1：

调整后的余弦相似度算法公式2：

Pearson相似度算法公式3：

方程式（1)–(3）：Ra,i 是项目i上的用户ua 的评级。这里Ra 是用户评级的平均值。Ia,b 表示用户ua 和ub 共同评估的项目。Ia 是用户ua 评定的项目集。Ib 是用户ub 评定的项目集。

生成邻居集

邻居集是与当前目标用户具有相似偏好的用户的集合。这项名为K-nearest-neighbor（KNN）的技术[33总是用于在基于用户的协作推荐系统中选择邻域。它使用相似度作为权重来选择top-K用户作为设置给目标用户的邻居。

生成推荐集

在选择了目标用户的邻居集之后，它与项目的所有邻居的得分以及用户之间的相似性相结合，以预测目标用户在测试项目上的得分。从分数集中选择前N个记录作为推荐结果。假设目标用户是u，测试程序是i，i的预测得分是

(5,4,4,3)

R₁

R₂ (3,2,2,1)

(1,0,0,1)

rdiffer1

rdiffer2

(1,0,0,1)

图2

方程式（4）：Nu 是用户u的最近邻集，Rl,i 是用户的评分我在项目i上。

改进的基于用户相似度的过滤算法

准确地查找目标用户的协作邻居集是协同过滤算法的核心。通过计算两个用户之间的相似度，传统的基于用户的协同过滤算法找到目标用户的前K个最近邻居，然后通过最近邻居实现推荐。因此，用户相似度算法的准确性将直接影响所推荐算法的性能。然而，传统余弦相似度算法在计算用户相似度时忽略了一种普遍存在的现象。当两个用户的得分矢量和单个得分差别很大时，也很容易得到类似的和矢量，这导致用户获得高度的相似性。改进的协作推荐算法是引入平衡因子，其考虑邻居集内的用户之间的单一差异。因此，为了获得一组具有更好推荐质量的类似用户，我们需要结合传统算法并提出类似的平衡因子。也就是说，它考虑用户与邻居集中的单个分数差异之间的相似性。为了证明存在

在该现象中，我们假设用户1的得分向量是R˙1 =（5,4,4,3），用户2的得分向量是R˙2 =（3,2,2,1）。用户1的评级和用户2在项目上的评级差异向量是R˙Differ2（1,0,0,1）。下图比较了他们的情况向量：如图。2 表明，当调整余弦相似度算法和Pearson相似度算法在单个项目上的得分在项目集合中存在较大差异时，会出现高度的用户相似现象。虽然这种现象是基于用户的平均得分而存在一定的合理性，但即使得到的结果具有高度的相似性，也不是正常现象。在大量数据的情况下，这种现象也是合理的，因此也有必要改善这种现象。下一个本节将介绍旨在改善问题的平衡因素的概要。

平衡因素

基于用户的协同过滤推荐算法在用户单一评定量表的高差异条件下计算用户相似度时存在用户相似度高的问题。目前提出的算法并未将用户单一评定量表的差异视为权重来平衡相似度计算结果。为了解决这个问题，本文提出了平衡因子的概念，它将用户评分量表的差异考虑到用户相似度计算中，以弥补传统相似度计算方法的这一缺点。用户ua 和用户ub 之间的比例差异计算如下公式5：

平衡因子计算如下公式6：

改进的相似度算法

这里，改进的用户相似度计算方法Imp_sim（ua，ub）基于将平衡指数omega;（ua，ub）与结果相加的传统调整余弦相似度算法。然后使用相似度计算结果邻居集并根据公式推荐项目（2）最后。

用户相似度计算流程图如下图所示。3.

用户相似度计算过程可以脱机运行，因此可以减少建议的运行时间并提高推荐速度，从而解决问题

lt;

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[19931]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

免费ai写开题、写任务书：免费Ai开题 | 免费Ai任务书 | 免费降AI率 | 免费降重复率 | 论文免费排版

注册

找回密码

一种改进的基于优化用户相似度的协同推荐算法外文翻译资料

Hao Chen1 · Zhongkun Li1 · Wei Hu1

介绍

相关作品

基于用户的协同过滤算法

余弦相似度算法

生成邻居集

生成推荐集

改进的基于用户相似度的过滤算法

平衡因素

改进的相似度算法

您可能感兴趣的文章

登录

注册

找回密码

Hao Chen1 · Zhongkun Li1 · Wei Hu1

介绍

相关作品

基于用户的协同过滤算法

余弦相似度算法

生成邻居集

生成推荐集

改进的基于用户相似度的过滤算法

平衡因素

改进的相似度算法

您可能感兴趣的文章