2019年第九届教育和社会科学国际会议(ICESS 2019)外文翻译资料

 2022-08-06 11:08

2019 9th International Conference on Education and Social Science (ICESS 2019)

Research on Collaborative Filtering Recommendation Algorithm for Personalized Recommendation System

Yi Ren 1,a, Jingke Xu 1,b, Jie Huang 1,c and Cuirong Chi 1,d

1.Shenyang Jianzhu University Liaoning, China

a.1181134429@qq.com;b.1401308379@qq.com;c.1269028746 @qq.com;d.726733255 @qq.com

Keywords: Recommendation system; Collaborative filtering; Personalized recommendation

Abstract. In the era of information overload, recommendation system emerges at the historic moment. Collaborative filtering recommendation system algorithm is the most mature and extensive recommendation technology. This paper simulates the scene of film recommendation, applies different recommendation algorithms under the collaborative filtering recommendation system, and compares the recommendation quality to obtain a relatively objective experimental conclusion.

Introduction

With the development of information technology and Internet, information overload brings great

challenges to users and producers. The recommendation system is created to deal with problems

such as unclear user needs and long tail information. The recommendation system models users

interests by analyzing their historical behaviors so as to recommend information that meets their

interests and needs [1,2]. Nowadays, collaborative filtering recommendation system is applied to

various e-commerce platforms, such as amazon, JD Mall, taobao, toutiao.com and so on. Netflix is

one of the most successful companies in the field of film recommendation. It applies the item-based

recommendation algorithm in the collaborative filtering recommendation algorithm. Thanks to its

successful recommendation system, Netflix has generated huge revenue growth [3]. Aiming at three

popular model-based collaborative filtering recommendation algorithms, this paper applies them to

the simulated film scoring environment and analyzes them. These include: Slope One, SVD, SVD .

The basic idea behind collaborative filtering is that if users have preferences in the past, they will

have similar preferences in the future. Based on this, if two users preferences overlap a lot, they can

recommend projects to each other [4]. This technique is called collaborative filtering because the

selection of interested items comes from filtering results from a large number of collections, and

users implicitly collaborate with others. At present, collaborative filtering recommendation

algorithms are roughly classified into two categories: memory-based collaborative filtering algorithm

and model-based collaborative filtering algorithm [5]. Among them, the collaborative filtering

recommendation algorithm based on memory is divided into the nearest neighbor recommendation

based on users and the nearest neighbor recommendation based on items.

Collaborative Filtering Recommendation Algorithm

The Nearest Neighbor Recommendation Based On Users.

By using the target users historical behavior data to find out the users preferences for goods. Then, find other users who have similar preferences with the target user in the past, that is, find the nearest neighbor of the target user. For item i that the target user has not seen, the predicted value is calculated by the score of its neighbor to i. If the results are positive, the target user will be recommended [6].

The Nearest Neighbor Recommendation based on Items.

The relationship between items can be quantified by the rating of different users on different items or other behaviors (such as adding wish lists, sharing with others, evaluation, etc.), so as to find the nearest neighbor of the item. If the target user has a positive attitude towards item i and item

Copyright copy; (2019) Francis Academic Press, UK

307

DOI: 10.25236/icess.2019.059

j is the neighbor of item i, then item j is recommended to the target user. In specific practice, users attitudes towards items will be quantified so as to make more accurate recommendations [7].

Model-Based Recommendation Algorithm.

Model-based recommendations start to process raw data offline, such as using some dimensionality reduction techniques [8]. At run time, it is only needed to predict or 'learn' the model to be able to predict.

Recommendation Algorithm of Film Recommendation System

In the Netflix competition in 2009, more teams used model-based recommendation algorithms to effectively improve the prediction accuracy of the recommendation system [9]. So this paper introduces three common model-based recommendation algorithms and applies them to experiments. The experimental data was the movie ratings of more than 30,000 users of Netflixs competition. This paper divides training set and test set according to the ratio of 8:2. RMSE (root mean square error) was used as the evaluation index. The smaller the RMSE value, the better the prediction quality [10].

Slope One Algorithm.

Algorithm idea: Taking a prediction based on a simple linear regression model. Example of algorithm: the following table 1 is the four users rating to three movies, so as to predict the rating of movie 3 by user 1.

Table 1 The four users rating to three movies

movie 1

movie 2

movie 3

user 1

3

5

?

user 2

2

4

5

剩余内容已隐藏,支付完成后下载完整资料


2019年第九届教育和社会科学国际会议(ICESS 2019)

面向个性化推荐系统的协同过滤推荐算法研究

Yi Ren , Jingke Xu , Jie Huang and Cuirong Chi

沈阳建筑大学,中国辽宁

a、 1181134429@qq.com;b.1401308379@qq.com;c.1269028746@qq.com;d.726733255@qq.com

关键词:推荐系统;协同过滤;个性化推荐

摘要:在这个信息过载的时代,推荐系统应运而生。协同过滤推荐系统算法是目前应用最成熟、最广泛的推荐技术。本文模拟电影推荐这一场景,运用了协同过滤推荐系统下不同的推荐算法,并将推荐质量进行比较,得出一个相对客观的实验结论。

介绍

随着信息技术和互联网的发展,信息过载给用户和生产者都带来了巨大的挑战。而推荐系统的产生正是为了解决用户需求不明确以及信息长尾等问题。推荐系统通过分析用户的历史行为,对用户的兴趣进行建模,从而推荐出满足用户兴趣和需求的信息[1,2]。目前,协同过滤推荐系统已广泛应用于亚马逊、京东商城、淘宝商城、头条等电子商务平台。在电影推荐领域,Netflix是最为成功的公司之一。其将基于项目的推荐算法应用于协同过滤推荐算法中,这一成功的推荐系统为Netflix带来了巨大的收入增长[3]。本文主要针对目前流行的三种基于模型的协同过滤推荐算法,将其应用到模拟的电影评分这一环境中,并对其进行分析。其中包括算法为:Slope One算法、SVD算法、SVD 算法。 利用SVD算法将大而稀疏的用户评分矩阵映射到低维

协作过滤算法背后的基本思想是,如果用户在过去有着某种偏好,那么在将来也会有着类似的偏好。基于此,如果两个用户的偏好重叠很多,那么在他们之间可以进行项目的互相推荐[4]。由于感兴趣的项目的选择来自于对大量集合的过滤结果,并且用户是在隐式地与其他人协作,因此这种技术被称为协作过滤。目前,协同过滤推荐算法大致分为两类:基于内存的协同过滤算法和基于模型的协同过滤算法[5]。其中,基于内存的协同过滤推荐算法分为基于用户的最近邻推荐和基于项目的最近邻推荐。

利用SVD算法将大而稀疏的用户评分矩阵映射到低维利用SVD算法将大而稀疏的用户评分矩阵映射到低维

协同过滤推荐算法

基于用户的最近邻推荐

通过使用目标用户的历史行为数据来了解用户对商品的偏好。然后,找到与目标用户过去有着相似偏好的其他用户,即找到目标用户最近的邻居。对于目标用户没有看到的i项,预测值由其近邻对i的评分进行计算,如果结果为正,则向目标用户进行推荐[6]。

基于项目的最近邻推荐

项目之间的关系可以通过不同用户对不同项目或其他行为(如添加愿望列表、与他人共享、评价等)的评分来量化,从而找到项目的最近邻居。如果目标用户对项目i持积极态度,并且项目j是项目i的邻居,那么向目标用户推荐项目j。在具体实践中,会量化用户对项目的态度,以便提出更准确的建议[7]。

基于模型的推荐算法

基于模型的推荐算法首先会离线处理原始数据,比如使用一些降维技术[8]。在运行时,只需要预计算或“学习过”模型就可以预测。

电影推荐系统的推荐算法

在2009年的Netflix竞赛中,更多的参赛队伍使用了基于模型的推荐算法,有效地提高了推荐系统的预测精度[9]。为此,本文介绍了三种常用的基于模型的推荐算法,并将其应用于实验。实验数据是Netflix公司比赛的三万余条用户对电影的评分。本文按8:2的比例对训练集和测试集进行了划分。以均方根误差(RMSE)作为评价指标。其中RMSE值越小,预测质量越好[10]。

Slope One算法

算法思想:基于一种简单的线性回归模型进行预测。

算法原理: 将用户的评分之间的关系看作简单的线性关系:Y=X b。

(1)根据评分矩阵计算两两项目之间的偏差;

(2)根据偏差数据为用户未评分商品做出推荐列表。

算法示例:下表1是四个用户对三部电影的评分,以便预测用户1对三部电影的评分。

表1四个用户对三部电影的评分

电影1

电影2

电影3

用户1

3

5

?

用户2

2

4

5

用户3

4

3

用户4

3

4

4

计算电影3和电影1之间的平均距离:(3 (-1) 1)/3=1,电影3和电影2之间的平均距离:(1 0)/2=0.5。根据用户1对电影1的评分,电影3的预测评分为4。根据用户1对电影2的评分,电影3的预测评分为4.5。考虑到电影3和电影1的同时分级为3,电影3和电影2的同时分级为2,因此预测用户1对电影3的分级为:

在推荐过程中,为了防止用户习惯性地给出高分而影响推荐质量,因此有必要对用户的评分习惯进行具体分析。

1.如果4.2级是用户最喜欢的类别,则建议用户1观看电影3。用户u对电影j的评分预测公式如下:

用户i用于预测影片的评分;s(u)表示u中的评分元素集合;两部影片的平均偏差值为:

u i表示用户u对电影i的分级;R是整个分级数据;Sj,i(R)标记包含电影i和电影j的分级集。利用SVD算法将大而稀疏的用户评分矩阵映射到低维空间

SVD算法

算法思想:基于奇异值分解模型进行预测。

算法原理:利用SVD算法将大而稀疏的用户评分矩阵映射到低维空间,计算低维空间中未评分的项目与其他项目间的相似度,计算预测评分,然后将预测评分从高到低进行排序,并返回前N个项目对用户进行推荐。换句话说,即通过压缩矩阵,提取重要特征后进行计算并推荐。例如,电影特征直观而言可有惊悚片喜剧片这种明显的划分。

将用户评分矩阵M分解为三个乘积,U和V分别为左奇异向量和右奇异向量,sum;对角线的值为奇异值。

矩阵V对应于用户,矩阵U对应于项。一般来说,整个矩阵可以通过只观察奇异值的最重要特征来近似表达。常用的相似度计算方法有欧氏距离法、皮尔逊相关系数法和余弦相似度法。

SVD 算法

算法思想:SVD 算法是SVD算法的改进,也是一种基于奇异矩阵分解模型的算法。

算法原理:SVD 算法在SVD算法的基础上引入隐式反馈,将用户的历史浏览数据、用户的历史评分数据等作为新的参数。隐式反馈与领域模型相结合。计算用户对未知项目的评分后,通过均方根误差量化评分质量,加入正则化参数的意义在于防止过拟合。

主要公式如下:利用SVD算法将大而稀疏的用户评分矩阵映射到低维

(1) 评级预测:

(2) 均方根误差:

在计算用户对未知项目的评分后,用均方根误差对评分质量进行量化。增加正则化参数的意义在于防止过度拟合。符号含义如表2所示。

表2符号含义

符号

含义

u

用户

i

第一项(未知评级)

j

与项目i类似的项目(已知评级)

k

额定值ruiknown集

rui

用户u对项目i的实际评分

用户u对项目i的预测评分

bu

用户u等级偏差

bi

第一项评分偏差

qiT

第一项因子向量

pu

用户u的因子向量

N(u)

用户u的itmes设置为隐式首选项

k

最接近项目i的项目数

Sk(i)

最接近项目i的k项集

R(u)

用户u的所有评分集

wij

从项目j到项目i的重量

cij

用户u对项目j的隐式偏好的偏移量

lambda;

正则化参数

利用SVD算法将大而稀疏的用户评分矩阵映射到低维

(3) 算法应用结果:

三种算法的测试结果如表3所示。

表3三种算法测试结果

预测结果

算法

RMSE值

Slope One

0.8356574113243.2

SVD

0.8134704664413.3

SVD

0.816237015507

结论

由于不同环境下的运行结果有差异,本文对多台机器进行了测试。初步得出结论:SVD 算法推荐效果相对更加准确。Slope-One算法运行速度快,但是理论相对简单,无法实现个性化推荐功能。SVD算法和SVD 算法都是比较基本的算法,人们在这两种算法的基础上不断改进。例如,timeSVD 算法就是一种考虑时间感知的算法。在推荐系统方面,人们集思广益,将各个方面的知识融会贯通,使推荐系统更加人性化、智能化。但是,我们还是要继续探索下去。

参考文献

  1. G Dror,N Koenigstein,Y Koren and M Weimer. Journal of Machine Learning Research. Vol.18(2012),p.3.
  2. RM Bell and Y Koren. Lessons from the Netflix prize challenge. Acm Sigkdd Explorations Newsletter. Vol.9(2007)No.2,p.75.
  3. Goldberg D, Nichols D, and Oki B M, et al. Using Collaboration Filtering to Weave an Information Tapestry. Communications of the Association for Computing Machinery, Vol. 35(1992) No.12, p.61.
  4. 孟详武、刘树洞、张玉洁等.社会推荐系统研究[J].《软件学报》,第26卷(2015)第6期,第1356-1372页.
  5. Lee DD,Seung HS.Learning the parts of objects by non-negative matrix factorization. Journa

    剩余内容已隐藏,支付完成后下载完整资料


    资料编号:[254322],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。