学术论文推送系统设计外文翻译资料

 2022-08-09 10:08

英语原文共 70 页,剩余内容已隐藏,支付完成后下载完整资料


摘要

在过去的16年里,超过200篇关于论文推荐系统的学术论文被发表。我们回顾了这些文章,并在本文中提供了一些描述性统计,以及关于主要改进和缺点的讨论,以及对最常见的推荐概念和方法的概述。我们发现超过一半的推荐方法使用基于内容的过滤(55%)。在审查的方法中,只有18%采用了协同过滤,16%采用了基于图表的建议。其他推荐概念包括模式化印象、以项目为中心的推荐和混合推荐。基于内容的过滤方法主要利用用户撰写、标记、浏览或下载的论文。TF-IDF是最常用的加权方案。除了简单的术语外,还使用了n-gram、主题和引用来建模用户的信息需求。我们的综述揭示了当前研究的一些不足之处。首先,目前还不清楚哪些推荐概念和方法最有前途。例如,研究人员报告了基于内容和协同过滤性能的不同结果。基于内容的过滤有时比协同过滤表现得更好,有时表现得更差。我们确定了三个可能导致结果模糊的原因。A)若干评价有其局限性。它们基于经过严格修剪的数据集、用户研究中的参与者很少,或者没有使用适当的基线。B)一些作者对他们的算法提供的信息很少,这使得重新实现这些方法很困难。因此,研究人员使用相同推荐方法的不同实现,这可能导致结果的差异。C)我们推测,数据集、算法或用户群的微小变化不可避免地会导致方法性能的巨大变化。因此,找到最有希望的方法是一个挑战。作为第二个限制,我们注意到许多作者忽略了准确性以外的因素,例如总体用户满意度。此外,大多数方法(81%)忽略了用户建模过程,没有自动推断信息,而是让用户提供关键字、文本片段或单篇论文作为输入。10%的方法提供了运行时信息。最后,在实践中很少有研究论文对论文推荐系统产生影响。我们还发现该领域缺乏权威和长期的研究兴趣:73%的作者发表的关于研究论文推荐系统的论文不超过一篇,不同的合著组之间几乎没有合作。我们得出的结论是,几个动作可以改善研究景观:开发一个通用的评估框架,协议中包括的信息研究论文,更加关注non-accuracy方面和用户建模,研究人员交流信息的平台,一个包含可用的推荐方法的开源框架。

目录

摘要 I

1.介绍 1

2.定义 3

3.相关研究领域 5

4.评价调查 6

4.1 评估方法及其充分性 6

4.1.1用户研究 6

4.1.2在线评估 7

4.1.3离线评估 8

5. 推荐类调查 10

5.1 模式化 10

5.2 基于内容的过滤 11

1.介绍

1998年,Giles等人开发了第一个学术论文推荐系统,作为CiteSeer项目的一部分。此后,至少216篇论文被发表,其中涉及到120种学术论文推荐方法。对于初入该领域的研究人员来说,大量的文献和方法都突出了一个问题:他们不知道哪些文章是最相关的,哪些推荐方法是最有前途的,甚至那些熟悉学术论文推荐系统的研究人员都发现很难跟踪当前的发展。每年与之相关的文章数量稳步增长: 217篇文章中,66篇文章在2012年和2013年出版,占到总量的30%(如图1所示)。该领域现有的文献调查寥寥无几,仅占据着学术文章的一小部分,或只专注于某些方面,如推荐系统评价。因此,它们没有提供研究领域的完整概述,也没有确定最有效率的方法。

图1:关于学术论文推送系统的文章每年发表量

我们调查学术论文推荐系统领域,目的是使研究人员和开发人员了解到学术论文推荐系统的现状、认识有开发潜力的研究领域和激励研究者们解决目前在实践中阻碍学术论文推荐系统的有效使用这个最紧迫的问题,。为了清楚起见,我们使用“文章”一词来指代经过评审的期刊文章、专利、网站等,而使用“论文”一词则是指由学术论文推荐系统推荐的文件。在提到大量的具有一定属性的推荐系统时,我们会引用三篇典型的文章作为参考,例如,当我们报告有多少推荐系统应用基于内容的过滤时,我们报告数量并提供三篇参考文献。

为了确定我们调查需要的相关文献,我们在谷歌Scholar、ACM数字图书馆、Springer Link和ScienceDirect上进行了文献检索。我们以[paper | article | citation] [recommender | recommendation] 和[system | systems]为搜索词,下载了所有与学术论文推荐系统相关的文章,如果题目本身与学术论文推荐系统没有明显的相关性,我们就会使用题目和摘要进行关联性判断。我们还检查了每一篇文章的参考书目,如果书目中的条目指向尚未下载的相关文章,则下载该文章。此外,我们还查阅了谷歌Scholar中哪些文章引用了相关文章,如果其中一篇引用的文章似乎是相关的,我们也进行下载。我们将搜索范围扩展到网站、博客、专利和主要学术推荐系统的演示文稿。这些主要的学术服务包括学术搜索引擎CiteSeer(x)、谷歌Scholar(Scholar Update)和PubMed;社交网络研究门户;参考文献管理者引用了like、Docear和Mendeley。虽然这些系统除了提供主要服务外,还提供推荐系统,但也有一些独立的推荐系统,即BibTip、bX、RefSeer、TheAdvisor和一个名为Sarkanto的实验系统。

第一次文献检索是在2013年6月,共检索到188篇相关文献[1 - 188]。188篇文献中有3篇是文献调查[186-188],在我们的调查中被忽略。其余185篇文章包括同行评议的会议论文(59%)、期刊论文(16%)、预印本(5%)和其他格式的论文,如博士论文、专利、演示文稿和网页。总的来说,评议的文章是全面的,平均页数为8篇。超过三分之一(36%)的文章有10页或以上,另有23%的文章有8页或9页,只有26%的文章有4页或更少。

2.定义

我们使用“想法”这个术语来指代一个关于如何有效生成推荐的假设。为了区分这个想法的具体程度,我们区分了推荐类、方法、算法和实现(图2)。

我们将“推荐类”定义为最不具体的概念,即一个宽泛的概念,它广泛地描述了推荐是如何给出的。例如,推荐概念协同过滤(CF)和基于内容的过滤(CBF)在它们的基本思想上有根本的不同:CBF的基本思想是用户对与他们以前喜欢的项目相似的项目感兴趣。相反,CF的思想是用户喜欢用户的同伴喜欢的项目。然而,这些想法相当模糊,为不同的方法留下了空间。

“推荐方法”是将推荐类引入实践的模型。例如,CF背后的思想可以通过基于用户的CF、内容增强的CF和其他各种方法来实现。这些方法各不相同,但都与CF的中心思想相一致。尽管如此,这些表示概念的方法仍然很模糊,并为如何计算建议留下了猜测的空间。

“推荐算法”精确地指定了推荐方法。例如,CBF方法的一种算法将指定是否从文档标题或文本主体提取术语,以及如何处理术语(例如停止字删除或词干提取)和加权(例如TF-IDF)。算法不一定是完整的。例如,伪代码可能只包含最重要的信息,而忽略了基本信息,比如权重方案。这意味着对于特定的推荐方法,可能有几种算法。

最后,“实现”是一种可以在推荐系统中编译和应用的算法的实际源代码。它详细说明了推荐是如何产生的,没有留下任何猜测的余地。因此,它是关于如何生成建议的最具体的想法。

图2. 推荐系统术语和概念说明

“推荐系统”是一个功能完备的软件系统,它至少应用一种实现来进行推荐。此外,推荐系统还具有其他几个组件,如用户界面、推荐候选库和拥有/运行系统的操作员。一些推荐系统还使用两种或两种以上的推荐方法:CiteULike是一种用于发现和管理学术参考文献的服务,它允许用户在两种方法之间进行选择。

“推荐场景”描述了推荐系统的整个设置,包括推荐系统和推荐环境,即域和用户特征。

通过“有效性”,我们指的是一个推荐系统达到其目标的程度。广义的推荐系统的目标是提供“好的”和“有用的”建议,通过满足用户的需求使用户“满意”。用户的需求各不相同。因此,一些用户可能对新奇的研究论文推荐感兴趣,而另一些用户可能对权威的研究论文推荐感兴趣。当然,用户需要针对其研究领域的推荐。当我们使用“有效性”这个术语时,我们指的是评价者想要衡量的具体目标。我们可以互换使用“性能”和“有效性”这两个术语。

“评估”描述了任何一种评估,它可以衡量一个具体想法或方法的有效性或价值。论文的研究论文推荐系统评价方法详见第四部分。

3.相关研究领域

一些研究领域涉及到用户建模和(学术论文)推荐系统。虽然我们不调查这些领域,但我们介绍他们以便有兴趣的读者可以扩大他们的研究。

学术搜索引擎的研究涉及计算研究论文和搜索查询之间的相关性。这些技术通常与学术论文推荐系统使用的技术相似。在某些情况下,推荐系统和学术搜索引擎甚至是相同的。如后面所述,一些推荐系统要求用户提供代表他们兴趣的关键字。在这些情况下,学术论文推荐系统与学术搜索引擎没有区别,用户提供关键字来检索相关论文。因此,这些领域是高度相关因为学术搜索引擎和学术论文推荐系统是相关的。

审稿人分配问题的目标是利用信息检索和信息过滤技术,将会议论文自动分配给审稿人。与学术论文推荐的区别很小:在审稿人分配问题中,提交的论文数量相对较少,但必须分配给少数用户,即审稿人。学术论文推荐系统从大量的语料库中向相对大量的用户推荐少量的论文。然而,这些技术通常是相同的。审稿人分配问题最早由Dumais和Nielson在1992年提出,比Giles等人推出第一个学术论文推荐系统早了六年。Wang等发表了一篇关于审稿人分配问题的很好的调查报告。

科学计量学是分析研究人员、研究文章的影响以及它们之间的联系的学科。科学计量学的研究人员使用几种技术来计算文档关联度或对对一组文章进行排序。h-index、co-citation strength、bibliographic coupling strength等指标也被学术论文推荐系统采用。然而,在科学计量学中还有更多的指标可能与学术论文推荐系统相关。

用户建模是从人机交互领域发展起来的。用户建模的重点之一是利用用户当前的任务和背景来减少用户的信息过载,用户建模与推荐系统共同分担这一目标,在这两个领域(UMAP15和RecSys16)的主要会议上发表的论文常常重叠。用户建模是推荐系统的核心组成部分,因为对用户信息需求进行建模对于提供有用的推荐至关重要。

4.评价调查

目前推荐系统研究很侧重于评估推荐方法的有效性,研究人员必须寻找哪些方法可以实际应用,或者将其作为其他评估的基准。不过全面评估的关键先决条件包括合适的评估方法、足够数量的研究参与者,以及将新方法与一种或多种最先进的方法进行比较。这种新方法及其评价必须要被清楚地描述,因为评价的可靠性、方法的重新实施以及结果的再现性和可复制性只有在给出明确描述的情况下才能得到保证。

我们审查了推荐方法的评估方法、指标和使用的数据集以及参与用户研究的人数、用于比较新方法的基线和其他几个因素来判断96种方法的评价是否恰当。最初,我们的目标是确定进行全面评价的方法,进一步的审查将集中于这些经过彻底评价的办法,以确定最有研究价值的办法。但是,我们将在下文各节中说明,大多数评价都有局限性,因此不可能确定很多有研究价值的方法。

4.1 评估方法及其充分性

在96种被审查的推荐方法中,有21种(22%)没有得到作者的评价,在其他情况下,试图进行评估,但方法存在问题,且描述不充分,难以理解或重现。在剩下的75个评估方法中,53个(71%)使用离线评估,25个(33%)使用定量用户研究,2个(3%)使用定性用户研究,5个(7%)使用在线评估。接下来介绍不同的评价方法及其在科研论文推荐系统中的应用。

4.1.1用户研究

用户研究通常通过明确的评级来衡量用户满意度,用户接收由不同推荐方法生成的推荐,用户对推荐进行评分,其中平均评分最高的方法被认为是最有效的。研究参与者通常被要求量化他们对这些建议

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[239693],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。