大学数字图书馆中的行为网络阅读特征的统计研究外文翻译资料

 2023-03-15 11:03

大学数字图书馆中的行为网络阅读特征的统计研究

关键词:统计特征,在线阅读行为网,大学数字图书馆,复杂网络

大学数字图书馆中的在线阅读行为网络(ORBN)由大量交互节点组成,构成了一个大规模的在线社交网络,可以建模为一个复杂的系统。在过去的几年中,许多研究人员对在线社交网络进行了深入研究。然而,关于高校数字图书馆在线阅读行为的研究较少。在本文中,我们调查了大学数字图书馆中 ORBN 的统计特征。本研究表明,在线阅读行为网络的度分布服从指数分布。此外,在 ORBN 中观察到小世界现象。本研究还比较了不同类型 ORBN 的统计特征。结果表明,在线阅读行为子网的统计特征在多个学年保持一致。然而,每四个学年,全球 ORBN 及其子网络之间就会出现差异。在线阅读行为子网络的特征在多个学年中保持一致。然而,每四个学年,全球 ORBN 及其子网络之间就会出现差异。

第一章 绪论

在过去的几十年里,由于其普遍存在的性质,复杂网络在许多多学科研究领域得到了广泛的研究,包括数学、物理学、计算机科学、社会学等。研究人员在复杂网络方面取得了巨大的理论和经验进展。瓦茨 DJ 等。和 Barabaacute;si A-L 等人。 1998 年和 1999 年发现小世界 [46] 现象并提出了无标度网络模型 [6]。从那时起,在现实世界的许多领域都进行了实证研究。这些研究表明,许多现实世界的网络实际上是具有小世界和无标度特性的复杂网络,这与之前将它们建模为简单随机网络的发现有很大不同。在线社交网络本质上是一个复杂的网络,已经成为万维网的一个非常重要的元素[49]。它现在在创建和提供个性化服务方面发挥着关键作用 [34]。对用户行为和交互的分析是在线社交网络最重要的实证研究之一。已经研究了许多类型的社交网络,例如引文网络 [14]、科学合作网络 [20, 35]、互联网 [17]、万维网 [2, 11] 等。 然而,大学中的在线阅读行为网络数字图书馆也是一个非常重要的在线社交网络,但尚未得到适当调查。

大学图书馆包含大量人类精神财富,是大学生重要的知识来源。数字技术的快速发展推动了世界各地大学数字图书馆的建设。数字图书馆通过营造支持学习、教学和研究的环境,为学生和大学工作人员提供数字信息和数字服务[13]。例如,数字图书馆为用户提供电子书阅读、纸质图书搜索和更新等在线服务。高校数字图书馆中的在线阅读行为网络(ORBN)实际上是一个具有典型循环特征的在线社交网络。毕业生总数通常大致相当于每个学年的新生总数。此外,大学的学习年限通常为四年,学生总数总体保持稳定。这种具有这些特征的网络不同于其他在线社交网络。本研究的主要目标之一是探索具有周期性特征的 ORBN 统计特征的一致性。研究一个社交网络在不同时期的共同特征也很关键,也很有意义。从应用的角度来看,电子学习或电子购物中的推荐系统 [24, 47]、日常交流中的社交互动 [25] 都是基于社交网络的共同特征来促进的。

在本文中,我们研究了兰州财经大学(LZUFE)数字图书馆中ORBN的统计特征。基于过去四个学年在数字图书馆收集的日志数据,我们构建了一个双向的全球在线阅读行为网络,该网络由四个双向子网络组成,每个子网络四个学年。之后,我们将二分子网络投影到分别建模读者-读者和书籍-书籍关系的单模式网络上。然后,我们研究了这些单模网络的基本统计特征。

本文的其余部分安排如下。第2章介绍了 ORBN 构建的方法,包括日志数据收集、二部网络建模和单模网络投影。第3章调查并比较了投影的单模网络的基本统计特性。第4章讨论了这些发现。最后,第5章总结并总结了本文。

  1. 方法论

2.1 数据收集

本研究使用的数据是从 2013 年 9 月至 2017 年 8 月四个学年期间从 LZUFE 数字图书馆的个人日志中收集的。我们总共收集了 480,023 条包含用户行为信息的数据条目,例如书籍条码、阅读器条码、阅读器等级、阅读器部门、电子书阅读行为或纸书搜索查询等。然后我们进行了统计。为了比较每个学年建立的子网之间的统计特征,我们将日志数据按学年分为四组,如表1所示。分析表明相关读者与学生总数成正比和工作人员。它还表明,相关图书与图书馆的整个馆藏成正比。另一个有趣的观察是,每组中相关读者和书籍的数量相似。

在数字图书馆中,每个读者有一个唯一的读者条码,每本书有一个唯一的图书条码。大学图书馆提供了一些相同版本(即具有相同作者、标题、出版日期和公司)的书籍的多份副本。因此,在数字图书馆中使用与这些书籍的条形码相对应的索书号。索书号与图书条码的关系如表2所示。为了准确揭示在线阅读行为,索书号用于识别同一本书的不同版本。

表 1 读者和书籍的总数关系

学年

读者人数

书籍数量

记录数量

2013-2014

12587

53821

114199

2014-2015

13172

59281

128582

2015-2016

13807

63147

134695

2016-2017

11560

50222

102547

表 2 索书号与书本条码的关系

索书号

书本条码

上标

O141.4

B1183689

Mathematical Modelling Application

TP316.81

B1170520

Advanced Unix Programming

TP316.81

B1170521

Advanced Unix Programming

TP316.81

B1170522

Advanced Unix Programming

2.2 构建二分 ORBN

在现实世界中,许多复杂系统可以建模为二分网络[23],例如人类性网络[30,31]、协作网络[40]、意见网络[8,33]、电影演员网络[3,46]和代谢网络[27]等。近年来,许多研究人员调查了[5,16,23,28,32] 并建模了[38, 39]二分网络。在这项研究中,我们构建了一个双向网络来模拟大学数字图书馆中的在线阅读行为。例如,图1描绘了2014年收集的LZUFE数字图书馆日志数据得到的二部拓扑图。

图 1 LZUFE数字图书馆2014年日志数据得到的二部拓扑图

在此,我们正式定义了本研究中使用的四个概念。

定义1 在二分 ORBN 中,有两种类型的节点,即读者节点和书籍节点。所有阅读器节点的集合表示为 R:

公式 1

其中 m 代表读者总数。

书节点集表示为B:

公式 2

其中 n 代表书籍总数。

备注 在ORBN的二分网络中,读者节点集合R表示为读者的条形码。书籍节点集 B 由纸质书籍的索书号或电子书的条形码。

定义2 在ORBN的二分网络中,如果读者ri读了书 bj,则存在一个边ri和bj之间,表示为eij

公式 3

备注 在二分ORBN中,如果两个节点之间存在读取关系,则两个节点通过边连接。此处不考虑阅读同一本书的次数。因此,ORBN的边是未加权和无向的。

定义3 二分在线阅读行为网络(ORBN)定义为:

图 2 a 读者-读者投影; b 一个示例二分网络; c 书本-书本投影

公式 4

其中E是所有边的集合。

图2(b) 以一个小的二分ORBN为例,其中左边的节点代表读者,右边的节点代表书籍。

定义4 ORBN的关联矩阵M定义为:

公式 5

让i表示读者总数,j表示ORBN中相关书籍的总数,关联矩阵M是一个itimes;j矩阵。

2.2 投影到单模网络

接下来,将二分ORBN投影到单模网络上。读者-读者关系的单模式投影产生一个仅包含读者节点的网络,如果两个读者节点至少阅读了一本相同的书,则两个读者节点通过边连接。类似地,书-书关系的单模投影产生一个仅包含书节点的网络,如果两本书被同一读者阅读过,则它们通过边连接。因此,二分ORBN被投影到一个未加权和无向的单模式网络 [7, 26, 36, 44]。形式上,我们定义下面的投影邻接矩阵P。

定义5 对于读者节点的单模投影,单模网络用投影邻接矩阵P表示,定义为:

公式 6

它的元素是基于关联矩阵 M 计算的:

公式 7

一般来说,读者-读者关系的推导如下:

公式 8

书-书关系对应的投影邻接矩阵K的进行如下:

公式 9

同样,也有:

公式 10

图2(a)和(c)分别说明了单模式读者-读者和书-书网络的投影结果。

第三章 基本统计特征

我们构建了 ORBN 的四个子网络,每个子网络对应 2013 年和 2017 年之间的一个学年。这样,我们可以比较这些子网络之间的特征。 本研究考察的基本统计特征包括节点总数、边总数、平均度数、度数分布、直径、平均最短路径、平均聚类系数、介数中心性和社区数等。

3.1 投影网络的大小

根据定义5,二分ORBN被投影到单模式书籍-书籍网络和读者-读者网络上。它们的大小列于表3中

剩余内容已隐藏,支付完成后下载完整资料


英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[596102],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。