基于可视化本体的信息检索系统外文翻译资料

 2022-09-07 11:09

英语原文共 9 页,剩余内容已隐藏,支付完成后下载完整资料


基于可视化本体的信息检索系统

Leyal Zhuhadar, Olfa Nasraoui, Robert Wyatt

知识创新与网络开发实验室

计算机工程与计算机科学系

肯塔基州路易斯维尔大学40292,美国。

摘要

语义网已演变为一项关键技术,给电子学习中有据可查的问题带来了新的见解和解决方案。语义网络学习的研究领域涵盖了广泛的研究问题。在本文中,我们提出,在网上学习的背景下,以可视化的本体驱动信息检索系统的方法。这种方法己被实施在了HyperManyMedial平台上,并已被WKU2的学生在网上使用。设计工作是基于以下步骤:(1)将HyperManyMedia表示为树组成的概念和子概念,其中的叶子是文档(讲座),(2)在这个平台上嵌入Nutch搜索引擎,l3)重新配置Nutch搜索引擎以适应语义检索(4)使用Frefuse3作为视觉工具将本体呈现为图形,(5)以小程序的方式嵌入图表到平台,这样使学习者可以通过对领域本体的节点点击直观地导航。

关键词:可视化;知识工程;本体;信息检索

1引言

HyperMauyMedia是一种信息检索系统,它利用本体作为模型来提供语义信息。这种方法使用两种不同类型的本体,一个完整的本体模型表示了整个网络学习域(基于内容的本体),和一个learner-based本体摸型表示学习者的个人资料。本体模型的实现和信息检索系统的设计是独立分开的。HyperManyMedia系统的体系结构可以提供,管理和收集数据,针对学习者的个人资料允许高水平的适应性和相关性。此外,该系统采用聚类技术将文件分割成最佳分类,且不被学院和课程名称的手工分类学影晌。为了实现这一目标需用个性化搜索的方法来实现,它利用语义网标准(RDF和OWL)的优势来表示内容和用户简档。该框架包括以下几个阶段:(1)利用已知院校和课程信息的概念和子概念建立语义网络学习域:包括以下几个阶段:(1)利用已知院校和课程信息的概念和子概念建立语义网络学习域;(2)从记录已存取课程的导航白志中产生语义学习者的个人资料作为一个本体;(3)聚类文献以发现比现有的群组和分类系统提供的更好的子概念(每个群组中最优的术语);(4)根据学习内容和用户介绍中概念匹配来重新排序学习者的搜索结果,以及(5)在搜索过程中,根据他们的个人资料最接近的匹配群组的术语形式,给学习者提供具有语义的建议。本文的主要焦点是己被添加到该平台,允许学牛可视导航的系统新工具的实施。该工具提供了一个馄合方法来搜索内容,而不是输入一个简单的搜索字词,然后推荐与语义相关材料,用户可以单击图〔本体)上的节点,然后该工具会根据术语和它下面的子概念之间的语义关系推荐子图.用户在图上的任何动作都反映在两个位置:(1)子图,和(2)检索网页。本文的其余部分被分为以下几个部分

第2节(背景及相关工作):我们给出了对本体(知识表示),语义网和语义网的电子学习的概述。

第3节(方法):本章介绍了语义域结构和语义域的表示。

第4节(调试):本节介绍了建立HyperManyMedia本体并将本体添加到搜索引擎的过程。最终实现可视化本体搜索引擎的设计。

第5节(结论):在这一节中,我们提出我们的研究和我们的贡献的新颖性。

2背景和相关工作.

“本体是一个兴趣域的概念化的明确和正式规范。”[6]是使用本体来表示人工智能系统中信息的先行者。在那项工作中使用本体论的主要目标是支持:(I)共享(2)重新使用AI系统中正式的具有代表性的信息。要做到这一点,[6]不得不定义通用词汇,然后用它来代表共享信息。这包括类,函数,对象的定义,并且所有这些之间的关系是一个本体。

更具体地,本体表示语义网的语言。由于语义网不会取代当前的网,但会在它的基础上建立,因此,需要新的结构来处理这个问题,旧的形式语言HTML需要被保留,并需要使用一个新的语义语言,资源描述框架(RDF)。RDF封装Web本体语言(OWL )类似于XWL格式的架构并且建立在它的基础上。Tim Berners-Lee提出了以下结构,如图1听示。

所提出的语义网栈,如图2己逐步细化。W3C4提供了语义网的当前状态更新。

已经实现了哪些?

所有下列技术是标准化的URI, UNICODE, XML,RDF,RDFS和OWL;

RDF(资源描述框架,被认为是允许三元定义的语义网框架。

RDF,为RDF提供词汇表。

OWL对RDF进行扩展并提洪逻辑描述和语义推理。-

SPARQL作为查询语言。1

什么尚未实现的呢?

以下所有技术都尚不规范:

信任层(进行中)。

数据显示层(进行中)。

规则(进行中)。、

用户界面(在建):这部分是将用户链接到语义网的最重要组成部分。它代表在信任层之上的层。许多不同的想法已经被提出,但仍然没有标准化的技术通过。

语义水平从语义网堆栈的底部层,参见图1,朝着上层提高。[4]映射这些级别和本体之间的关系,并通过本体图谱来表达这种关系,如图2所示。

这个图谱把本体级别分为四个著名的类别(1)分类,(2)词库,(3)概念模型,(4)领域论。语义的优点随着我们从一个较低类别移动到较高类别不断增加。本体的主要目的是使知识重用和共享,从而本体在词汇及其含义建立。在这个意义上,我们可以将其和面向对象编程语言的对象的定义比较。当我们定义一个对象,这个对象代表一个类,当我们执行这个计划,我们创建这个类的一个实例。类似本体我们有代表类和代表实例的特定项目的一般概念,我们也有这些概念之间的关系,性质,功能和规则等。一个分类系统包含了我们的域表示为类和子类的结构,在这个级别(弱语义)没有定义这些/子类之间的关系。叙词表将本体移向更高层次,其中定义了关系和层次关系。概念模型(OWL, UML, DAML等)允许类/子类层次的定义。最后,领域论(模态逻辑,一阶逻辑等),允许软件理解最高级别的语义数据。

2.1语义网的电子学习

语义网己经发展成为一项关键技术,给电子学习己存在的问题带来了新的见解和解决方案。语义网络学习的研究领域涵盖了广泛的研究问题。下面,我们介绍一些在电子学习的背景下语义网的成就。

文献[2]中提出的工作关注教育语义网,即如何设计提供教育内容可共享,可重用性和互操作性功能的创作工具。这项研究提出了一个本体驱动的创作工具的框架,教育平台可以从中受益。

文献[5]认为,一个本体支持的学习过程增强了在网络的学习环境中教师和学生之间的活力,并调查了人工智能教育〔AIED )和Web Intelligence ( WI )之间的关系,呈现出强烈的证据表明,AIED领域均能受益于WI技术的核心部分,如本体,适应性,个性化和软件代理。这样做的好处的一个重要方面是,它可以提高学习者的舒适性,特别是从一个个性化的观点来看,WI技术可以用于创建个模型,它可以在支持本体学习者的学习环境下将学习者从手动发现相关材料的困扰中解放出来。

文献[9]说明了协作学习环境中本体使能标注和知识管理的框架。提议的框架提供个性化和语义内容检索,个性化方面使用提供学习者和注释的内容之间的关系的本体来表示。这些本体后来都被用来发现类似的内容和合协作内容,这就是通过标注查询的检索系统。

文献[1]提出了在电子学习中一种基于本体的文档驱动的内存,它使用两个本体:和普通训练相关的一般领域本体和特定领域本体来处理手头上的应用程序的通用本体。这项研究分为三个领域:知识工程,教学设计和语义网,和利用主题地图在学习记忆中表达。

文献[8]提出了一种电子学习We网服务架构,可以为学生提供以下内容:注册,认证,辅导,问题答案的查询服务和注释的反馈。这种架构的可行性已通过在电子学习领域不同的场景进行测试,最有趣的一个是在学生论文中系统提供了论点的语义标注的能力。三种不同的本体管辖系统:学习材料本体,标注模式本体和服务本体。.

文献7提出了基于语义网的个性化网络学习框架,其中超文本结构使用语义网服务自动组成。这一框架的实施是建立在分布式超媒体教育元数据,这项工作的核心TRIPLE,语义网的一种基于逻辑的查询语言上。此框架下,利用推理规则,以提供领域和学习者之间的交互,(2)领域本体表示资源及其关系,其中(3)观察本体,用超文本系统模仿学习者协作。

在下面的章节我们将要描述设计和方法的实施。

3方法论

HyperManyMedia是一个结构化的信息检索模型,它考虑到用户感兴趣在一个特定的信息(文件),它有着一个特定的主题,特定的媒体格式。信息的层次组织形式实在域的范围内对概念进行分类,并用本体状结构对信息进行分类。该系统识别用户最近访问的域名并显示用户输入的查询和其概念之间的语义关系。显示域的结构有利于缩短用户查找特定信息的浏览时间;此外,他会提醒用户获取类似于他们所感兴趣的其他概念。这允许用户看到域完整的环境,而不是只是他们正在寻找的信息。该系统使用一个本体推理结构。当用户查询特定的信息室时,所述检索系统提供有关这个查询的资源,也显示了与用户提交的查询相关所有概念/子概念。独立构建本体,不影响存储组织通过本体导航的方法,可以理解为一个有向图的遍历。图连接的节点代表在语义上的相关概念。当用户点击本体中的节点,用户可以看到这个概念下的子节点。如果用对层次结构的更深层次的导航感兴趣,他们可以继续通过这些节点导航,而且这时候他们有兴趣在相反的方向(高层概念)导航,他们可以点击返回到父节点。以这种方式,用户能够不限于该系统的设计,并且可以在由该本体表示的概念和关系之间自由切换。

3.1语义域结构

令R代表被表示为域的根目录和Ci代表R下的一个概念。在这种情况下:

其中n=域中的概念总数,每个概念Ci既包括子概念可以是分支或树叶,这是实际的文件。

当n等于领域中概念总数,每一个概念Ci包括子概念和附属,子概念可以是概念的子类,附属是具体的实例。

我们根据电子学习资源的层次结构,将上述语义信息编码到OWL中的一个树状结构领域本体上。根概念是大学,而子概念是课程,叶子是域(课程)的资源。每个节点包含以下信息:lt;父节点,概念节点,访问节点,子节点gt;,而叶节点持有lt;父节点,访问节点,文档,无gt;。请参考我们以前的工作[11,14]的详细信息。

3.2语义域的表示

至2006年11月,西肯塔基大学拥有了对于课程的HyperManyMedia开源库。这些资源(课程)通过不同的格式获取:文字,幻灯片,音频,视频,播客,视频播客和RSS。基于这些资源的分级结构在该平台上对域的语义进行设计。该HyperManyMedia平台包含十一个不同的概念(学院):“英语”,“社会工作”,“历史学”,“化学”,“会计学”,“数学”,“消费者和家庭科学”,“建筑与制造科学”,“工程学”和“交流障碍学”。每个概念(学院)含有不同数量的子概念(课程),每个子概念下(课程),学习对象表示这棵树的叶子。

图3: HyperManyMedia本体的层次结构

4实施

HperManyMedia搜索引擎是Nutch7搜索引擎的扩展版本,这是一个开源的信息检索,系统。我们通过添加插件修改Notch以支持多模式搜索界面,如元数据搜索[12, 13]和语义搜索[11,14]的机制。本文关注的是我们最近己添加到HyperManyMedia的可视化界面:一个基于视觉本体的界面。以下部分描述了此界面的实现。

4. 1建立HyperManyMedia本体

最近,各种基于知识的框架应用得以实现,可支持本体建模。两个应用是最有名的:protege和Altova。Protege是一个开源的本体编辑器和基于知识的框架,它支持的两种方式的本体模型:(1)protege-Frames(2)protege-OWL编辑器。Altova是是基于工业的建模工具,它带有图形化的数据映射,数据转换和数据集成工具。Altova支持XWL.映射,数据库,平面文件,EDI Excel 2007 (OOXML),,XBRL和Web 服务的格式。在这项研究中使用了Protege,它为我们提供了可视化的工具来构建HyperManyMedia本体的结构。图3展示了在Protege中HyperManyMedia本体的设计。

4. 2添加本体到Hutch搜索引擎

HyperManyMedia搜索引擎使用向量空间模型(VSM)和布尔模型相结合,找到与用户提交的查询最相关的文档。查询Q对文档D的比分关系到一个向量空间模型(VSM)中文档与查询向量之间的余弦距离相似性。

其中,和是两个文件的向量空间表示,T转换符和表示两个向量之间的点积。

它在VSM的基础上进行了一些改进,扩展了布尔向量模型和增强了与术语及相关领域的联系。HyperManyMedia的得分受每一个查询术语的得分之和的影响。对于每个方面,得分是下列因素的结果:它的“tf”,“idf”和索引时间的提升。得分的计算方法如下,

HyperManyMedia的语义搜索引擎是由包含域的完整本体结构的RDF / OWL文件管理。用户导航方案:当用户提交一个查询,语义搜索引擎使用上述评分算法检索包含与查询最相关的文件,此外,它映射查询到本体文件(它映射每一个包含此查询的概念/子概念),然后如果该概念/子概念被发现,搜索引擎就会向用户推荐与这个特定查询语义相关的概念子概念,如图4

4. 3设计一个基于可视化本体的搜索引擎

我们添加可

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[146699],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。