基于 XML 的异构数据交换研究外文翻译资料

 2022-08-27 10:08

Physics Procedia 25 ( 2012 ) 1382 – 1387

1875-3892 copy; 2012 Published by Elsevier B.V. Selection and/or peer-review under responsibility of Garry Lee

doi: 10.1016/j.phpro.2012.03.250

2012 International Conference on Solid State Devices and Materials Science

Research on Heterogeneous Data Exchange based on XML

Huanqin Lia, Jinfeng Liub

aDepartment of information technology ,Zhengzhou Normal University,Zhengzhou, henan province, China

bDepartment of The software college of,Henan university,Zhengzhou, henan province, China

Abstract

Integration of multiple data sources is becoming increasingly important for enterprises that cooperate closely with

their partners for e-commerce. OLAP enables analysts and decision makers fast access to various materialized views

from data warehouses. However, many corporations have internal business applications deployed on different

platforms. This paper introduces a model for heterogeneous data exchange based on XML. The system can exchange

and share the data among the different sources. The method used to realize the heterogeneous data exchange is givenin this paper.

copy; 2011 Published by Elsevier Ltd. Selection and/or peer-review under responsibility of [name organizer]

Keywords: XML; heterogeneous data; data exchange; relation database.

1. Introduction

Database management systems (DBMS) pervade and proliferate tremendously throughout industry in

the past decades. However, due to the storage capacity and cost, most of the prior database applications are mainly tailored to serve the information needs of people who handle day-to-day or short-term operations,such as inventory or purchasing. Thanks to the ever-increasing capability and decreasing price of storage devices, together with the speed promotion of Internet technologies, it is now feasible to bring

historical data on-line to serve corporate decision-makers to access all the organizationrsquo;s data, wherever it is located. The challenge for organizations now is the need to turn their archives of data into an integrated source of knowledge, such that a consolidated view of the organizationrsquo;s data can be presented for decision-making[1].

However,since a data warehouse creation needs to integrate various enterprise-wide corporate data into

a single repository, from which users can query via various dimensions and produce analysis reports[2].There are problems may arise in building a data warehouse with pre-existing data, since it has various

Available online at www.sciencedirect.com

copy; 2012 Published by Elsevier B.V. Selection and/or peer-review under responsibility of Garry Lee

Open access under CC BY-NC-ND license.

Open access under CC BY-NC-ND license.

Huanqin Li and Jinfeng Liu / Physics Procedia 25 ( 2012 ) 1382 – 1387 1383

types of heterogeneity. that makes it a common consensus that he ETL process(i.e., extraction,

transformation, and loading) of data from various sources is indispensable before constructing a data

warehouse. Therefore, the general conclusion is that the task has proven to be labor-intensive, error-prone,time-consuming and generally frustrating, leading a number of data warehousing projects to be abandoned mid-way through development. However, Trisolini et al. (1999) and Srivastava and Chen (1999) have pointed out that the situation is not as tough as it appears. In fact, the heterogeneity problems that are being encountered in data warehouse establishment are very similar to those encountered in heterogeneous database integration, which have been well studied in he past decade (ACM Computing Survey 1990; Batini et al.1986; Breitbart et al. 1986; Breitbart 1990; Castano et al. 2001; IEEE Computer1991; Hsiao 1992ab).Those works accomplished in dealing with heterogeneous schema integration have established a good framework to alleviate this task[3][4][5].

XML (eXtensible Marked Language) for the data integration of information provides a new solution.

Because the XML can serve as a kind of information of high-rise encapsulation and transmission standards,or even different application system between the data interface standards, be able to accurately express multi-dimensional information between the logical structure and meaning. When a query task related tasks store data in different data sources, XML through its standard format for different between applications data exchange and different data integration between system provides a powerful mechanism. It appeared smoke soon in heterogeneous database applied in the integration of heterogeneous database based on XML,integration, and inquires both at home and abroad, it has become a hot topic[6].

Figure 1. The Process of Model-driven mapping

2. The realization of heterogeneous data exchange

Based on XML heterogeneous data conversion technology as fig2 shows. Includes the following several main program modules.

1) connect to database. Both will database data saved to XML files, or XML data saved to the database,we first need to connect remotely user database. In system allows the user to select different database connection validation method.

2) From a database to read the source data, fill to recover Dataset cache list. Because a database have

multiple relation table, during operation needs all the table filled to a data to recover Dataset cache list,

from the XML into database and then separated into multi-table.

1384 Huanqin Li and Jinfeng Liu / Physics Procedia 25 ( 2012 ) 1382 – 1387

3) Database data saved to XML files. According to read watch ace database data in turn to recover

Dataset cache list to filling, and the cache the data in the table to load the XM

剩余内容已隐藏,支付完成后下载完整资料


2012 固态器件和材料学国际会议

基于 XML 的异构数据交换研究

摘 要

随着互联网信息化应用的不断普及, 互联网上连接着各种模型的数据库系统, 组成了海量的信息资源库. 然而,这些信息资源库采用的数据模型不同,导致数据共享比较差,从而浪费了很大的资源. 为了使这些分布在不同数据库中的信息资源实现共享,互联网的异构分布式信息系统正在快速发展,最终实现数据信息资源和硬件设备资源在不同数据模型数据库之间的合并和共享,多个数据源的集成变得越来越重要与电子商务及其伙伴密切合作的企业。OLAP 使分析师和决策制定者从数据仓库到各种实例化视图快速存取。然而,很多公司有内部业务应用程序部署在不同的平台上。本文介绍了一种基于 XML 的异构数据交换模型。该系统可以交换和共享之间的不同来源的数据。本文给出了用来实现异构数据交换的方法。

关键词 XML ;异构数据 ;数据交换 ;关系数据库。

目 录

第1章 绪论 1

1.1 引言 1

第2章 异构数据交换的实现 2

2.1 概述 2

2.1.1 数据库链接 3

2.1.2 到数据库的信息转换的 XML 文档 4

2.1.3 一个关系数据库和 XML 文档的映射规则 4

结 论 8

参 考 文 献 9

绪论

引言

数据库管理系统 (DBMS) 渗透和扩散极大地整个行业在过去的几十年里。然而,由于存储容量和成本,事先的数据库应用程序的大多数主要拥有得天独厚的为了满足处理日常或短期操作的人的信息如库存或采购。由于不断增加的能力和降低的存储设备,与互联网技术,速度推广相结合的价格现在是可行,使历史数据在线服务企业决策者来访问该组织的所有数据,无论它位于。组织面临的挑战现在是知识的需要他们的数据的档案变成一个综合来源,这样本组织数据的统一的视图可以为决策 [1] 提出了一种

然而,由于数据仓库创建需要将各种企业范围的企业数据集成到单个存储库,从哪些用户可以查询通过各种维度并编写分析报告 [2]。有问题可能出现在建立数据仓库与预先存在的数据,因为它有各种类型的非均质性。这使得它一项共识他来自各种来源的数据(即,提取、 转换和加载) 的 ETL 过程是必不可少的在构建数据之前仓库。因此,总的结论是这项任务已被证明是劳动密集型、 容易出错、 耗时和一般令人沮丧的是,导致大量的数据仓库项目是发展的废弃的中途。然而,Trisolini et al.(1999 年) 和斯里瓦斯塔瓦和陈 (1999 年) 已经指出这情况并不一样坚韧,看来。事实上,非均质性的问题是在数据仓库建设中遇到非常类似于那些遇到的异构数据库集成,过去十年 (ACM 计算调查 1990 ; 有很好研究在他吗Batini et al.1986 ;Breitbart et al.1986 年;Breitbart 1990 年 ;卡斯塔尼奥 et al.2001 年 ;IEEE Computer1991 ;萧1992ab)。建立了在异构模式集成处理完成这些作品很好的框架,以纾缓此任务 [3] [4] [5]。

XML (可扩展标记语言) 的信息的数据集成提供了一个新的解决方案。因为 XML 可以作为一种信息的高层封装和传输标准或甚至不同的应用程序系统之间的数据接口标准,能更准确地表达多维信息之间的逻辑结构和含义。当查询任务相关的任务在不同的数据源,通过其标准格式的 XML 存储数据,为不同系统之间的不同的数据集成与应用程序数据交换提供了功能强大的机制。它出现烟很快在异构数据库在基于 XML,集成、 异构数据库集成中的应用,并探讨两者在家里和在国外,它已成为一个热门话题 [6]。

异构数据交换的实现

概述

基于 XML 的异构数据转换技术,如图 2 所示。包括以下几个主程序模块。

1) 连接到数据库。既将数据库保存到 XML 文件的数据或 XML 数据保存到数据库中,我们首先需要远程连接的用户数据库。系统中允许用户选择不同的数据库连接验证方法。

2) 从一个数据库,以读取源数据,填补向恢复数据集缓存列表。因为一个数据库有多个关系表,期间运营需要所有表填充到要恢复数据集缓存列表中,从数据库到 XML 数据,然后分成多桌

3) 数据库中的数据保存到 XML 文件。读取表反过来要恢复到充要加载的 XML 文档的表中的数据缓存的数据集缓存列表的 ace 数据库数据实现数据库文件 XML 文件转换 [7]。

4) XML 数据存储在数据库中。连接到用户数据库的前提条件,第一次加载 XML 数据解析源来恢复数据集然后填写要看每个字段的名称和类型。最后根据分析的结果,与SQL 命令创建数据库和数据库表最后再按字段解析每个字段值和 SQL 命令将这些值插入到新表中的数据,保存到相应的数据库。

数据库链接

系统使用 DBS XML 文件来转换 j 存储的源数据库和目标数据库数据库连接信息,包括: 数据库名称、 驱动器、 服务器、 数据库的网络地址、 用户名、 密码等,用户在转换之前应该是星展银行 XML 文件填充,选择类型的数据库所需的 j 转换过程,将根据用户和星展银行选择的体系。XML,通过 JDBC 驱动程序和 JDBC-完成各种桥梁ODBC 数据库连接。以下为星展银行。XML 文件示例 [8]。

lt; ? xml v ersion= ' 1. 0' encoding= 'GB2312'? gt;

lt; dbsgt;

lt; sourcegt;

lt;classgt; sun. jdbc.odbc.JdbcOdbcDriver lt;/classgt;

lt;urlgt; jdbc: o dbc: abclt;/urlgt;

lt; usergt; ''lt;/usergt;

lt; passwordgt; ''lt;/ passwordgt;

lt; / sourcegt;

lt;destgt;

lt; classgt; com. microsof t. jdbc.sqlserver. SQLServerDriverlt;/classgt;

lt; urlgt; jdbc:microsof t:sql server: //localhost :1433; DatabaseN ame= w anglt;/urlgt;

lt; usergt; w anglt; / usergt;

lt;passwordgt; 123456lt;/passwordgt;

lt;/destgt;

lt;/dbsgt;lt;/dbsgt;

到数据库的信息转换的 XML 文档

与 XML 文档,您可以采取交换数据存到目标数据库表。过程如下所示:

1) 生成数据库连接的语句。通过输入数据接口接收方的数据库信息的目的。必须在目标数据库查询和生成的 SQL 语句插入数据生成数据库链接语句,才能使用 JDBC 连接数据库之前

2) 解析 XML 文档。在 Xml 文档包含数据交换,和因此必须生成在解析 SQL 中的插入数据之前。

3) 流通加工的元素。要搜索的文档检索中的信息,需要包括所有数据的根元素。一旦你有了此元素,应用程序可以使用 getElementByTagName () 并通过检索数据的元素名称。此方法返回可用于访问 [9] 的每个元素的节点。

4) 检索数据。要合并 getElementByTagName () 的实际数据的检索和仔细地参观了该节点的子节点。为元素的属性值,可以通过 getAttribute () 方法获取。子元素的复杂,检索需要期待一些名称检索节点的所有子元素。数据后可以添加到数据库中的数据。

一个关系数据库和 XML 文档的映射规则

在 XML 数据和数据库之间转换,您需要考虑许多问题,XML 并不支持任何实际意义的数据模型,在 XML 文档中的所有数据将都会作为纯文本处理。通常数据转换中间件需要放在 XML 文档纯文本转换数据库中的数据类型或数据库数据类型转换为纯文本的XML 格式。在 XML 文档结构和数据库模型结构之间每个映射,我们使用如下 [10]。

异构数据交换,是将异构数据转换成一种统一的标准数据传送格式,然后通过网络传送与交换,被其它的目标数据库接收后,再将标准化的数据转换成目标数据库的数据模型或相应的 DBMS 格式,进而实现异构数据库系统中数据的共享和透明访问. 基于 XML 的异构数据交换系统。利用 XML 提供的标准为交换模型, 通过把 XML 文档作为底层数据交换的中介进行数据的转换与传输,完成各应用系统之间的无缝数据交换,从而实现异构数据的集成共享,达到各种现有信息资源的充分。利用 XML 技术进行异构数据交换,首先需要远程连接数据库,读取源数据后通过数据库信息到 XML 的映射规则将异构源数据转换为 XML 标准结构文档,实现将异构数据保存到 XML 文档中. 再将 XML 标准结构文档通过传输通道传送到相应的目标数据库系统. 最后,通过目标数据库系统的数据转换程序,将 XML文档转换成目标系统相应的数据结构模式,进而完成异构数据源之间的异构数据交换。

基于数据元素树映射。后研究基于数据映射的现有方法,提出了一种基于树的元素的映射方法,它是一种基于模型的转换方法。此方法首先创建元素节点树和树元素与其他类型的映射的数据之间的关系,然后映射的元素的树和完整的数据转换的基础上。先看看这棵树的定义的元素。

X M L 是 E x t e n s i b l e M a r k u pLanguage 的简写, 是由 W3C 所发展的,XML 以一种开放的自我描述的方式定义了数据结构,在描述数据内容的同时也突出对结构的描述,从而体现出数据之间的关系, 对于异构数据集成系统来说, XML 具有自描述性,可扩展性和平台无关等特点元素树的定义。一棵树是一棵树元素描述 DTD 元素的关系树,其定义如下: 树的每个节点对应于一个 DTD 元素 。

每个节点包含以下信息: 子元素、 属性、 列表和其他信息的列表。

子元素列表中包含子元素,另一个用于每个孩子子节点的所有的元素。属性列表中包含的元素的所有属性,每个属性属性类型、 属性名称、 属性值) 的三倍。

其他信息包括: 父节点、 元素内容模型、 元素内容和元素的文本内容的匹配项。

DTD 元素内容不包含其他元素的根。

子元素列表为空或树的叶节点的元素属性。

树木在某些情况下是完全,即当某些元素的内容模型具有子内容模型的树元素,系统无法确定内容的内容模型的定义应该是如何出现的儿子。在这个时刻,需要插入内容模型节点,说明了情况,然后根据确定的应显示内容的实际的数据内容,应显示多少次。所谓的内容模型节点是一种特别的节点,其目的是要反映的内容,建立了模型的儿子。内容模型节点属于此子节点的内容模型中相应节点的儿子的所有元素。例如下面的定义元素,它的内容模型是颗粒的含量,即 childl 序列列表 child2 或 child3,根据订单child4 出现在 XML 文档中。它的内容在元模型包含一个高大的内容模型,这个儿子内容模型是内容的粒子,即选择列表 XML 文件中的只能出现 child2 和 child3-之一,我们使用一个内容模型节点 [12]。

一个异构数据交换的平台是使基于不同数据源的数据能够进行畅通的信息交互的关键。

在元素树的基础上我们还需要定义一个 XML 元素和其他类型的数据之间的映射关系。对于结构化数据,因为它具有精细结构,我们可以定义 XML 文档首先对结构的映射规则的结构化数据,然后使用映射规则自动确定 XML 元素与业务数据的映射关系。基于关系数据库,例如,元数据库模型之间的树和映射规则可以定义,如下所示:

  • 根的树节点相应的元素,在数据库表中,称为根表。
  • 如果节点列表或子元素的属性列表不为空,所以此节点称为表节点,它对应于数据库;一张桌子。

如果对

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[500231],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。