传统文件环境下的组织数据外文翻译资料

 2022-06-13 11:06

1.1 Organizing Data In A Traditional File Environment

An effective information system provides users with accurate, timely, and relevant information. Accurate information is free of errors. Information is timely when it is available to decision makers when it is needed. Information is relevant when it is useful and appropriate for the types of work and decisions that require it.

Many businesses donrsquo;t have timely, accurate, or relevant information because the data in their information systems have been poorly organized and maintained. Thatrsquo;s why data management is so essential. To understand the problem, letrsquo;s look at how information systems arrange data in computer files and traditional methods of file management.

1.1.1 FILE ORGANIZATION TERMS AND CONCEPTS

A computer system organizes data in a hierarchy that starts with bits and bytes and progresses to fields, records, files, and databases. A bit represents the smallest unit of data a computer can handle. A group of bits, called a byte, represents a single character, which can be a letter, a number, or another symbol. A grouping of characters into a word, a group of words, or a complete number (such as a personrsquo;s name or age) is called a field. A group of related fields, such as the studentrsquo;s name, the course taken, the date, and the grade, comprises a record; a group of records of the same type is called a file.

A record describes an entity. An entity is a person, place, thing, or event on which we store and maintain information. Each characteristic or quality describing a particular entity is called an attribute. For example, Student ID, Course, Date, and Grade are attributes of the entity COURSE. The specific values that these attributes can have are found in the fields of the record describing the entity COURSE.

1.1.2 PROBLEMS WITH THE TRADITIONAL FILE ENVIRONMENT

In most organizations, systems tended to grow independently without a company-wide plan. Accounting, finance, manufacturing, human resources, and sales and marketing all developed their own systems and data files.

Each application, of course, required its own files and its own computer program to operate. For example, the human resources functional area might have a personnel master file, a payroll file, a medical insurance file, a pension file, a mailing list file, and so forth until tens, perhaps hundreds, of files and programs existed. In the company as a whole, this process led to multiple master files created, maintained, and operated by separate divisions or departments. As this process goes on for 5 or 10 years, the organization is saddled with hundreds of programs and applications that are very difficult to maintain and manage. The resulting problems are data redundancy and inconsistency, program-data dependence, inflexibility, poor data security, and an inability to share data among applications.

1 Data Redundancy and Inconsistency

Data redundancy is the presence of duplicate data in multiple data files so that the same data are stored in more than place or location. Data redundancy occurs when different groups in an organization independently collect the same piece of data and store it independently of each other. Data redundancy wastes storage resources and also leads to data inconsistency, where the same attribute may have different values. The same attribute, Student ID, may also have different names in different systems throughout the organization. Some systems might use Student ID and others might use ID, for example.

Additional confusion might result from using different coding systems to represent values for an attribute. For instance, the sales, inventory, and manufacturing systems of a clothing retailer might use different codes to represent clothing size. One system might represent clothing size as “extra-large,” whereas another might use the code “XL” for the same purpose. The resulting confusion would make it difficult for companies to create customer relationship management, supply chain management, or enterprise systems that integrate data from different sources.

2 Program-Data Dependence

Program-data dependence refers to the coupling of data stored in files and the specific programs required to update and maintain those files such that changes in programs require changes to the data. Every traditional computer program has to describe the location and nature of the data with which it works. In a traditional file environment, any change in a software program could require a change in the data accessed by that program. One program might be modified from a five-digit to a nine-digit ZIP code. If the original data file were changed from five-digit to nine-digit ZIP codes, then other programs that required the five-digit ZIP code would no longer work properly. Such changes could cost millions of dollars to implement properly.

3 Lack of Flexibility

A traditional file system can deliver routine scheduled reports after extensive programming efforts, but it cannot deliver ad hoc reports or respond to unanticipated information requirements in a timely fashion. The information required by ad hoc requests is somewhere in the system but may be too expensive to retrieve. Several programmers might have to work for weeks to put together the required data items in a new file.

4 Poor Security

Because there is little control or management of data, access to and dissemination of information may be out of control. Management may have no way of knowing who is accessing or even making changes to the organizationrsquo;s data.

5 Lack of Data Sharing and Availability

Because pieces of information

全文共32977字,剩余内容已隐藏,支付完成后下载完整资料


1.1 传统文件环境下的组织数据

一个有效的信息系统向用户提供准确、及时、有用的信息,使数据精确没有错误。信息可以及时提供给决策者。与工作和决策类型相关联的信息可以提供帮助并得到使用。

许多企业没有及时、准确或相关的信息,因为他们的信息系统中的数据组织和维护都很差。 这就是数据管理如此重要的原因。 为了理解这个问题,让我们看看信息系统如何安排计算机文件中的数据和传统的文件管理方法。

1.1.1 文件组织术语和概念

计算机系统有组织地管理数据,从位、字节到字段、记录、文件和数据库。位是计算机能处理的最小数据单位。一组位叫字节,可以表示一个字母、数字或其他字符。若干个字节组成一个字、一组字或者数字(例如姓名、年龄等),称为字段。相关字段的有序集合称为记录,如一个学生记录,可以由姓名、年级、专业等字段组成、相同类型的记录汇集成文件。

一个记录描述一个实体。实体是我们储存和维持的信息,可以是人、地点、事物或事件。每一个描述实体的特性或者数量称为属性。例如,学号、课程、日期、年级都是课程的属性。这些属性的具体值可以在描述实体课程的记录的字段中找到。

1.1.2传统文件环境带来的问题

很多组织中,各个职能部门都建立各自独立的信息系统,会计、金融、生产、人力资源、销售和市场营销等部门都有各自的系统和相应的数据文件。

当然,每一个部门都需要自己的文件和计算机软件运作。例如,人力资源部门需要建立员工个人资料文件、工资单文件、医疗保险文件、养老金文件和邮件列表文件等,产生几十甚至几百个文件和程序。在整个公司中,各个部门都各自管理着部门的主文件(分别由不同的系统建立和操作)。天长地久,我们可以想象公司内将有成百上千各不相同的应用程序,非常难以维护和管理。这就带来了一系列的问题,如数据冗余、数据-程序依赖、缺乏灵活性、低安全性以及低共用性等。

1 数据冗余和不一致性

数据冗余是指在多个文件中重复存储相同的数据。由于各个部门各自建立独立的信息系统,需要收集存储很多相同的信息,导致了数据冗余。数据冗余不但浪费存储空间,还导致了数据不一致性。数据不一致性指相同的实体属性出现不同的值。相同的属性、学号,可能在不同的系统有不同的名称。例如有些系统使用学号,有些使用身份证号。

另一种可能是同样的属性在不同的系统中存在不同的表达方式,如服装零售商的销售、库存、生产系统中使用不同的号码代表服装尺寸。一个系统可能使用“超大”,而另一个系统可能使用“XL”表示同一个大小。这就导致公司很难通过整合个部门资源建立客户关系管理,销售链管理和企业系统。

2 数据—程序依赖

数据-程序依赖是指将文件中存储的数据与更新和维护这些文件所需的特定程序耦合起来,以便程序中的更改需要对数据进行更改。各种不同的传统计算机程序需要定义数据的位置和属性。在传统的文件环境里,软件程序的改变要求对于需要访问的数据也做相应的改变。一个程序可能定义邮编编码为5-9位数,另一程序严格定义5位的邮编编码不再使用。这可能需要花费数百万美元进行调整。

3 缺乏灵活性

传统的文件系统可以生成日常报表,但它无法及时提供临时报告或者无法及时响应突发的信息查询需求。临时请求所需的信息存在于系统中的某个地方,但检索信息却非常昂贵,也许需要好几个程序员工作好几个星期才能将所需的信息集成到一个新文件中。

4 低安全性

因为对数据缺乏控制和管理,对于数据的访问和传播可能失去控制。我们可能无法得知谁在读取甚至修改重要的数据。

5 低共享性

所需要的信息通常分布在不同的文件、不同的部门内,相互之间缺乏联系,因此实际上实时的数据共享是不可能实现的。信息不可能在组织内部不同的功能区域或者不同的部分自由流通。如果用户在不同的系统找到同一信息的不同数据,他们也许不再希望使用这些系统,因为数据的准确性不能保证。

1.2 数据管理的数据库方法

数据库技术可以解决传统文件系统所带来的诸多问题。可以将数据库严格定义为:数据库是经过组织的数据集,通过对数据的集中管理控制数据冗余,可以有效支持多个应用程序。数据不再分散储存在分散的文件里,在用户看来是储存在同一位置。一个数据库为多个程序服务。例如企业可以把原来分散在多个系统和多个文件中的个人资料、工资单数据和员工福利资料等,建立起一个统一的人力资源数据库。

1.2.1 数据库管理系统

数据库管理系统是数据集中、有效管理并通过软件程序访问数据的软件。数据库管理系统是应用程序与数据文件之间的接口。当应用程序需要调整数据时,例如总支出,数据库管理系统查找数据并传送给应用程序。通过传统的数据文件,程序员需要定义数据的大小和格式并且告诉计算机数据所处的位置。

数据库管理系统通过区分数据的物理视图和逻辑视图,使得用户不需要了解数据以怎样方式存储在哪里。逻辑视图以最终用户所使用的直观方式来显示数据,物理视图则显示了数据的实际组织形式以及它在物理存储介质上的结构。

数据库管理软件使得物理数据库可以应用于不同应用程序所需的不同逻辑视图。例如,在人力资源数据库中,一个处理员工福利的专家可能需要员工姓名、社会保障号码和健康保险。一个员工薪金支付部门的职员可能需要员工姓名、社会保障号码、总支付金额和净支付金额。所有这些数据都存储在一个数据库中,以便公司管理。

1 数据库管理系统如何解决传统文件环境带来的问题

数据库管理系统可以通过对数据的集中管理,避免数据的孤立存储,进而降低数据冗余和数据不一致性。虽然数据库管理系统可能不能够完全消除数据冗余,但可以对数据冗余进行有效控制。而且,即使存在数据冗余,数据库管理系统也可以帮助避免数据的不一致性,因为数据库管理系统可以保证冗余数据取相同的值。数据库管理系统独立于应用程序和数据而存在,使数据独立存在。因而数据的访问性和可用性大大增加,应用数据的开发和维护费用也大大降低,因此用户可以在数据库进行特定的查询。数据库管理系统使组织可以集中管理、使用数据并保证安全性。

2 关系型数据库管理系统

现代数据库管理系统使用不同的数据库模型追踪实体、属性和关系。在个人电脑、大型计算机和主机上应用最广泛的数据库管理系统是关系型数据库管理系统。在关系型数据模型中,用二维表格表示数据库中的数据。这些表格称为“关系”。每个表格包括实体中的数据和属性。微软Access是一种应用个人计算机的关系型数据库管理系统,DB2、Oracle Database和微软SQL Server是应用在大型主机和中间型计算机的关系型数据库管理系统。MySQL是一个流行的开源数据库管理系统,Oracle Database Lite应用于小型手提计算设备。

每一个表格都有行和列。每一个独立的实体的数据元素都表示相应实体的一个属性。关系型数据库的字段也称为列。对于供应商实体,编号、名称、地址、城市、州和邮编作为字段存储在供应商表格中,每一个字段表示供应商实体的一个属性。

供应商编号中的字段标识了每一个记录,称为关键字段,以便这些记录可以检索、更新或排列。每一个关系型数据库的表格都有一个字段被定义为主键。这个关键字段标识了每一个存储在表格中的供应商信息称为行。行一般表示不同的记录,或者成为元组。零件实体有单独的表格。

表格行中的所有信息,并且主键不能复制。供应商编号是供应商表格的主键,零件编号是零件表格的主键。注意供应商编号同时出现在供应商表格和零件表格中。在供应商表格,供应商编号作为主键。当供应商编号字段出现在零件表格中时,它被称为外键,并作为搜索特定零件供应商的检索字段。

3 关系型数据库的操作

关联型数据表格可以通过简单地组合为用户提供所需的数据。假设我们想在数据库中搜索哪个供应商可以为我们提供零件137和零件150。我们需要两个表格的信息:供应商表格和零件表格。注意这两个文件共用一组数据元:供应商编号。

一个关联型数据库通过三个基本操作生成用户数据:选择、连接和投影。选择操作通过选择符合要求的记录组成一个子集,换句话说,选择操作生成一个符合特定标准的行。在这个例子里,我们希望从零件表格中选择零件编号等于137或150的记录(行)。连接操作将有关联的表格组合,为用户在一个表格里提供更多的有用信息。这里,我们希望在被压缩的表格中(只包括零件137和零件150)加入供应商表格中的信息生成一个新的表格。

投影操作创建一个包括列的新的子集,为用户提供一个只包括所需信息的表格。这里我们希望生成一个只包括零件编号、零件名称、供应商编号和供应商名称。

4 面向对象的数据库

现在,越来越多的应用程序不仅需要数据库能够处理数字和字符,还需要能够处理绘图、图像、照片、声音和视频。设计用于将结构化数据组织成行和列的DBMS不太适合处理基于图形或多媒体应用程序。 面向对象的数据库更适合于这个目的。

面向对象的DBMS将作为这些数据的数据和过程存储为可自动检索和共享的对象。 面向对象的数据库管理系统(OODBMS)越来越流行,因为它们可以用来管理Web应用程序中使用的各种多媒体组件或Java小程序,这些应用程序通常集成各种来源的信息。

尽管面向对象的数据库可以存储比关系DBMS更复杂的信息类型,但与处理大量事务的关系DBMS相比,它们相对较慢。 混合对象关系DBMS系统现在可用于提供面向对象和关系DBMS的功能。

1.2.2 数据库管理系统的功能

DBMS包括用于组织,管理和访问数据库中数据的功能和工具。 其中最重要的是它的数据定义语言,数据字典和数据操作语言。

DBMS具有数据定义功能来指定数据库内容的结构。 它将用于创建数据库表并定义每个表中字段的特征。 有关数据库的这些信息将记录在数据字典中。 数据字典是一个自动或手动文件,用于存储数据元素及其特征的定义。

Microsoft Access具有基本的数据字典功能,可显示有关表中每个字段的名称、描述、大小、类型、格式和其他属性的数据字典。 大型企业数据库的数据字典可以捕获附加信息,例如用途、所有权(组织中负责维护数据的人)、授权、安全性、业务功能、程序和调用数据元的报告。

询问和报告

DBMS包含用于访问和操作数据库中的信息的工具。 大多数DBMS都有一种称为数据操纵语言的专用语言,用于添加,更改,删除和检索数据库中的数据。 该语言包含允许最终用户和编程专家从数据库提取数据以满足信息请求和开发应用程序的命令。 当今最突出的数据操作语言是结构化查询语言或SQL。

大型或中型计算机(如DB2,Oracle或SQL Server)的DBMS用户将使用SQL从数据库检索他们需要的信息。 Microsoft Access也使用SQL,但它提供了一套用户友好的工具,用于查询数据库和将数据库中的数据组织成更精美的报表。

在Microsoft Access中,用户能够通过识别所需的表和字段以及结果来创建查询,然后Access会选择符合特定条件的行。

Microsoft Access和其他数据库管理系统包括报告生成功能,以便可以通过检索以更为结构化和优化的格式呈现在用户面前。 Crystal Reports是比较流行的用于大型企业DBMS的报告生成器,尽管它也可以与Access一起使用。 Access还具有开发桌面系统应用程序,包括用于创建数据输入屏幕、报告和开发处理事务逻辑的工具。

1.2.3 设计数据库

要创建数据库,必须了解数据之间的关系,将在数据库中维护的数据类型,如何使用数据以及组织如何更改以从公司范围的角度管理数据。 数据库需要概念设计和物理设计。 数据库的概念或逻辑设计从业务角度来看是数据库的抽象模型,而物理设计则显示数据库实际上是如何安排在直接访问存储设备上的。

规范化和实体联系图

概念数据库设计描述了数据库中的数据元素如何分组。设计过程识别数据元素之间的关系,以及将数据元素分组在一起以满足业务信息需求的最有效方式。该过程还可识别冗余数据元素和特定应用程序所需的数据元素分组。对数据组进行组织,细化和精简,直到数据库中所有数据之间关系的整体逻辑视图出现。

为有效地建立关系数据库模型,必须简化复杂的数据分组,以最大限度地减少冗余数据元素,并且阻碍多对多关系。从复杂的数据组创建小型,稳定,灵活和自适应的数据结构的过程称为规范化。

关系数据库系统尝试执行参照完整性规则以确保耦合表之间的关系保持一致。当一个表具有指向另一个表的外键时,除非在链接表中存在相应的记录,否则不得使用外键将记录添加到表中。在本章前面我们检查过的数据库中,外键供应商编号将PART表链接到SUPPLIER表。除非供应商编号为8266的供应商表中有对应的记录,否则我们不得在零件表中为供应商编号8266添加新记录。如果我们删除记录,还必须删除PART表中的相应记录供应商编号为8266的供应商表格。换句话说,我们不应该有不存在的供应商零件!

数据库设计人员使用实体关系图来记录他们的数据模型。这些框代表实体。连接框的线表示关系。连接以两个短标记结尾的两个实体的线表示一对一关系。直线末端以鸟足符号标注表示一对

全文共9205字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[11020],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。