1.1 数据管理概述

1.1.1 数据和数据处理

1.数据

数据(Data)是描述事物的符号记录,用类型和数值来表示。随着计算机技术的发展,数据的含义更加广泛,不仅包括数字,还包含文字、图像、声音和视频等。在数据库技术中,数据是数据库中存储的基本对象。例如,学生的档案管理记录、货物的运输情况等都是数据。

信息不同于数据,数据是信息的载体;信息是数据的含义,是一种已经被加工为特定形式的数据。这种数据形式对接收者来说是有意义的,即只有有价值的数据才是信息。根据这个定义,那些能表达某种含义的信号、密码、情报、消息都可概括为信息。例如,一个“会议通知”,可以用文字(字符)写成,也可用广播方式(声音)传送,还可用闭路电视(图像)来通知,不管用哪种形式,其含义都是通知,它们所表达的信息都是“会议通知”,所以“会议通知”就是信息。

数据和信息二者密不可分,信息是客观事物性质或特征在人脑中的反映,信息只有通过数据形式表示出来才能被人理解和接受,对信息的记载和描述产生了数据;反之,对众多相关数据加以分析和处理又将产生新的信息。

人们从客观世界中提取所需数据,根据客观需要对数据处理得出相应信息,该信息将对现实世界的行为和决策产生影响,它对于决策者能增加知识,具有现实的或潜在的价值。信息是经过加工处理以后的数据,两者的转换过程如图1-1所示。

图1-1 数据与信息的转换过程

2.数据处理

数据处理是指将数据转换成信息的过程。它是由人、计算机等组成的能进行信息的收集、传递、存储、加工、维护、分析、计划、控制、决策和使用的系统。经过处理,信息被加工成特定形式的数据。

在数据处理过程中,数据计算相对简单,但是处理的数据量大,并且数据之间存在着复杂的联系,因此数据处理的关键是数据管理。

数据管理是指对数据收集、整理、组织、存储和检索等操作。这部分操作是数据处理业务的基本环节,是任何数据处理业务中必不可少的共有部分。因此,必须学习和掌握数据管理技术,对数据处理提供有力的支持。有效的数据管理可以提高数据的使用效率,减轻程序开发人员的负担。数据库技术就是针对数据管理的计算机软件技术。

1.1.2 数据管理技术的发展

数据管理是数据库的核心任务,内容包括对数据的分析、组织、编码、存储、检索和维护。随着计算机硬件和软件的发展,数据库技术也不断地发展。计算机在数据管理方面经历了由低级到高级的发展过程,经历了人工管理阶段、文件管理阶段和数据库管理阶段。

1.人工管理阶段

人工管理阶段约在20世纪50年代中期以前,计算机技术相对落后,硬件主要是磁带、卡片、纸带,没有磁盘,软件没有操作系统,主要用于科学计算。因此,没有专门管理数据的软件,数据由计算或处理它的程序自行携带。数据管理的任务包括存储结构、存取方法、输入/输出方式等,完全由程序设计人员负责。

这一时期计算机数据管理的特点如下:

①数据不保存。

②没有对数据进行管理的软件系统。

③没有文件的概念。

④一组数据对应于一个程序,数据是面向应用的。一个程序中的数据不能被其他程序所利用,因而,程序之间存在着大量的重复数据,造成了数据的冗余。

以上特点可用图形来表示,如图1-2所示。

图1-2 人工管理阶段数据管理

2.文件管理阶段

文件管理阶段约为20世纪50年代后期至60年代中后期,此时计算机已经开始大量用于管理数据的阶段。此时的计算机硬件具有磁盘、磁鼓等直接存储设备。在操作系统上有了专门用于管理数据的软件,称为文件系统。

这一时期计算机数据管理的特点如下:

①数据需要长期保存在外存上供反复使用。

②程序和数据之间有了一定的独立性。

③文件形式多样化。

④文件的存取基本上以记录为单位。

以上特点可用图形来表示,如图1-3所示。

图1-3 文件系统阶段的数据管理

3.数据库管理阶段

20世纪60年代后期,数据管理规模更为庞大,应用更广泛,数据量剧增,共享要求更高。在硬件方面有了大容量的快速存取的磁盘,软件方面出现了数据库管理系统。它的功能是对所有的数据进行统一、集中和独立式的管理,使数据存储独立于使用数据的程序,减少了数据的冗余度、节约存储空间,提高了数据的一致性和完整性,充分实现了数据的共享。多个用户能够同时访问数据库中的数据,减小了应用程序的开发和维护代价。这一阶段程序和数据的关系如图1-4所示。

图1-4 数据库管理阶段的数据管理