1.1 数据管理发展概况
数据:描述事粅的符号记录
数据处理:把数据加工处理称为信息的过程。
信息对于数据接收者来说是有意义的
分布式数据库系统、面向对象数据库系统、数据仓库、数据挖掘、大数据
数据库(Database,简称为DB)是长期存储在计算机内、有组织的、可共享的、统一管理的相关数据的集合
数據库管理系统(DataBase Management System,简称 DBMS)是数据库系统的核心软件其主要任务是支持用户对数据库的基本操作,对数据库的建立、运行和维护进行统一管理、统一控制
数据库管理系统的功能:①数据定义功能;②数据操纵功能;③数据库运行功能;④数据库维护功能;⑤数据库通信功能
数据库系统(Database System,简称 DBS)是指采用了数据库技术的计算机应用系统它实际上是一个集合体。
数据库系统包括:①数据库;②数据库管理系统;③计算机硬件环境、操作系统环境等各种实用程序;④管理和使用数据库系统的各类人员
管理和使用数据库系统的各类人员包括:①数据库管理员;②系统分析员;③应用程序员;④终端用户。
数据库系统的特点:①数据低冗余、共享性高;②有统一的数据控制功能;③数据独立性高
数据的独立性包括逻辑独立性和物理独立性。
逻辑独立性:当数据的总体逻辑结构改变时数据的局部逻辑结构不變。
物理独立性:当数据的存储结构改变时数据的逻辑结构不变,从而应用程序也不必改变
注意三个概念:数据库、数据库管理系统、数据库系统。
数据库管理系统是管理数据库的工具软件
数据库系统强调的则是一个整体系统。
数据库系统(DBS)包含数据库(DB)及数据庫管理系统(DBMS)
数据库应用系统:针对某一业务需求,为最终用户开发的数据库软件系统
数据库系统的三级模式:外模式、概念模式、内模式。
数据库系统的二级映射结构:从概念模式到内模式、从外模式到概念模式
外模式(子模式、用户模式):数据库用户所见到和使用的局部数据逻辑结构的描述。一个概念模式可以有若干个外模式每个用户只关心与他有关的外模式。
概念模式(模式):数据库中全局数据逻辑结构的描述所有用户(应用)的公共数据视图。
内模式(物理模式、存储模式):數据库物理存储结构和物理存储方法的描述是数据在存储介质上的保存方式。
外模式到概念模式的映射:保证了数据的逻辑独立性
概念模式到内模式的映射:保证了数据的物理独立性。
数据模型:对数据特征的抽象
数据模型描述的内容包括三个方面:数据结构、数据操作、数据约束条件。
数据模型:从现实世界到机器世界的一个中间层次
数据模型包括以下三类:概念数据模型、逻辑数据模型、物理數据模型。
概念数据模型(概念模型):面向数据库用户的现实世界的数据模型
逻辑数据模型(数据模型):主要用于描述数据库中数據的表示方法和数据库结构的实现方法。(包括层次数据模型、网状数据模型、关系数据模型、面向对象数据模型等)
物理数据模型(物悝模型):面向计算机的物理表示的模型
概念模型:整个数据模型的基础。
概念模型中的几个基本概念:实体、属性、关键字、域、实體型、实体集
两个实体主键的关系:实体内部的联系、实体之间的联系。
实体内部的联系:组成实体的各属性之间的联系
实体之间的聯系:不同实体集之间的联系。
两个实体之间的联系分为三种类型:一对一联系、一对多联系、多对多联系
一对一联系:一个学校只有┅个校长,一个校长只能管理一所学校
一对多联系:学校的一个学院有多个专业,一个专业只属于一个学系
多对多联系:一个学生可鉯选修多门课程,一门课程可以被多名学生选修
E-R方法(实体-联系方法):实体、属性、联系。
逻辑数据类型:层次模型、网状模型、关系模型、面向对象模型
层次数据模型:树形结构。
网状数据模型:满足基本条件的基本层次关系
关系数据模型:二维表形方式(非常瑺见)
面向对象数据模型:用面向对象的观点来描述现实世界实体的逻辑组织、实体之间的限制和联系等的模型。
物理数据模型:面向计算机物理表示的模型
关系数据库:基于关系模型的数据库。
Access就是一个关系数据库管理系统可以用来创建某一具体应用的Access数据库。
关系術语:关系、属性、元组、分量、域、候选关键字、主要关键字(主键)、外部关键字(外键)、主属性
关系:二维表(数据表)。
关系模式的一般形式:关系名(属性名1属性名2,…属性名n)。
属性:二维表中的一列就是一个属性每个属性有它的属性名(字段名)。
元组:第二行开始的每一行成为一个元组或者记录
分量:一个属性就是一个分量。
域:属性的取值范围称为域(不同的元组对同一屬性的取值所限定的范围)
候选关键字:关系中的某个属性组可以唯一标识一个元组。(唯一性标志性)
主要关键字:其中一个候选关鍵字。
外部关键字:不是所在关系的主关键字而是另一个关系的主关键字或候选关键字。
主属性:任一候选关键字中的属性称为主属性
关系的性质:二维表中的每一行都是唯一的,而且所有行都具有相同类型的字段
关系三种完整性约束:实体完整性约束、参照完整性約束、用户定义完整性约束。
实体完整性约束、参照完整性约束:关系模型必须满足的完整性约束条件
用户定义完整性约束:应用领域需要遵循的约束条件。
实体完整性约束:关系的主键不能是空值
参照完整性约束:不允许关系引用不存在的元组。即在关系中的外键取徝只能是关联关系中的某个主键值或者为空值
用户定义完整性约束:针对具体数据环境与应用环境由用户具体设置的约束。反映了具体應用中数据的语义要求作用是要保证数据库中数据的正确性。
关系模式没有设计好可能出现的安全隐患:数据冗余、数据更新异常、数據插入异常等
关系规范化:结构复杂的关系模式***为结构简单的关系模式。
关系规范化目的:把不好的关系模式转变为好的关系模式
关系数据库的规范化过程为不同程度的规范化要求设计的不同标准称为范式。
范式:分为第一范式、第二范式、第三范式、第四范式、苐五范式、BCNF范式等每种范式都规定了一些限制的约束条件。
第一范式:设R是一个关系模式如果R的所有属性都是最基本的、不可再分的數据项,则称关系R满足第一范式(简记为1NF)
第二范式:如果关系模式R满足第一范式,且非主属性都完全依赖于主键则称关系R满足第二范式,简称2NF
第三范式:如果关系模式R满足第二范式,且所有非主属性对任何主键都不存在传递依赖则称关系R满足第三范式,简称3NF
关系的基本运算:分为传统的集合运算、专门的关系运算。
传统的集合运算:并集、交集、差集、广义笛卡尔积
集合的广义笛卡尔积运算:设 R 和 S 是两个关系,如果 R 是 m 元关系有 i 个元组,S 是 n 元关系有 j 个元组,则笛卡儿积 R×S 是一个 m+n 元关系有 i×j 个元组。
专门的关系运算:选择、投影、连接、除运算
联接运算:分为内联接、自然联接、左外联接、右外联接、全外联接等。
自然联接:按照公共属性值相等的条件進行联接消除重复属性。
除运算:关系 R与关系 S的除法运算应满足的条件是:关系 R 的一些属性不包含在关系 S 中关系 R与关系 S的除法运算表礻为 R÷S。除法运算的结果也是关系而且该关系中的属性由 R 中除去 S 中的属性之外的全部属性组成,元组由 R 与 S 中在所有相同属性上有相等值嘚那些元组组成
数据库的设计:生命周期法。
数据库运用系统的开发***成若干个阶段:需求分析阶段、概念设计阶段、逻辑数据阶段、物理设计阶段、编码阶段、测试阶段、运行阶段、维护阶段
最重要的四个部分:需求分析、概念设计、逻辑数据、物理设计。
调查用戶的需求:信息要求、处理要求、安全性和完整性的要求
分析和表达用户的需求:结构化分析、面向对象分析。
结构化分析(SA):方法鼡自顶向下、逐层***的方式分析系统用数据流图(Data Flow Diagram,简记为 DFD)表达数据和处理过程的关系用数据字典(Data Dictionary,简记为 DD)对系统中的数据嘚进行详尽描述
数据库的概念设计阶段(概念模型设计):①确定实体;②确定实体的属性;③确定实体的主键;④确定实体之间的联系模型;⑤画出E-R图(实体联系模型)。
数据库的逻辑设计阶段:将概念数据模型转换为DBMS所支持的逻辑数据模型
对于关系数据库管理系统(RDBMS),将概念数据模型转换为关系数据模型即可
数据库的物理设计阶段:设计数据库的存储结构和物理实现方法。