数据库概论基础

数据库概论基础数据库概论 1 1 基本内容分析 1 1 1 本章的重要概念 1 DB DBMS 和 DBS 的定义 2 数据管理技术的发展阶段人工管理阶段 文件系统阶段 数据库系统阶段和高级数据库技术阶段等各阶段的特点

数据库概论

1.1 基本内容分析

1.1.1 本章的重要概念

(1)DB、DBMS和DBS的定义
(2)数据管理技术的发展阶段 人工管理阶段、文件系统阶段、数据库系统阶段和高级数据库技术阶段等各阶段的特点。
(3)数据描述 概念设计、逻辑设计和物理设计等各阶段中数据描述的术语,概念设计中实体间二联系的描述。
(4)数据模型定义是两类数据模型,逻辑模型的形式定义,ER模型,层次模型、网状模型、关系模型和面向对象模型的数据结构以及联系的实现方式。
(5)DB的体系结构 三级结构,两级映像,两级数据独立性,体系结构各个层次中记录的联系。
(6)DBMS的工作模式、主要功能和模块组成。
(7)DBS的组成,DBA,DBS的全局结构,DBS结构的分类。

1.1 名词解释

  • 逻辑数据:指程序员或用户用以操作的数据形式。
  • 物理数据:指存储设备上存储的数据。
  • 联系的数:与一个联系有关的实体集个数,称为联系的数。
  • 1:1联系:如果实体集E1中每个实体至多和实体集E2中的一个实体有联系,反之亦然,那么E1和E2的联系称为“1:1联系”。
  • 1:N联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,而E2中每个实体至多和E1中一个实体有联系,那么E1和E2的联系是“1:N联系”。
  • M:N联系:如果实体集E1中每个实体可以与实体集E2中任意个(零个或多个)实体有联系,反之亦然,那么E1和E2的联系称为“M:N联系”。
  • 数据模型:能表示实体类型及实体间联系的模型称为“数据模型”。
  • 概念数据模型:独立于计算机系统、完全不涉及信息在计算机中的表示、反映企业组织所关心的信息结构的数据模型。
  • 结构数据模型(或逻辑数据模型):与DBMS有关的,直接面向DB的逻辑结构、从计算机观点对数据建模的数据模型。
  • 层次模型:用树型(层次)结构表示实体类型及实体间联系的数据模型称为层次模型。 ·网状模型:用有向图结构表示实体类型及实体间联系的数据模型称为网状模型。 ·关系模型:用二维表格表达实体集的数据模型。
  • 外模式:是用户用到的那部分数据的描述。
  • 概念模式:数据库中全部数据的整体逻辑结构的描述。
  • 内模式:DB在物理存储方面的描述。
  • 外模式/模式映象:用于定义外模式和概念模式之间数据结构的对应性。
  • 模式/内模式映象:用于定义概念模式和内模式之间数据结构的对应性。
  • 数据独立性:应用程序和DB的数据结构之间相互独立,不受影响。
  • 物理数据独立性:在DB的物理结构改变时,尽量不影响应用程序。
  • 逻辑数据独立性:在DB的逻辑结构改变时,尽量不影响应用程序。
  • 主语言:编写应用程序的语言(如C一类高级程序设计语言),称为主语言。
  • DDL:定义DB三级结构的语言,称为DDL。
  • DML:对DB进行查询和更新操作的语言,称为DML。
  • 过程性语言:用户编程时,不仅需要指出“做什么”,还需要指出“怎么做”的语言。
  • 非过程性语言:用户编程时,只需指出“做什么”,不需要指出“怎么做”的语言。
  • DD(数据字典):存放三级结构定义的DB,称为DD。
  • DD系统:管理DD的软件系统,称为DD系统。

1.2 试解释DB、DBMS和DBS三个概念。
答:DB是长期存储在计算机内、有组织的、统一管理的相关数据的集合。 DBMS是位于用户与OS之间的一层数据管理软件,它为用户或应用程序提供访问DB的方法。
DBS是实现有组织地、动态地存储大量关联数据、方便多用户访问的计算机硬件、软件和数据资源组成的系统,即采用数据库技术的计算机系统。
1.3 人工管理阶段和文件系统阶段的数据管理各有哪些特点?
答:人工管理阶段主要有四个特点:数据不保存在计算机内;没有专用的软件对数据进行管理;只有程序的概念,没有文件的概念;数据面向程序。 文件系统阶段主要有五个特点: 数据以“文件”形式长期保存;数据的逻辑结构与物理结构有了区别;文件组织已多样化;数据面向应用;对数据的操作以记录为单位。
1.4 文件系统阶段的数据管理有些什么缺陷?试举例说明。
答:主要有三个缺陷:数据冗余;数据不一致性;数据联系弱。
例如学校里教务处、财务处、保健处建立的文件中都有学生详细资料,譬如联系电话,家庭住址等。这就是“数据”冗余;如果某个学生搬家,就要修改三个部门文件中的数据,否则会引起同一数据在三个部门中不一致;产生上述问题的原因是这三个部门的文件中数据没有联系。
1.5 数据管理的数据库阶段产生的标志是哪三件事情?
答:进入数据库阶段的标志是20世纪60年代末发生的三件事件:

  • 1968年IBM公司研制的IMS系统是一个典型的层次DBS;
  • 1969年美国CODASYL组织DBTG报告,提出网状DBS的概念;
  • 1970年美国IBM公司的E.F.Codd发表论文,提出关系模型的思想。

1.6 数据库阶段的数据管理有哪些特点?
答:主要有五个特点: 采用数据模型表示复杂的数据结构;有较高的数据独立性;为用户提供了方便的用户接口;提供了四个方面的数据控制功能;对数据的操作以数据项为单位,增加了系统的灵活性。
1.7 与“文件”结构相比,“数据库”结构有些什么不同?
答:与文件结构相比,数据库结构主要有下面三点不同:

  • 数据的结构化。文件由记录组成,但各文件之间缺乏联系。数据库中数据在磁盘中仍以文件形式组织,但这些文件之间有着广泛的联系。数据库的逻辑结构用数据模型来描述,整体结构化。数据模型不仅描述数据本身的特点,还要描述数据之间的联系。
  • 数据独立性。文件只有设备独立性,而数据库还具有逻辑独立性和物理独立性。
  • 访问数据的单位。访问文件中的数据,以记录为单位。访问数据库中的数据,以数据项(字段)为单位,增加了系统的灵活性。

1.8 什么是数据独立性?在数据库中有哪两级独立性?
答:数据独立性是指应用程序与DB的数据结构之间相互独立。在物理结构改变时,尽量不影响应用程序,称为物理数据独立性;在逻辑结构改变时,尽量不影响应用程序,称为逻辑数据独立性。
1.9 分布式数据库系统和面向对象数据库系统各有哪些特点?
答:DDBS主要有三个特点:

  • 数据物理上分布在各地,但逻辑上是一个整体;
  • 每个场地既可以执行局部应用,也可以执行全局应用;
  • 各地的计算机由数据通信网络相连接。

面向对象数据系统主要有两个特点:

  • 面向对象数据模型能完整地描述现实世界的数据结构,能表达数据间嵌套、递归的联系。
  • 具有面向对象技术的封装性和继承性的特点,提高了软件的可重用性。

1.10 逻辑记录与物理记录,逻辑文件与物理文件有些什么联系和区别?
答:逻辑数据是用户用以操作的数据形式,是抽象的概念化数据。物理数据是实际存放在存储设备上的数据。 逻辑数据与物理数据在结构上可以差别很大,需通过两级映象来进行数据传输和格式转换。 从以上的解释可以看出,逻辑记录和逻辑文件是用户在程序中使用的记录和文件,而物理记录和物理文件是指磁盘上的记录和文件。逻辑记录、文件与物理记录、文件在结构、组成上有很大的差异,而数据管理软件就是通过三级结构两级映象来实现逻辑数据与物理数据之间的转换。
1.11 试述ER模型、层次模型、网状模型、关系模型和面向对象模型的主要特点。
答:ER模型直接表示实体类型及实体间联系,与计算机系统无关,充分反映用户的需求,用户容易理解。 层次模型的数据结构为树结构,记录之间联系通过指针实现,查询较快,但DML属于过程化的,操作复杂。 网状模型的数据结构为有向图,记录之间联系通过指针实现,查询较快,并且容易实现M:N联系,但DML属于过程化的语言,编程较复杂。 关系模型的数据结构为二维表格,容易为初学者理解。记录之间联系通过关键码实现。DML属于非过程化语言,编程较简单。 面向对象模型能完整描述现实世界的数据结构,具有丰富的表达能力,能表达嵌套、递归的数据结构。但涉及的知识面较广,用户较难理解,这种模型尚未普及。
1.12 数据之间联系在各种结构数据模型中是怎么实现的?
答:在层次、网状模型中,数据之间的联系通过指针实现的; 在关系模型中,数据之间联系通过外键和主键间联系实现的; 在面向对象模型中,数据之间嵌套、递归联系通过对象标识符(OID)实现的(见第8章)。
1.13 DB的三级模式结构描述了什么问题?试详细解释。
答:DB的三级模式结构是对数据的三个抽象级别,分别从外部(用户)级、概念级和内部级去观察数据库。 外部级是用户使用的局部数据库的逻辑结构,其描述称为外模式。 概念级是DB的整体逻辑结构,其描述称为概念模式。 内部级是DB的物理结构,其描述称为内模式。
1.14 试述概念模式在数据库结构中的重要地位。
答:数据按外模式的描述提供给用户,按内模式的描述存储在磁盘中,而概念模式提供了连接这两级的相对稳定的中间观点,并使得两级的任何一级的改变都不受另一级的牵制。
1.15 试叙述用户、DB的三级模式结构、磁盘上的物理文件之间有些什么联系和不同?
答:用户、外模式、概念模式、内模式和物理文件中的记录分别称为用户记录、外部记录、概念记录、内部记录和物理记录。 用户记录与外部记录的结构是一致的,它们之间只是数据传输问题。 而外部记录、概念记录和内部记录之间的结构可能是不一致的,除了数据传输问题,还 有格式转换问题。 内部记录与物理记录的结构是一致的,它们之间只是数据传输问题。
1.16 数据独立性与数据联系这两个概念有什么区别?
答:数据独立性是指应用程序和DB的数据之间相互独立,不受影响,对系统的要求是“数据独立性要高”,而数据联系是指记录之间的联系,对系统的要求是“数据联系密切”。
1.17 试述DBMS的工作模式和主要功能。
答:DBMS的工作模式有六点:

  • 接受应用程序的数据请求和处理请求;
  • 将用户的数据请求转换成低层指令;
  • 实现对DB的操作;
  • 从对DB的操作中接受查询结果;
  • 对查询结构进行处理;
  • 将处理结果返回给用户。

DBMS的主要功能有DB的定义操纵保护维护数据字典等五个功能。

1.18 试叙述DBMS对数据库的维护功能。
答:包括DB的数据载入、转换、转储、DB的改组以及性能监控等功能。这些功能分别由各个实用程序完成。
1.19 从模块结构观察,DBMS由哪些部分组成?
答:DBMS由两大部分组成:查询处理器和存储管理器。
1.20 DBS有哪几部分组成?其中DD有什么作用?
答:DBS由DB、硬件、软件和DBA等四个部分组成。
在DBS中,DD是存储三级结构描述(即数据)的DB。DBMS的所有工作都要以DD中的数据为依据,也就是所有工作都要通过DD访问DB。
1.21“数据”与“数据”之间有些什么联系与区别?
答:数据(metadata)是指“数据的数据”,即数据的描述。DB中的数据是指三级模式结构的详细描述。 数据(data),一般是指用户使用的具体值。
1.22 什么是DBA?DBA应具有什么素质?DBA的职责是什么?
答:DBA是控制数据整体结构的一组人员,负责DBS的正常运行,承担创建、监控和维护DB结构的责任。 DBA必须具备下列4条素质:熟悉企业全部数据的性质和用途;对所有用户的需求有充分的了解;对系统的性能非常熟悉;兼有系统分析员和运筹学专家的品质和知识。 DBA的主要职责有6点:定义模式;定义内模式;与用户的联络;定义安全性规则;定义完整性规则;DB的转储与恢复。
1.23 试对DBS的全局结构作详细解释。
答:从四个方面解释: ·数据库用户有四类:DBA,专业用户,应用程序员,终端用户。 ·DBMS的查询处理器有四个模块:DML编译器,嵌入型DML预编译器,DDL编译器,查询运行核心程序。 ·DBMS的存储管理器有四个模块:授权和完整性管理器,事务管理器,文件管理器,缓冲区管理器。 ·磁盘存储器中有五种数据结构:数据文件,数据字典,索引文件,统计数据组织和日志。
1.24 使用DBS的用户有哪几类?
答:(略)
1.25 DBMS的查询处理器和存储管理器各有哪些功能?
答:(略)
1.26 磁盘存储器中有哪五类主要的数据结构?
答:(略)
1.27 根据计算机的系统结构,DBS可分成哪四种?各有什么特点?
答:根据计算机的系统结构,DBS可分成集中式、C/S式、并行式和分布式等四种 集中式DBS的特点是单点数据(DB集中在一个场地)单地处理(单个CPU)。 C/S式DBS的特点是计算机的功能分放在客户机和服务器上(即功能的分布)。客户机上专门实现前端处理和用户界面。服务器上完成事务处理和数据访问控制。
并行式DBS的特点是使用多个CPU和多个磁盘进行并行操作。
分布式DBS的特点是多点数据(DB分布在多个场地)多点处理(多个CPU)。数据具有物理分布性和逻辑整体性特点。系统中事务有本地事务(访问本地DB)和全局事务(访问至少两个场地的DB)之分。
1.28 DBS能产生哪些效益?
答:DBS的应用,使计算机应用深入到社会的每个角落。其效益有以下7个方面:灵活性,简易性,面向用户,有效的数据控制,加快应用开发速度,维护方便,标准化。

第2章关系模型和关系运算理论

2.1 基本内容分析

2.1.1 本章重要概念
(1)基本概念 关系模型,关键码(主键和外键),关系的定义和性质,三类完整性规则,ER模型到关系模型的转换规则,过程性语言与非过程性语言。
(2)关系代数 五个基本操作,四个组合操作,七个扩充操作。
(3)关系演算 组关系演算和域关系演算的原子公式、公式的定义。关系演算的安全性和等价性。
(4)关系代数表达式的优化 关系代数表达式的等价及等价转换规则,启化式优化算法。 (5)关系逻辑 谓词、原子、规则和查询,规则的安全性,用规则模拟关系代数表达式。

2.1.2 本章的重点篇幅
(1)教材中P56的例2.7(关系代数表达式的应用实例)。
(2)教材中P63的例2.19(组表达式的应用实例)。
(3)教材中P81的例2.36(关系逻辑的规则表示)。

2.1.3 重要内容分析
1.关系代数表达式的运用技巧
(1)一般规则 ·对于只涉及到选择、投影、联接的查询可用下列表达式表示:
π„(σ„(R×S)) 或者π„(σ„(R⋈S))
·对于否定的操作,一般要用差操作表示,例如“检索不学C2课的学生姓名”。
·对于检索具有“全部”特征的操作,一般要用除法操作表示,例如“检索学习全部课程的学生姓名”。
(2)“检索不学C2课的学生姓名”,决不能用下式表示:
π SNAME,AGE(σC#≠’C2’(S⋈SC))
一定要用“差”的形式: π SNAME,AGE(S)-πSNAME,AGE(σC#=‘C2’(S⋈SC))
(3)“检索学习全部课程的学生学号”,要用πS#,C#(SC)÷πC#(C)表示, 而不能写成 πS# (SC÷πC#(C))形式。这是因为一个学生学的课程的成绩可能是不一样的。
(4)对于教材P56的例2.7的8个查询语句的关系代数表达式,考生一定要掌握,这是基础。

2.非过程性语言与过程性语言的区别 编程时必须指出“干什么”及“怎么干”的语言,称为过程性语言;编程时只须指出“干什么”,不必指出“怎么干”的语言,称为非过程性语言。

  • 关系模型:用二维表格表示实体集,外键和主键表示实体间联系的数据模型,称为关系模型。
  • 关系模式:是对关系的描述,包括模式名、诸属性名、值域名和模式的主键。
  • 关系实例:关系模式具体的值,称为关系实例。
  • 属性:即字段或数据项,与二维表中的列对应。属性个数,称为数(arity)。
  • 域:属性的取值范围,称为域。
  • 组:即记录,与二维表中的行对应。组个数,称为基数(cardinality)。
  • 超键:能惟一标识组的属性或属性集,称为关系的超键。
  • 候选键:不含有多余属性的超键,称为候选键。
  • 主键:正在使用的、用于标识组的候选键,称为主键。
  • 外键:属性集F是模式S的主键,在模式R中也出现,那么称F是模式R的外键。
  • 实体完整性规则:实体的主键值不允许是空值。
  • 参照完整性规则:依赖关系中的外键值或者为空值,或者是相应参照关系中某个主键码。
  • 过程性语言:编程时必须给出获得结果的操作步骤,即指出“干什么”及“怎么干”的语言。
  • 非过程性语言:编程时,只需指出需要什么信息,不必给出具体的操作步骤,即只要指出“干什么”,不必指出“怎么干”的语言。
  • 无限关系:指组个数为无穷多个的关系。
  • 无穷验证:验证公式真假时需要进行无限次验证。

2.2 在关系模型中,对关系作了哪些规范性限制?
答:对关系作了一下四个限制: 属性值不可分解;没有重复组;没有行序;使用时有列序。
2.3 为什么关系中的组没有先后顺序,且不允许有重复组?
答:由于关系定义为组的集合,而集合中的素是没有顺序的,因此关系中的组也就没有先后的顺序(对用户而言)。这样既能减少逻辑排序,又便于在关系数据库中引进集合论的理论。
每个关系模式都有一个主键,在关系中主键值是不允许重复的。如果关系中有重复组,那么其主键值肯定相等,起不了惟一标识作用,因此关系中不允许有重复组。
2.4 外键值何时允许空?何时不允许空?
答:在依赖表中,当外键是主键的组成部分时,外键值不允许空;否则外键值允许空。
2.5 笛卡儿积、等值联接、自然联接三者之间有什么区别?
答:笛卡尔积是一个基本操作,而等值联接和自然联接是组合操作。
设关系R的数为r,组个数为m;关系S的数为s,组个数为n。 那么,R×S的数为r+s,组个数为m×n;R⋈S的数也是r+s,但组个数小于等于m×n;R⋈S的数小于等于r+s,组个数也小于等于m×n;

第3章关系数据库语言SQL

3.1 基本内容分析

3.1.1 本章重要概念
(1)SQL数据库的体系结构,SQL的组成。
(2)SQL的数据定义:SQL模式、基本表和索引的创建和撤销。
(3)SQL的数据查询;SELECT语句的句法,SELECT语句的三种形式及各种限定,基本表的联接操作,SQL3中的递归查询。
(4)SQL的数据更新:插入、删除和修改语句。
(5)视图的创建和撤消,对视图更新操作的限制。
(6)嵌入式SQL:预处理方式,使用规定,使用技术,卷游标,动态SQL语句。

3.1.2 本章的重点篇幅
(1)教材中P97的例3.8(SELECT语句)。
(2)教材中P123的例3.31和P123的例3.32(嵌入式SQL)。

3.1.3 重要内容分析
SELECT语句是SQL的核心内容,对于该语句考生应掌握下列内容。

1.SELECT语句的来历在关系代数中最常用的式子是下列表达式:πA1,…,An(σF(R1×…×Rm)) 这里R1、…、Rm为关系,F是公式,A1、…、An为属性针对上述表达式,SQL为此设计了SELECT—FROM—WHERE句型:
SELECT A1,„,An
FROM R1,„,Rm
WHERE F
这个句型是从关系代数表达式演变来的,但WHERE子句中的条件表达式F要比关系代数中公式更灵活。
2.SELECT语句中出现的基本表名,应理解为基本表中的组变量,而列名应理解为组分量。
3.SELECT语句的语义有三种情况,下面以学生表S(S#,SNAME,AGE,SEX)为例说明。
第一种情况:SELECT语句中未使用分组子句,也未使用聚合操作,那么SELECT子句的语义是对查询的结果执行投影操作。譬如:
SELECT S#,SNAME
FROM S
WHERE SEX=‘M’;
第二种情况:SELECT语句中未使用分组子句,但在SELECT子句中使用了聚合操作,此时SELECT子句的语义是对查询结果执行聚合操作。譬如:
SELECT COUNT(),AVG(AGE)
FROM S
WHERE SEX=‘M’;
该语句是求男同学的人数和平均年龄。
第三种情况:SELECT语句使用了分组子句和聚合操作(有分组子句时必有聚合操作),此时SELECT子句的语义是对查询结果的每一分组去做聚合操作。譬如:
SELECT AGE,COUNT(

FROM S
WHERE SEX=‘M’
GROUP BY AGE;
该语句是求男同学每一年龄的人数。
4.SELECT语句中使用分组子句的先决条件是要有聚合操作。但执行聚合操作不一定要用分组子句。譬如求男同学的人数,此时聚合值只有一个,因此不必分组。但同一个聚合操作的值有多个时,必须使用分组子句。譬如求每一年龄的学生人数。此时聚合值有多个,与年龄有关,因此必须分组。

  • 基本表:实际存储在数据库中的表,称为基本表。
  • 视图:是从基本表或其他视图中导出的表,它本身不独立存储在数据库中,也就是数据库中只存放视图的定义而不存放视图的数据。
  • 实表:是对基本表的别称。
  • 虚表:是对视图的别称。
  • 相关子查询:SELECT语句嵌套时,子查询中查询条件依赖于外层查询中的值,因此子查询要反复求值供外层查询使用。这种子查询称为相关子查询。
  • 联接查询:查询时要从多个基本表中提取数据,此时把多个基本表写在同一层的FROM子句中,这种查询形式称为联接查询。
  • 嵌套查询:查询时要从多个基本表中提取数据,此时把多个基本表分别放在不同层次上的FROM子句中,这种查询形式称为嵌套查询。
  • 交互式SQL:在终端交互方式使用的SQL语言。
  • 嵌入式SQL:嵌入在高级语言的程序中使用的SQL语言。
  • 共享变量:嵌入的SQL语句和主语言语句间传递信息的变量,称为共享变量。共享变量先由主语言程序定义,再用SQL的说明语句说明,然后SQL语句就可使用这些变量。
  • 游标:游标是与某一查询相联系的符号名。游标有游标关系和游标指针两层含义。在游标打开时,游标(指针)指向查询结果的第一个记录之前。
  • 卷游标:在游标推进时,可以进退自如的游标。

第4章模式设计理论

4.1 基本知识点

4.1.1 本章重要概念

(1)关系模式的冗余和异常问题。
(2)FD的定义、逻辑蕴涵、闭包、推理规则、与关键码的联系;平凡的FD;属性集 的闭包;推理规则的正确性和完备性;FD集的等价;最小依赖集。
(3)无损分解的定义、性质、测试;保持依赖集的分解。
(4)关系模式的范式:1NF,2NF,3NF,BCNF。分解成2NF、3NF模式集的算法。
(5)MVD、4NF、JD和5NF的定义。

4.1.2 本章的重点篇幅
(1)教材中P148的例4.13。(无损联接和保持FD的例子)
(2)教材中P149的例4.14和P150的例4.15。(分解成2NF和3NF的例子)

  • 数据冗余:指同一个数据在系统中多次重复出现。
  • 函数依赖(FD):在关系模式R(U)中,FD是形为X→Y的一个命题,只要r是R的当前关系,对r中任意两个组t和s,都有t[X]=s[X]蕴涵t[Y]=s[Y],那么称FD X→Y在关系模式R(U)中成立。
  • 平凡的FD:如果X→Y,且Y⊆X,则称X→Y是一个“平凡的FD”。
  • FD集F的闭包F+:被F逻辑蕴涵的函数依赖全体构成的集合,称为F的闭包,记为F+,即F+={ X→Y | F⊨X→Y}。
    ·属性集X的闭包X+:从已知的FD集F使用FD推理规则推出的所有满足X→A的属性A的集合,称为X的闭包,记为X+,即X+={ 属性A | X→A在F+中 }。
  • FD的逻辑蕴涵:如果从已知的FD集F能推导出X→Y成立,那么称F逻辑蕴涵 X→Y,记为F ⊨X→Y。
    FD集的等价:对于两个FD集F和G,有F+=G+,则称F和G是等价的依赖集。
  • 最小依赖集:设F是属性集U上的FD集,Fmin是F的最小依赖集,那么Fmin应满足下列四个条件:Fmin+=F+;每个FD的右边都是单属性;Fmin中没有冗余的FD;每个FD的左边没有冗余的属性。
  • 无损分解:设关系模式R,F是R上的FD集,ρ={ R1,„,Rk }是R的一个分解。 如果对R中满足F的每一关系r,都有r= ⋈πRi(r),那么称分解ρ相对F是“无损分解”。 ·泛关系假设:指数据库中每一个关系都是全部属性构成的关系的投影,此时,由全部属性构成的关系称为泛关系。
  • chase过程:根据已知FD集,对R分解成ρ构造的初始表格的值进行修改,使之符合FD集,这个过程称为chase过程。
    ·保持FD:设关系模式R,F是R上的FD分解,ρ={ R1,„,Rk }是R的一个分 解,如果有∪ πRi(F)⊨F,那么称分解ρ保持FD集F。
  • 1NF:如果关系模式R的每个关系r的属性值都是不可分的原子值,那么称R是1NF 的模式。
  • 2NF:如果R是1NF的模式,且每个非主属性完全函数依赖于R的候选键,那么称R k i=1 k i=1 是2NF的模式。
  • 3NF:如果R是1NF的模式,且每个非主属性都不传递依赖于R的候选键,那么称R是3NF的模式。
  • BCNF:如果R是1NF的模式,且每个属性都不传递依赖于R的候选键,那么称R是BCNF的模式。
  • 4NF:设D是关系模式R上成立的FD和MVD集合。如果D中每个非平凡的MVD X→→Y的左部X都是R的超键,那么称R是4NF模式。
  • 5NF:如果关系模式R的每个JD均由R的候选键蕴涵,那么称R是5NF的模式。
  • ·多值依赖(MVD):设关系模式R(U),X和Y是U的子集,Z=U-X-Y。对于R的关系r,若在r中存在组(x,y1,z1)和(x,y2,z2),就也应存在组(x,y2,z1)和(x,y1,z2),那么称MVD X→→Y在模式R上成立。
  • 联接依赖(JD):设关系模式R(U),R1、„、Rn是U的子集,并满足U=R1∪„∪Rn, ρ={ R1,„,Rn }是R的一个分解。如果对于R的每个关系r都有mρ(r)=r,那么称 JD *(R1,„,Rn)在模式R上成立。

第7章系统实现技术

7.1 基本知识点

7.1.1 本章重要概念
(1)系统目录及其和DBMS各子系统的联系。
(2)事务的定义,COMMIT和ROLLBACK的语义,事务的ACID性质,事务的状态变迁图。
(3)存储器类型,稳定存储器的实现,数据传送过程。
(4)恢复的定义、基本原则和实现方法,故障的类型,检查点技术,REDO和UNDO操作,运行记录优先原则。
(5)并发操作带来的三个问题,X锁、PX协议、PXC协议,S锁、PS协议、PSC协议,活锁、饿死和死锁,并发调度,串行调度,并发调度的可串行化,两段封锁法,SQL中事务的存取模式和隔离级别。
(6)完整性的定义,完整性子系统的功能,完整性规则的组成。SQL中的三大类完整性约束,SQL3中的触发器技术。
(7)安全性的定义、级别,权限,SQL中的安全性机制,几种常用的安全性措施,自然环境的安全性。

7.1.2 本章的重点篇幅
(1)教材中P261 的图7.7。(检查点技术)
(2)并发操作带来的四个问题,封锁带来的三个问题,并发调度的可串行化。(教材P265-276)
(3)SQL中完整性约束的实现:断言(教材P290)。
(4)安全性中的授权语句(教材P298)。

  • 系统目录:系统目录(system catalog)是任何通用DBMS的核心。系统目录本身就是一个“微型数据库”,其主要功能是存储DBMS管理的数据库的定义或描述。这类信息被称为数据(metadata),主要包括数据库三级结构、两级映像的定义。
  • 事务:事务是构成单一逻辑工作单的操作集合。
  • DB的可恢复性:系统能把DB从被破坏、不正确的状态,恢复到最近一个正确的状态,DBMS的这种功能称为DB的可恢复性。
  • 并发操作:在多用户共享系统中,许多事务可能同时对同一数据进行操作,这种操作称为并发操作。 ·封锁:封锁是系统保证对数据项的访问以互斥方式进行的一种手段。
  • X锁:事务T对某数据加了X锁后,其他事务要等T解除X锁后,才能对这个数据进行封锁。
  • PX协议:只有获准X锁的事务,才能修改数据,否则这个事务进入等待状态。
  • PXC协议:PX协议再加上一条规则:“X锁必须保留到事务终点才能解除”。
  • S锁:事务T对某数据加了S锁后,仍允许其他事务再对该数据加S锁,但在对该数据的所有S锁都解除之前决不允许任何事务对该数据加X锁。
  • PS协议:获准S锁的事务,只能读数据,不能修改数据。
  • PSC协议:PS协议再加上一条规则:“S锁必须保留到事务终点才能解除”。
  • 活锁:系统可能使某个事务永远处于等待状态,得不到封锁的机会,这种现象称为“活锁”。
  • 饿死:若干事务连续不断地对某数据实现加S锁和释放S锁的操作,那么若有一个事务欲对该数据加X锁,将永远轮不上封锁的机会。这种现象称为“饿死”。
  • 死锁:若干事务都处于等待状态,相互等待对方解除封锁,结果造成这些事务都无法继续执行,这种现象称为系统进入了“死锁”状态。
  • 调度:事务的执行次序称为“调度”。
  • 串行调度:多个事务依次执行,称为事务的串行调度。 ·并发调度:利用分时的方法,同时处理多个事务,则称为事务的并发调度。
  • 可串行化调度/不可串行化调度:如果一个并发调度的执行结果与某一串行调度的执行结果等价,那么这个并发调度称为“可串行化的调度”,否则称为“不可串行化调度”。
  • 两段封锁协议:事务分成两个阶段,前一阶段只能申请封锁,后一阶段只能释放封锁,这一规则称为事务的两段封锁协议。
今天的文章 数据库概论基础分享到此就结束了,感谢您的阅读。
编程小号
上一篇 2024-12-26 07:11
下一篇 2024-12-26 07:06

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
如需转载请保留出处:https://bianchenghao.cn/bian-cheng-ji-chu/96965.html