,单击此处编辑母版标题样式,单击此处编辑母版文本样式,第二级,第三级,第四级,第五级,2006,年,4,月,12,日,#,安财信工学院计算机系,2006,年,4,月,12,日,1,本章主要内容,6.1,数据库设计概述,6.2,需求分析,6.3,概念结构设计,6.4,逻辑结构设计,6.5,数据库的物理设计,6.6,数据库的实施和维护,2006年4月12日1本章主要内容 6.1 数据库设计概述,2006,年,4,月,12,日,2,6-1,数据库设计概述,什么是数据库设计?,数据库设计是指对于一个给定的应用环境,构造最优的数据库模式,建立数据库及其应用系统,使之能够有效地存储数据,满足各种用户的应用需求(信息要求和处理要求),在数据库领域内,常常把使用数据库的各类系统统称为数据库应用系统。数据库设计是信息系统开发和建设的重要组成部分,从事数据库设计的专业人员应该具备哪些知识?,数据库的基本知识和数据库设计技术,计算机科学的基础知识和程序设计的方法和技巧,软件工程的原理和方法,应用领域的知识,2006年4月12日26-1数据库设计概述什么是数据库设计?,2006,年,4,月,12,日,3,数据库设计有何特点?,数据库建设是硬件、软件和干件的结合,三分技术,七分管理,十二分基础数据,技术与管理的界面称之为,“,干件,”,数据库设计应该与应用系统设计相结合,结构(数据)设计:设计数据库框架或数据库结构,行为(处理)设计:设计应用程序、事务处理等,结构和行为分离的设计,传统的软件工程忽视对应用中数据语义的分析和抽象,只要有可能就尽量推迟数据结构设计的决策,早期的数据库设计致力于数据模型和建模方法研究,忽视了对行为的设计,现实世界,概念模型设计,子模式设计,物理数据库设计,逻辑数据库设计,建立数据库,数据分析,功能分析,功能模型,功能说明,事务设计,程序说明,应用程序设计,程序编码调试,2006年4月12日3数据库设计有何特点?现实世界概念模型设,2006,年,4,月,12,日,4,数据库设计有哪些方法?,手工试凑法,设计质量与设计人员的经验和水平有直接关系,缺乏科学理论和工程方法的支持,工程的质量难以保证,数据库运行一段时间后常常又不同程度地发现各种问题,增加了维护代价,规范设计法,手工设计方法,基本思想:,过程迭代和逐步求精,典型方法,新奥尔良(,New Orleans,)方法,将数据库设计分为四个阶段,S.B.Yao,方法,将数据库设计分为五个步骤,I.R.Palmer,方法,把数据库设计当成一步接一步的过程,计算机辅助设计,ORACLE Designer 2000,SYBASE PowerDesigner,2006年4月12日4数据库设计有哪些方法?,2006,年,4,月,12,日,5,数据库设计有哪些基本步骤?,准备工作:,选定参加设计的人员,1.,数据库分析设计人员,数据库设计的核心人员,自始至终参与数据库设计,其水平决定了数据库系统的质量,2.,用户,在数据库设计中也是举足轻重的,主要参加需求分析和数据库的运行维护,用户积极参与带来的好处,加速数据库设计,提高数据库设计的质量,3.,程序员,在系统实施阶段参与进来,负责编制程序,4.,操作员,在系统实施阶段参与进来,准备软硬件环境,2006年4月12日5数据库设计有哪些基本步骤?准备工作:,2006,年,4,月,12,日,6,设计概念结构,需求收集和分析,设计逻辑结构,数据模型优化,设计物理结构,评价设计,性能预测,物理实现,试验性运行,使用、维护数据库,应用需求,(数据、,处理),转换规则,DBMS,功能,优化方法,应用要求,DBMS,详,细特征,需求分析阶段,概念设计阶段,逻辑设,计阶段,物理设,计阶段,数据库,实施阶段,数据库运行、维,护阶段,数据库设计步骤,需求分析阶段,准确了解与分析用户需求(包括数据与处理),是整个设计过程的基础,是最困难、最耗费时间的一步,概念结构设计阶段,是整个数据库设计的关键,通过对用户需求进行综合、归纳与抽象,形成一个独立于具体,DBMS,的概念模型,逻辑结构设计阶段,将概念结构转换为某个,DBMS,所支持的数据模型,对其进行优化,数据库物理设计阶段,为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法),数据库实施阶段,运用,DBMS,提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果,建立数据库,编制与调试应用程序,组织数据入库,并进行试运行,数据库运行和维护阶段,数据库应用系统经过试运行后即可投入正式运行。,在数据库系统运行过程中必须不断地对其进行评价、调整与修改。,2006年4月12日6,2006,年,4,月,12,日,7,软件工程,人们认为,应该用科学知识、工程方面的纪律指导软件开发的过程,以提高软件质量和开发效率,降低开发成本 。,软件生存期,从软件的规划、研制、实现、投入运行后的维护,直到它被新的软件所取代而停止使用的整个期间,。,数据库工程,数据库系统生存期,数据库应用系统从开始规划、设计、实现、维护到最后被新的系统取代而停止使用的整个期间,。,数据库设计的输入输出,隶属关系,与其它软件设计步骤进行对比,2006年4月12日7软件工程隶属关系与其它软件设计步骤进行,2006,年,4,月,12,日,8,规划,需求分析,系统设计,程序编制,调试,运行维护,运行和维护,实现,物理设计,逻辑设计,概念设计,需求分析,规划,软件生存期,数据库生存期,2006年4月12日8规划需求分析系统设计 程序编制 调试,2006,年,4,月,12,日,9,处理需求,DBMS,特征,总体信息需求,第,5,步,物理设计,第,3,步,概念设计,第,4,步,逻辑设计,第,1,步,规划,第,2,步,需求描述和分析,硬件和,OS,特征,物理数据库结构,需求说明书,信息结构,(独立于硬件、软件),逻辑数据库结构,(,DBMS,能处理的),应用程序说明书,数据库设计的输入输出,1,、规划阶段的三个步骤:,系统调查,对企业组织作全面的调查,画出组织层次图,以了解企业的组织结构,可行性分析,从技术、经济、效益、法律等族方面对建立数据库的可行性进行分析;写出可行性分析报告;组织专家进行讨论其可行性,确定数据库系统的总目标和制定项目开发计划,2,、需求分析工作,分析用户活动产生,产生,业务流程图,确定系统范围,产生,系统范围图,分析用户活动涉及的数据,产生,数据流图,分析系统数据,产生,数据字典,还有全系统中的数据项和数据存储的描述,3,、概念设计,为什么需要概念设计?,概念设计的主要步骤:,进行数据抽象,设计局部概念模式,将局部概念模式综合成全局概念模式,评审,2006年4月12日9处理需求DBMS特征总体信息需求第5步,2006,年,4,月,12,日,10,图,6.4,数据库的各级模式,应用,1,应用,3,应用,2,概念模式,概念要求,概念要求,概念要求,应用,1,应用,3,应用,2,逻辑模式,内模式,外模式,3,外模式,2,外模式,1,综合,转换,映像,映像,2006年4月12日10图6.4 数据库的各级模式应用1应用,2006,年,4,月,12,日,11,4,、逻辑设计步骤,导出初始,DBMS,模式说明,概念模式,子模式设计,应用程序设计草图,模式评价,处理结束,模式需要修正,模式修正,进入物理设计阶段,返回到前面阶段,是,是,否,否,2006年4月12日114、逻辑设计步骤导出初始DBMS模式,2006,年,4,月,12,日,12,5,、 物理设计,什么是数据库的物理结构?,物理设计的步骤,存储记录结构设计,确定数据存放位置,存取方法的设计,完整性和安全性考虑,程序设计,2006年4月12日125、 物理设计,2006,年,4,月,12,日,13,6,、 数据库的实现,实现数据库应做的主要工作,用,DDL,定义数据库结构;,组织数据入库,;,对数据量不大的小型系统(人工),主要工作:,筛选数据;转换数据格式;输入数据;校验数据。,大中型系统(自动),主要工作:,筛选数据;输入数据;校验数据;转换数据;综合数据。,编制与调试应用程序;,数据库试运行。,功能测试,性能测试(时空代价),2006年4月12日136、 数据库的实现,2006,年,4,月,12,日,14,7,、数据库的运行与维护工作,数据库的转储和恢复,数据库安全性、完整性控制,数据库性能的监督、分析和改进,数据库的重组织和重构造,2006年4月12日147、数据库的运行与维护工作,2006,年,4,月,12,日,15,设计特点,在设计过程中把数据库的设计和对数据库中数据处理的设计紧密结合起来,将这两个方面的需求分析、抽象、设计、实现在各个阶段同时进行,相互参照,相互补充,以完善两方面的设计,2006年4月12日15设计特点在设计过程中把数据库的设计和,2006,年,4,月,12,日,16,IPO,表,输入:,输出:,处理:,Creat,Load,Main( ),if,then,end,分区,1,分区,2,概念结构设计,逻辑结构设计,物理设计,设计阶 段,设 计 描 述,数 据,处 理,需求分 析,数据字典、全系统中数据项、,数据流、数据存储的描述,数据流图和判定表(判定树)、数据字典中处理过程的描述,概念模型(,E-R,图),数据字典,系统说明书包括:,新系统要求、,方案和概图,反映新系统信息,流的数据流图,某种数据模型,关系 非关系,系统结构图,(模块结构),存储安排,方法选择,存取路径建立,模块设计,IPO,表,实施阶段,编写模式,装入数据,数据库试运行,程序编码、,编译联结、,测试,运行维 护,性能监测、转储,/,恢复,数据库重组和重构,新旧系统转换、运行、维护(修正性、适应性、改善性维护),2006年4月12日16IPO表CreatMain,2006,年,4,月,12,日,17,6-2,需求分析,需求分析的任务是什么?,需求分析的方法有哪些?,调查用户需求的步骤有哪些?,常用的调查的方法有哪些?,什么是数据字典?,2006年4月12日176-2需求分析,2006,年,4,月,12,日,18,需求分析就是分析用户的需要与要求,需求分析是设计数据库的起点,需求分析的结果是否准确地反映了用户的实际要求,将直接影响到后面各个阶段的设计,并影响到设计结果是否合理和实用,2006年4月12日18需求分析就是分析用户的需要与要求,2006,年,4,月,12,日,19,需求分析的任务,通过详细调查现实世界要处理的对象(组织、部门、企业等),充分,了解原系统,(手工系统或计算机系统),工作概况,明确用户的各种需求,在此基础上,确定新系统的功能,。新系统必须充分考虑今后可能的扩充和改变,不能仅仅按当前应用需求来设计数据库,2006年4月12日19需求分析的任务 通过详细调查现实世界,2006,年,4,月,12,日,20,需求分析的重点,需求分析的重点,调查、收集与分析用户在数据管理中的,信息要求、处理要求、安全性与完整性要求,。,信息要求,用户需要从数据库中获得信息的内容与性质,由用户的信息要求可以导出数据要求,即在数据库中需要存储哪些数据,处理要求,对处理功能的要求,对处理的响应时间的要求,对处理方式的要求,(,批处理,/,联机处理,),新系统的功能必须能够满足用户的信息要求、处理要求、安全性与完整性要求。,2006年4月12日20需求分析的重点需求分析的重点,2006,年,4,月,12,日,21,需求分析的难点,确定用户最终需求的难点,用户,缺少计算机知识,开始时无法确定计算机究竟能为自己做什么,不能做什么,因此无法一下子准确地表达自己的需求,他们所提出的需求往往不断地变化。,设计人员,缺少用户的专业知识,不易理解用户的真正需求,甚至误解用户的需求。,新,的硬件、软件,技术的出现,也会使用户需求发生变化。,解决方法,设计人员必须采用有效的方法,与用户不断,深入,地进行,交流,,才能逐步得以确定用户的实际需求,2006年4月12日21需求分析的难点确定用户最终需求的难点,2006,年,4,月,12,日,22,需求分析的方法,调查清楚用户的实际需求并进行初步分析,与用户达成共识,进一步分析与表达这些需求,2006年4月12日22需求分析的方法调查清楚用户的实际需求,2006,年,4,月,12,日,23,调查与初步分析用户需求的步骤,调查组织机构情况,组织部门的组成情况,各部门的职责等,调查各部门的业务活动情况。调查重点之一。,各个部门输入和使用什么数据,如何加工处理这些数据,输出什么信息,输出到什么部门,输出结果的格式是什么, 在熟悉业务活动的基础上,协助用户明确对新系统的各种要求。调查重点之二。,信息要求,处理要求,完全性与完整性要求, 对前面调查的结果进行初步分析,确定新系统的边界,确定哪些功能由计算机完成或将来准备让计算机完成,确定哪些活动由人工完成,由计算机完成的功能就是新系统应该实现的功能。,2006年4月12日23调查与初步分析用户需求的步骤 调查,2006,年,4,月,12,日,24,有关常用调查方法,做需求调查时,往往需要同时采用多种方法,无论使用何种调查方法,都必须有用户的积极参与和配合,设计人员应该和用户取得共同的语言,帮助不熟悉计算机的用户建立数据库环境下的共同概念,并对设计工作的最后结果共同承担责任,2006年4月12日24有关常用调查方法做需求调查时,往往需,2006,年,4,月,12,日,25,常用调查方法有:,跟班作业,通过亲身参加业务工作了解业务活动的情况,能比较准确地理解用户的需求,但比较耗时,开调查会,通过与用户座谈来了解业务活动情况及用户需求,请专人介绍,询问,对某些调查中的问题,可以找专人询问,设计调查表请用户填写,如果调查表设计合理,则很有效,且易于为用户接受,查阅记录,查阅与原系统有关的数据记录,2006年4月12日25常用调查方法有:跟班作业,2006,年,4,月,12,日,26,进一步分析和表达用户需求,分析和表达用户的需求,的常用方法,自顶向下的结构化分析方法(,Structured Analysis,,简称,SA,方法),SA,方法从最上层的系统组织机构入手,采用逐层分解的方式分析系统,并用数据流图和数据字典描述系统。,2006年4月12日26进一步分析和表达用户需求分析和表达用,2006,年,4,月,12,日,27,1,首先把任何一个系统都抽象为:,2,分解处理功能和数据,(,1,)分解处理功能,将处理功能的具体内容分解为若干子功能,再将每个子功能继续分解,直到把系统的工作过程表达清楚为止。,(,2,)分解数据,在处理功能逐步分解的同时,其所用的数据也逐级分解,形成若干层次的数据流图,数据流图表达了数据和处理过程的关系,(,3,)表达方法,处理过程:用判定表或判定树来描述,数据:用数据字典来描述,3,将分析结果再次提交给用户,征得用户的认可,数据流,数据流,数据,存储,信息要求,数据,来源,处理,数据,输出,处理要求,2006年4月12日271首先把任何一个系统都抽象为:数据,2006,年,4,月,12,日,28,2006年4月12日28,2006,年,4,月,12,日,29,需求分析小结,实例:假设我们要开发一个学校管理系统。,1,经过可行性分析和初步需求调查,抽象出该系统最高层数据流图,该系统由教师管理子系统、学生管理子系统、后勤管理子系统组成,每个子系统分别配备一个开发小组。,2,进一步细化各个子系统。,其中学生管理子系统开发小组通过进行进一步的需求调查,明确了该子系统的主要功能是进行学籍管理和课程管理,包括学生报到、入学、毕业的管理,学生上课情况的管理。通过详细的信息流程分析和数据收集后,他们生成了该子系统的数据流图。,2006年4月12日29需求分析小结实例:假设我们要开发一个,2006,年,4,月,12,日,30,数据字典,什么是数据字典?,数据字典有何用途?,数据字典中有哪些内容?,2006年4月12日30数据字典什么是数据字典?,2006,年,4,月,12,日,31,数据字典的用途,数据字典是各类数据描述的集合,数据字典是进行详细的数据收集和数据分析所获得的主要结果,数据字典在数据库设计中占有很重要的地位,2006年4月12日31数据字典的用途数据字典是各类数据描述,2006,年,4,月,12,日,32,数据字典的内容,数据字典的内容,数据项,数据结构,数据流,数据存储,处理过程,数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构,数据字典通过对数据项和数据结构的定义来描述数据流、数据存储的逻辑内容。,2006年4月12日32数据字典的内容数据字典的内容,2006,年,4,月,12,日,33,数据项,数据项是不可再分的数据单位,对数据项的描述,数据项描述,数据项名,数据项含义说明,,别名,数据类型,长度,取值范围,,取值含义,与其他数据项的逻辑关系,取值范围、与其他数据项的逻辑关系定义了数据的完整性约束条件,2006年4月12日33 数据项数据项是不可再分的数据单位,2006,年,4,月,12,日,34,数据结构,数据结构反映了数据之间的组合关系。,一个数据结构可以由若干个数据项组成,也可以由若干个数据结构组成,或由若干个数据项和数据结构混合组成。,对数据结构的描述,数据结构描述,数据结构名,含义说明,,组成,:,数据项或数据结构,2006年4月12日34 数据结构数据结构反映了数据之间的,2006,年,4,月,12,日,35,数据流,数据流是数据结构在系统内传输的路径。,对数据流的描述,数据流描述数据流名,说明,数据流来源,,数据流去向,组成,:,数据结构,,平均流量,高峰期流量,数据流来源是说明该数据流来自哪个过程,数据流去向是说明该数据流将到哪个过程去,平均流量是指在单位时间(每天、每周、每月等)里的传输次数,高峰期流量则是指在高峰时期的数据流量,2006年4月12日35 数据流 数据流是数据结构在系统内,2006,年,4,月,12,日,36,数据存储,数据存储是数据结构停留或保存的地方,也是数据流的来源和去向之一。,对数据存储的描述,数据存储描述数据存储名,说明,编号,,流入的数据流 ,流出的数据流 ,,组成,:,数据结构,数据量,存取方式,流入的数据流:指出数据来源,流出的数据流:指出数据去向,数据量:每次存取多少数据,每天(或每小时、每周等)存取几次等信息,存取方法:批处理,/,联机处理;检索,/,更新;顺序检索,/,随机检索,2006年4月12日36 数据存储数据存储是数据结构停留或,2006,年,4,月,12,日,37,处理过程,处理过程的具体处理逻辑一般用判定表或判定树来描述。数据字典中只需要描述处理过程的说明性信息,处理过程说明性信息的描述,处理过程描述处理过程名,说明,,输入,:,数据流,输出,:,数据流,,处理,:,简要说明,简要说明:主要说明该处理过程的功能及处理要求,功能:该处理过程用来做什么,处理要求:处理频度要求(如单位时间里处理多少事务,多少数据量);响应时间要求等,处理要求是后面物理设计的输入及性能评价的标准,2006年4月12日37 处理过程处理过程的具体处理逻辑一,2006,年,4,月,12,日,38,例:学生学籍管理子系统的数据字典。,数据项,,以,“,学号,”,为例:,数据项:学号,含义说明:唯一标识每个学生,别名:学生编号,类型:字符型,长度:,8,取值范围:,00000000,至,99999999,取值含义:前两位标别该学生所在年级,,后六位按顺序编号,与其他数据项的逻辑关系:,2006年4月12日38例:学生学籍管理子系统的数据字典。数,2006,年,4,月,12,日,39,数据结构,以,“,学生,”,为例,“,学生,”,是该系统中的一个核心数据结构:,数据结构:学生,含义说明:是学籍管理子系统的主体数据结,构,定义了一个学生的有关信息,组成:学号,姓名,性别,年龄,,所在系,年级,2006年4月12日39数据结构 以“学生”为例,2006,年,4,月,12,日,40,数据流,“,体检结果,”,可如下描述:,数据流:体检结果,说明:学生参加体格检查的最终结果,数据流来源:体检,数据流去向:批准,组成:,平均流量:,高峰期流量:,2006年4月12日40数据流“体检结果”可如下描述:,2006,年,4,月,12,日,41,数据存储,“,学生登记表,”,可如下描述:,数据存储:学生登记表,说明:记录学生的基本情况,流入数据流:,流出数据流:,组成:,数据量:每年,3000,张,存取方式:随机存取,2006年4月12日41数据存储“学生登记表”可如下描述:数,2006,年,4,月,12,日,42,处理过程,“,分配宿舍,”,可如下描述:,处理过程:分配宿舍,说明:为所有新生分配学生宿舍,输入:学生,宿舍,,输出:宿舍安排,处理:在新生报到后,为所有新生分配学,生宿舍。要求同一间宿舍只能安排,同一性别的学生,同一个学生只能,安排在一个宿舍中。每个学生的居,住面积不小于,3,平方米。安排新生,宿舍其处理时间应不超过,15,分钟。,2006年4月12日42处理过程“分配宿舍”可如下描述:处,2006,年,4,月,12,日,43,6.3,概念结构设计,6.3.1,概念结构设计概述,6.3.2,概念结构设计的方法与步骤,6.3.3,数据抽象与局部视图设计,6.3.4,视图的集成,2006年4月12日436.3 概念结构设计6.3.1,2006,年,4,月,12,日,44,6.3.1,概念结构设计概述,什么是概念结构设计,需求分析阶段描述的用户应用需求是现实世界的具体需求,将需求分析得到的用户需求抽象为信息结构即概念模型的过程就是概念结构设计,概念结构是各种数据模型的共同基础,它比数据模型更独立于机器、更抽象,从而更加稳定。,概念结构设计是整个数据库设计的关键,现实世界,机器世界,信息世界,需求分析,概念结构设计,2006年4月12日446.3.1 概念结构设计概述什么是,2006,年,4,月,12,日,45,概念结构设计的特点,(,1,)能真实、充分地反映现实世界,包括事物和事物之间的联系,能满足用户对数据的处理要求。是对现实世界的一个真实模型。,(,2,)易于理解,从而可以用它和不熟悉计算机的用户交换意见,用户的积极参与是数据库的设计成功的关键。,(,3,)易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充。,(,4,)易于向关系、网状、层次等各种数据模型转换。,2006年4月12日45概念结构设计的特点(1)能真实、充分,2006,年,4,月,12,日,46,什么是,ER,模型,ER,模型的历史,ER,模型的基本元素,实体,联系,属性,例子,实体,联系,属性,ER,模型图例,老,师,学,生,教,m,n,学号,姓名,专业,班级,职称,性别,姓名,职号,描述概念模型的工具,E-R,模型,2006年4月12日46什么是ER模型实体联系属性ER模型图,2006,年,4,月,12,日,47,属性的分类,基本属性和复合属性(可否再分),单值属性和多值属性(对一个实体对象是否只能取一个值),多值属性的处理,将原来的多值属性用几个新的单值属性来表示。,将原来的多值属性用一个新的实体类型表示,导出属性,空值,图,5.4,地址属性的层次结构,邮政编码,省(市)名,地 址,区 名,街 道,家庭地址,门牌号码,图,5.5,多值属性的表示,零件编码,零 件,零件名,供应商,规格,进货价格,销售价格价格,图,5.8,导出属性的表示,工号,职 工,姓名,基本工资,奖金,房租,实发工资,图,5.6,多值属性的变换(,1,),零件编码,零 件,零件名,供应商,规格,进货价格,经销价格,代销价格,批发价格,零售价格,图,5.7,多值属性的变换(,2,),零件编码,零 件,零件名,供应商,规格,进货价格,销售性质价格,售货价格,存在,销售价格,1,N,零件编码,2006年4月12日47属性的分类基本属性和复合属性(可否再,2006,年,4,月,12,日,48,联系的设计之一,联系集,联系集是,n,(,n2,)个实体集上的数学关系,这些实体集不必互异。如果,E1,,,E2,,,,,En,为,n,个实体集,那么联系集,R,是,(e1,,,e2,,,,,en,),|e1E1 ,e2E2,,,,,enEn,的一个子集,而(,e1,,,e2,,,,,en,)是一个联系,。,联系的元数,一个联系涉及到的实体集个数,联系的连通词,联系涉及到的实体集之间实体对应的方式,实体的基数,有两个实体集,E1,和,E2,,,E1,中每个实体与,E2,中有联系实体的数目的最小值,min,和最大值,max,,称为,E1,的基数,用(,min,,,max,)形式表示,问题:运动员根据其得分来排定名次。在名次排列中,排在他前面只有一个人排在他后面也只有一个人,运动员,编号,姓名,性别,名次,顺序,1,1,图,5.9,一元联系中的,1:1,联系,职工之间的上下级联系,职工,工号,姓名,年龄,性别,领导,1,N,图,5.10,一元联系中的,1:N,联系,工厂的零件之间存在着组合关系,一种零件由许多种子零件组成,而一种零件也可以是其他零件的子零件,零件,零件号,零件名,规,格,数量,组成,M,N,图,5.11,一元联系中的,M:N,联系,某商业集团中,商店、仓库、商品之间的进货联系,图,5.12,三元联系中的,M:N:P,联系,仓库,商品,商店,仓库号,仓库名,地址,数量,商店号,商品名,商品号,商店名,日期,进货,M,N,P,学校里规定每学期学生至少选修,1,门课程,最多选修,6,门课程;每门课程至多有,50,人选修,最少可以没人选修,图,5.13,联系的连通词和实体的基数,学生,课程,选课,M,(,1,,,6,),N,(,0,,,50,),2006年4月12日48联系的设计之一 联系集 问题:运动员,2006,年,4,月,12,日,49,6.3.2,概念结构设计的方法与步骤,设计概念结构的四类方法,自顶向下,首先定义全局概念结构的框架,然后逐步细化,自底向上,首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构,逐步扩张,首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构,混合策略,将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。,2006年4月12日496.3.2 概念结构设计的方法与步,2006,年,4,月,12,日,50,概念结构设计的方法与步骤(续),自顶向下策略,2006年4月12日50概念结构设计的方法与步骤(续),2006,年,4,月,12,日,51,概念结构设计的方法与步骤(续),自底向上策略,2006年4月12日51概念结构设计的方法与步骤(续),2006,年,4,月,12,日,52,概念结构设计的方法与步骤(续),逐步扩张,2006年4月12日52概念结构设计的方法与步骤(续)逐步扩,2006,年,4,月,12,日,53,概念结构设计的常用策略,自顶向下地进行需求分析,自底向上地设计概念结构,自底向上设计概念结构的步骤,第,1,步:抽象数据并设计局部视图,第,2,步:集成局部视图,得到全局概念结构,2006年4月12日53概念结构设计的常用策略,2006,年,4,月,12,日,54,6.3.3,数据抽象与局部视图设计,数据抽象,局部视图设计,2006年4月12日546.3.3 数据抽象与局部视图设计,2006,年,4,月,12,日,55,一、数据抽象,概念结构是对现实世界的一种抽象,从实际的人、物、事和概念中抽取所关心的共同特性,忽略非本质的细节,把这些特性用各种概念精确地加以描述,这些概念组成了某种模型,2006年4月12日55一、数据抽象概念结构是对现实世界的一,2006,年,4,月,12,日,56,三种常用抽象,1.,分类(,Classification,),定义某一类概念作为现实世界中一组对象的类型,这些对象具有某些共同的特性和行为,它抽象了对象,值和型,之间的,“,is member of,”,的语义,在,E-R,模型中,实体型就是这种抽象,例:,P216,图,6.10,2.,聚集(,Aggregation,),定义某一类型的组成成分,它抽象了对象内部类型和成分之间,“,is part of,”,的语义,在,E-R,模型中若干属性的聚集组成了实体型,就是这种抽象,例:,P217,图,6.11,,图,6.12,3.,概括(,Generalization,),定义类型之间的一种子集联系,它抽象了类型之间的,“,is subset of,”,的语义,概括有一个很重要的性质:继承性。子类继承超类上定义的所有抽象。,例:,P217,图,6.13,2006年4月12日56三种常用抽象1. 分类(Class,2006,年,4,月,12,日,57,注:原,E-R,模型不具有概括,本书对,E-R,模型作了扩充,允许定义超类实体型和子类实体型。,用双竖边的矩形框表示子类,,用直线加小圆圈表示超类,-,子类的联系,数据抽象的用途,对需求分析阶段收集到的数据进行分类、组织(聚集),形成,实体,实体的属性,标识实体的码,确定实体之间的联系类型,(1:1,,,1:n,,,m:n),2006年4月12日57注:原E-R模型不具有概括,本书对E,2006,年,4,月,12,日,58,二、局部视图设计,设计分,E-R,图的步骤,:,选择局部应用,逐一设计分,E-R,图,2006年4月12日58二、局部视图设计设计分E-R图的步骤,2006,年,4,月,12,日,59,选择局部应用,需求分析阶段,已用多层数据流图和数据字典描述了整个系统。,设计分,E-R,图首先需要根据系统的具体情况,在多层的数据流图中,选择,一个,适当层次的数据流图,,让这组图中每一部分对应一个局部应用,然后以这一层次的数据流图为出发点,设计分,E-R,图。,通常以中层数据流图作为设计分,E-R,图的依据。原因:,高层数据流图只能反映系统的概貌,中层数据流图能较好地反映系统中各局部应用的子系统组成,低层数据流图过细,例:由于学籍管理、课程管理等都不太复杂,因此可以它们入手设计学生管理子系统的分,E-R,图。如果局部应用比较复杂,则可以从更下层的数据流图入手。,2006年4月12日59 选择局部应用需求分析阶段,已用多,2006,年,4,月,12,日,60,逐一设计分,E-R,图,任务,标定局部应用中的实体、属性、码,实体间的联系,将各局部应用涉及的数据分别从数据字典中抽取出来,参照数据流图,标定各局部应用中的实体、实体的属性、标识实体的码,确定实体之间的联系及其类型(,1:1,,,1:n,,,m:n,),注意区分实体和属性,实体与属性是相对而言的,。同一事物,在一种应用环境中作为,“,属性,”,,在另一种应用环境中就必须作为,“,实体,”,。,例:学校中的系,在某种应用环境中,它只是作为,“,学生,”,实体的一个属性,表明一个学生属于哪个系;而在另一种环境中,由于需要考虑一个系的系主任、教师人数、学生人数、办公地点等,这时它就需要作为实体了。,2006年4月12日60 逐一设计分E-R图任务,2006,年,4,月,12,日,61,区分实体和属性一般原则,属性不能再具有需要描述的性质。即属性必须是不可分的数据项,不能再由另一些属性组成。,属性不能与其他实体具有联系。联系只发生在实体之间。,符合上述两条特性的事物一般作为属性对待。,为了简化,E-R,图的处置,现实世界中的事物凡能够作为属性对待的,应尽量作为属性。,举例:,例,1,:,“,学生,”,由学号、姓名等属性进一步描述,根据准则,,“,学生,”,只能作为实体,不能作为属性。,例,2,:职称通常作为教师实体的属性,但在涉及住房分配时,由于分房与职称有关,也就是说职称与住房实体之间有联系,根据准则,这时把职称作为实体来处理会更合适些。,例,3,:,销售管理子系统,ER,设计实例,2006年4月12日61区分实体和属性一般原则,2006,年,4,月,12,日,62,6.3.4,视图的集成,各个局部视图即分,E-R,图建立好后,还需要对它们进行合并,集成为一个整体的数据概念结构即总,E-R,图。,视图集成的两种方式,一次集成(,P224,图,6.25(a),),一次集成多个分,E-R,图,通常用于局部视图比较简单时,逐步累积式(,P224,图,6.25(b),),首先集成两个局部视图(通常是比较关键的两个局部视图),以后每次将一个新的局部视图集成进来,集成局部,E-R,图的步骤,1.,合并,2.,修改与重构,2006年4月12日626.3.4 视图的集成各个局部视图,2006,年,4,月,12,日,63,视图的集成,2006年4月12日63视图的集成,2006,年,4,月,12,日,64,ER,模型的操作,包括实体类型、联系类型和属性的,分裂,、,合并,、,增删,等等,教师号,姓名,出生日期,职务,工资,奖金,教师,(,a,),教师号,姓名,出生日期,教师不变信息,职务,工资,奖金,教师号,教师变动信息,(,b,),图,5.15,实体类型的垂直分裂,教师,课程,主讲,辅导,1,M,N,N,图,5.16,联系类型的分裂,教师,课程,主讲,M,N,(,a,)(,b,),图,5.17,不合法的合并,B,(a),A,C,A-C,B-C,A,C,A-B-C,(b),B,2006年4月12日64ER模型的操作包括实体类型、联系类,2006,年,4,月,12,日,65,设计局部,ER,模式,需求分析结果,确定局部结构范围,实体定义,联系定义,属性分配,还有局部,结构待分析,有,无,进入全局,ER,模式设计,图,5.18,局部,ER,模式设计,范围的划分要自然,易于管理;,范围的大小要适度。太小了,会造成局部结构过多,设计过程繁琐,综合困难;太大了,则容易造成内部结构复杂,不便分析,范围之间的界面要清晰,相互影响要小,采用人们习惯的划分;,避免冗余,在一个局部结构中,对一个对象只取一种抽象形式,不要重复;,依据用户的信息处理需求,确定属性的原则:,属性应该是不可再分解的语义单位;实体与属性之间的关系只能是,1:N,的;不同实体类型的属性之间应无直接关联关系。,属性分配的原则:,当多个实体类型用到同一属性时, 一般把属性分配给那些使用频率最高的实体类型,或分配给实体值少的实体类型。,有些属性不宜归属于任一实体类型,只说明实体之间联系的特性,2006年4月12日65设计局部ER模式 需求分析结果确定局,2006,年,4,月,12,日,66,局部模式,现有的教学,管理系统,初步分析系统的对象,根据服务种类分析教师子模块,局部,ER,图,2006年4月12日66局部模式现有的教学初步分析系统的对象,2006,年,4,月,12,日,67,其他局部模式,现有的教学,管理系统,初步分析系统的对象,根据服务种类分析学生子模块,图,5.21,学籍管理局部应用的分,E-R,图,导师,班级,学生,组成,管理,班主任,档案材料,宿舍,住宿,归档,指导,系,有,参加,学会,1,N,1,1,1,N,N,N,1,1,N,M,N,1,具有,社会关系,1,N,局部,ER,图,2006年4月12日67其他局部模式现有的教学初步分析系统的,2006,年,4,月,12,日,68,其他局部模式,现有的教学,管理系统,初步分析系统的对象,根据服务种类分析课程子模块,局部,ER,图,图,5.22,课程管理局部应用分,E-R,图,1,教室,M,1,教科书,教师,担任,课程,系,开设,N,1,学生,选修,N,MN,上课,P,N,2006年4月12日68其他局部模式现有的教学初步分析系统的,2006,年,4,月,12,日,69,设计全局,ER,模式,无,图,5.20,全局,ER,模式设计,局部,ER,模式,确定公共实体类型,合并两个局部,ER,模式,检查并消除冲突,还有未合并的局部模式,有,还有冲突吗,有,属性冲突,:,如,重量单位有的用公斤,有的用克。,结构冲突,:,同一对象在不同应用中的不同抽象,;,同一实体在不同局部,ER,图中属性的个数或次序不同,;,实体之间的联系在不同的局部,ER,图中呈现不同的类型,命名冲突,:,属性名、实体名、联系名之间存在同名异义或异名同义冲突,2006年4月12日69设计全局 ER模式无图5.20全局E,2006,年,4,月,12,日,70,全局,ER,模式的优化,实体类型的合并,1:1,联系的两个实体类型,具有相同键的实体类型,冗余属性的消除,冗余联系的消除:,利用规范化理论中函数依赖的概念消除冗余联系,2006年4月12日70全局ER模式的优化实体类型的合并,2006,年,4,月,12,日,71,例子:三个局部,ER,图合并成一个,ER,图,1,图,5.24,合并后的教学管理,E-R,图,1,N,1,P,1,N,1,N,1,N,1,M,M,N,N,N,N,社会关系,具有,1,N,N,M,1,系,聘用,承接,项目,参加,设置,院长,学院,主管,N,N,1,1,1,教师,评定,职称,分配,工作量,1,1,1,N,档案材料,归档,参加,学会,1,宿舍,住宿,教科书,担任,指导,课程,选修,教室,上课,有,1,班级,学生,组成,N,开设,N,管理,1,1,教师,管理,1,1,2006年4月12日71例子:三个局部ER图合并成一个ER图,2006,年,4,月,12,日,72,冲突的种类,1,、属性冲突,属性域冲突,:,属性值的类型、取值范围或取值集合不同。,例,1,, 由于学号是数字,因此某些部门(即局部应用)将学号定义为整数形式,而由于学号不用参与运算,因此另一些部门(即局部应用)将学号定义为字符型形式。,例,2,, 某些部门(即局部应用)以出生日期形式表示学生的年龄,而另一些部门(即局部应用)用整数形式表示学生的年龄。,属性取值单位冲突,。,例:学生的身高,有的以米为单位,有的以厘米为单位,有的以尺为单位。,2,、命名冲突,同名异义:,不同意义的对象在不同的局部应用中具有相同的名字,例,局部应用,A,中将教室称为房间, 局部应用,B,中将学生宿舍称为房间,异名同义(一义多名),:同一意义的对象在不同的局部应用中具有不同的名字,例,有的部门把教科书称为课本, 有的部门则把教科书称为教材,命名冲突可能发生在属性级、实体级、联系级上。其中属性的命名冲突更为常见。,3,、结构冲突,2006年4月12日72冲突的种类1、属性冲突,2006,年,4,月,12,日,73,3,类,结构冲突,1,、同一对象在不同应用中具有不同的抽象,例,,“,课程,”,在某一局部应用中被当作实体,在另一局部应用中则被当作属性,解决方法:通常是把属性变换为实体或把实体变换为属性,使同一对象具有相同的抽象。变换时要遵循两个准则。,2,、同一实体在不同局部视图中所包含的属性不完全相同,或者属性的排列次序不完全相同。,产生原因:不同的局部应用关心的是该实体的不同侧面。,解决方法:使该实体的属性取各分,E-R,图中属性的并集,再适当设计属性的次序,。,3,、实体之间的联系在不同局部视图中呈现不同的类型,例,1,, 实体,E1,与,E2,在局部应用,A,中是多对多联系,而在局部应用,B,中是一对多联系,例,2,, 在局部应用,X,中,E1,与,E2,发生联系,而在局部应用,Y,中,E1,、,E2,、,E3,三者之间有联系。,解决方法:根据应用语义对实体联系的类型进行综合或调整。,2006年4月12日733类结构冲突1、同一对象在不同应用中,2006,年,4,月,12,日,74,学生,学号,姓名,性别,平均成绩,(a),在局部应用,A,中,学生,学号,姓名,出生日期,年级,(b),在局部应用,B,中,所在系,学生,学号,姓名,政治面貌,(c),在局部应用,C,中,学生,政治,面貌,学号,出生,日期,年级,(d),合并后,所在系,平均,成绩,姓名,性别,2006年4月12日74学生学号 姓名性别平均成绩(a)在局,2006,年,4,月,12,日,75,二、修改与重构,基本任务,消除不必要的冗余,设计生成基本,E-R,图,合并,初步,E-R,图,分,E-R,图,可能存在冗余的数据,和冗余的实体间联系,基本,E-R,图,消除不必要的冗余,2006年4月12日75二、修改与重构基本任务合并初步E-R,2006,年,4,月,12,日,76,1,冗余,冗余从何而来?,冗余的数据是指可由基本数据导出的数据,,冗余的联系是指可由其他联系导出的联系。,冗余数据和冗余联系容易破坏数据库的完整性,给数据库维护增加困难并不是所有的冗余数据与冗余联系都必须加以消除,有时为了提高某些应用的效率,不得不以冗余信息作为代价。,设计数据库概念结构时,哪些冗余信息必须消除,哪些冗余信息允许存在,需要根据用户的整体需求来确定。消除不必要的冗余后的初步,E-R,图称为基本,E-R,图。,2006年4月12日761冗余冗余从何而来?,2006,年,4,月,12,日,77,2,消除冗余的方法,分析方法,以数据字典和数据流图为依据,根据数据字典中关于数据项之间逻辑关系的说明来消除冗余。,例,教师工资单中包括该教师的基本工资、各种补贴、应扣除的房租水电费以及实发工资。,由于实发工资可以由前面各项推算出来,因此可以去掉,在需要查询实发工资时根据基本工资、各种补贴、应扣除的房租水电费数据临时生成。,如果是为了提高效率,人为地保留了一些冗余数据,则应把数据字典中数据关联的说明作为完整性约束条件。,一种更好的方法是把冗余数据定义在视图中,2006年4月12日772消除冗余的方法分析方法,2006,年,4,月,12,日,78,消除冗余的方法,规范化理论,函数依赖的概念提供了消除冗余联系的形式化工具,方法,1.,确定分,E-R,图实体之间的数据依赖,F,L,。实体之间一对一、一对多、多对多的联系可以用实体码之间的函数依赖来表示。,例:,班级和学生之间一对多的联系: 学号,班级号,学生和课程之间多对多的联系: (学号,课程号),成绩,2.,求,F,L,的最小覆盖,G,L,,差集为,D,=,F,L,-,G,L,。,逐一考察,D,中的函数依赖,确定是否是冗余的联系,若是,就把它去掉。,2006年4月12日78消除冗余的方法规范化理论,2006,年,4,月,12,日,79,冗余数据和冗余联系:,(1),学生实体中的年龄属性可以由出生日期推算出来,属于冗余数据,应该去掉。这样不仅可以节省存储空间,而且当某个学生的出生日期有误,进行修改后,无须相应修改年龄,减少了产生数据不一致,的机会。,学生:,学号,,姓名,出生日期,所在系, 年级,平均成绩,(2),教室实体与班级实体的上课联系可以由教室与课程之间的开设联系、课程与学生之间的选修联系、学生与班级之间的组成联系三者推导出来,因此属于冗余联系,可以消去。,(3),学生实体中的平均成绩可以从选修联系中的成绩属性中推算出来,由于应用中需要经常查询某个学生的平均成绩,每次都进行这种计算效率就会太低,因此为提高效率,保留该冗余数据,但定义一个触发器来保证学生的平均成绩等于该学生各科成绩的平均值。,任何一科成绩修改后,或该学生学了新的科目并有成绩后,就触发该触发器去修改该学生的平均成绩属性值。,2006年4月12日79冗余数据和冗余联系:,2006,年,4,月,12,日,80,三、验证整体概念结构,视图集成后形成一个整体的数据库概念结构,对该整体概念结构还必须进行进一步验证,确保它能够满足下列条件,:,整体概念结构内部必须具有一致性,不存在互相矛盾的表达。,整体概念结构能准确地反映原来的每个视图结构,包括属性、实体及实体间的联系。,整体概念结构能满足需要分析阶段所确定的所有要求。,整体概念结构最终还应该提交给用户,征求用户和有关人员的意见,进行评审、修改和优化,然后把它确定下来,作为数据库的概念结构,作为进一步设计数据库的依据,。,2006年4月12日80三、验证整体概念结构视图集成后形成一,2006,年,4,月,12,日,81,数据库设计,数据库的设计过程,需求分析,概念结构设计,逻辑结构设计,物理数据库设计,实施,运行维护,设计过程中往往还会有许多反复。,2006年4月12日81数据库设计数据库的设计过程,2006,年,4,月,12,日,82,概念结构设计小结,概念结构设计的步骤,抽象数据并设计局部视图,集成局部视图,得到全局概念结构,验证整体概念结构,2006年4月12日82概念结构设计小结概念结构设计的步骤,2006,年,4,月,12,日,83,概念结构设计小结,数据抽象,分类,聚集,概括,2006年4月12日83概念结构设计小结数据抽象,2006,年,4,月,12,日,84,概念结构设计小结,设计局部视图, 选择局部应用, 逐一设计分,E-R,图,标定局部应用中的实体、属性、码,实体间的联系,用,E-R,图描述出来,2006年4月12日84概念结构设计小结设计局部视图,2006,年,4,月,12,日,85,概念结构设计小结,集成局部视图,1.,合并分,E-R,图,生成初步,E-R,图,消除冲突,属性冲突,命名冲突,结构冲突,2.,修改与重构,消除不必要的冗余,设计生成基本,E-R,图,分析方法,规范化理论,2006年4月12日85概念结构设计小结集成局部视图,2006,年,4,月,12,日,86,6.4,逻辑结构设计,逻辑结构设计的任务,概念结构是各种数据模型的共同基础。为了能够用某一,DBMS,实现用户需求,还必须将概念结构进一步转化为相应的数据模型,这正是数据库逻辑结构设计所要完成的任务。,逻辑结构设计的步骤,将概念结构转化为一般的关系、网状、层次模型,将转化来的关系、网状、层次模型向特定,DBMS,支持下的