资源预览内容
第1页 / 共38页
第2页 / 共38页
第3页 / 共38页
第4页 / 共38页
第5页 / 共38页
第6页 / 共38页
第7页 / 共38页
第8页 / 共38页
第9页 / 共38页
第10页 / 共38页
第11页 / 共38页
第12页 / 共38页
第13页 / 共38页
第14页 / 共38页
第15页 / 共38页
第16页 / 共38页
第17页 / 共38页
第18页 / 共38页
第19页 / 共38页
第20页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
点击查看更多>>
资源描述
单击此处编辑母版标题样式,编辑母版文本样式,第二级,第三级,第四级,第五级,2017-12-08,#,数据仓库,小组成员:朱敏、崔文值、胡滨、张硕研,主讲人 :朱敏,数据库的,分家,1.,操作型数据库,主要用于业务支,撑,撑。一个公司往,往,往会使用并维护,若,若干个数据库,,这,这些数据库保存,着,着公司的日常操,作,作数据,比如商,品,品购买、酒店预,订,订、学生成绩录,入,入等;,2.,分析型数据库,主要用于历史数,据,据分析。这类数,据,据库作为公司的,单,单独数据存储,,负,负责利用历史数,据,据对公司各主题,域,域进行统计分析,;,;,1.,数据组成差别,-,数据时间范围差,别,别,一般来讲,操作,型,型数据库只会存,放,放,90,天以内的数据,,而,而分析型数据库,存,存放的则是数年,内,内的数据。这点,也,也是将操作型数,据,据和分析型数据,进,进行物理分离的,主,主要原因。,2.,数据组成差别,-,数据细节层次差,别,别,操作型数据库存,放,放的主要是细节,数,数据,而分析型,数,数据库中虽然既,有,有细节数据,又,有,有汇总数据,但,对,对于用户来说,,重,重点关注的是汇,总,总数据部分。,操作型数据库中,自,自然也有汇总需,求,求,但汇总数据,本,本身不存储而只,存,存储其生成公式,。,。这是因为操作,型,型数据是动态变,化,化的,因此汇总,数,数据会在每次查,询,询时动态生成。,而对于分析型数,据,据库来说,因为,汇,汇总数据比较稳,定,定不会发生改变,,,,而且其计算量,也,也比较大,(,因为时间跨度大,),,因此它的汇总,数,数据可考虑事先,计,计算好,以避免,重,重复计算。,3.,数据组成差别,-,数据时间表示差,别,别,操作型数据通常,反,反映的是现实世,界,界的当前状态;,而,而分析型数据库,既,既有当前状态,,还,还有过去各时刻,的,的快照,分析型,数,数据库的使用者,可,可以综合所有快,照,照对各个历史阶,段,段进行统计分析,。,。,4.,技术差别,-,查询数据总量和,查,查询频度差别,操作型查询的数,据,据量少而频率多,,,,分析型查询则,反,反过来,数据量,大,大而频率少。要,想,想同时实现这两,种,种情况的配置优,化,化是不可能的,,这,这也是将两类数,据,据库物理分隔的,原,原因之一。,5.,技术差别,-,数据更新差别,操作型数据库允,许,许用户进行增,,删,删,改,查;分,析,析型数据库用户,则,则只能进行查询,。,。,6.,技术差别,-,数据冗余差别,数据的意义是,什,什么?就是减,少,少数据冗余,,避,避免更新异常,。,。而如,5,所述,分析型,数,数据库中没有,更,更新操作。因,此,此,减少数据,冗,冗余也就没那,么,么重要了。,7.,功能差别,-,数据读者差别,操作型数据库,的,的使用者是业,务,务环境内的各,个,个角色,如用,户,户,商家,进,货,货商等;分析,型,型数据库则只,被,被少量用户用,来,来做综合性决,策,策。,8.,功能差别,-,数据定位差别,这里说的定位,,,,主要是指以,何,何种目的组织,起,起来。操作型,数,数据库是为了,支,支撑具体业务,的,的,因此也被,称,称为,面向应用型数,据,据库,;分析型数据,库,库则是针对各,特,特定业务主题,域,域的分析任务,创,创建的,因此,也,也被称为,面向主题型数,据,据库,。,数据仓库的定,义,义,:,数据,仓库,英文名,称,称为,DataWarehouse,,可简写为,DW,或,DWH,。数据仓库,是,为,为企业所有级,别,别的决策制定,过,过程,提供所,有,有类型数据支,持,持的战略集合,。,。它是单个数,据,据存储,出于,分,分析性报告和,决,决策支持目的,而,而创建。为,需,需要业务智能,的,的企业,提供,指,指导业务流程,改,改进、监视时,间,间、成本、质,量,量以及控制。,面向分析的存,储,储系统,或者,叫,叫做面向主题,型,型数据库。,数据仓库的特,点,点,1.,面向主题(主,要,要特点),面向主题特性,是,是数据仓库和,操,操作型数据库,的,的根本区别。,操,操作型数据库,是,是为了支撑各,种,种业务而建立,,,,而分析型数,据,据库则是为了,对,对从各种繁杂,业,业务中抽象出,来,来的分析主题,(,如用户、成本,、,、商品等,),进行分析而建,立,立。,2.,集成性,集成性是指数,据,据仓库会将不,同,同源数据库中,的,的数据汇总到,一,一起。,3.,企业,范,范围,数据,仓,仓库,内,内的,数,数据,是,是面,向,向公,司,司全,局,局的,。,。比,如,如某,个,个主,题,题域,为,为成,本,本,,则,则全,公,公司,和,和成,本,本有,关,关的,信,信息,都,都会,被,被汇,集,集进,来,来。,4.,历史,性,性,较之,操,操作,型,型数,据,据库,,,,数,据,据仓,库,库的,时,时间,跨,跨度,通,通常,比,比较,长,长。,前,前者,通,通常,保,保存,几,几个,月,月,,后,后者,可,可能,几,几年,甚,甚至,几,几十,年,年。,5.,时变,性,性,时变,性,性是,指,指数,据,据仓,库,库包,含,含来,自,自其,时,时间,范,范围,不,不同,时,时间,段,段的,数,数据,快,快照,。,。有,了,了这,些,些数,据,据快,照,照以,后,后,,用,用户,便,便可,将,将其,汇,汇总,,,,生,成,成各,历,历史,阶,阶段,的,的数,据,据分,析,析报,告,告。,数据,仓,仓库,与,与数,据,据库,的,的联,系,系与,区,区别,不,不同,二者,的,的联,系,系:,数据,仓,仓库,的,的出,现,现,,并,并不,是,是要,取,取代,数,数据,库,库。,大,大部,分,分数,据,据仓,库,库还,是,是用,关,关系,数,数据,库,库管,理,理系,统,统来,管,管理,的,的。,可,可以,说,说,,数,数据,库,库、,数,数据,仓,仓库,相,相辅,相,相成,、,、各,有,有千,秋,秋。,二者,的,的区,别,别:,1,、出,发,发点,不,不同,:,:数,据,据库,是,是面,向,向事,务,务的,设,设计,;,;数,据,据仓,库,库是,面,面向,主,主题,设,设计,的,的。,2,、存,储,储的,数,数据,不,不同,:,:数,据,据库,一,一般,存,存储,在,在线,交,交易,数,数据,;,;数,据,据仓,库,库存,储,储的,一,一般,是,是历,史,史数,据,据。,3,、设,计,计规,则,则不,同,同:,数,数据,库,库设,计,计是,尽,尽量,避,避免,冗,冗余,,,,一,般,般采,用,用符,合,合范,式,式的,规,规则,来,来设,计,计;,数,数据,仓,仓库,在,在设,计,计是,有,有意,引,引入,冗,冗余,,,,采,用,用反,范,范式,的,的方,式,式来,设,设计,。,。,4,、提,供,供的,功,功能,不,不同,:,:数,据,据库,是,是为,捕,捕获,数,数据,而,而设,计,计,,数,数据,仓,仓库,是,是为,分,分析,数,数据,而,而设,计,计,,5,、基,本,本元,素,素不,同,同:,数,数据,库,库的,基,基本,元,元素,是,是事,实,实表,,,,数,据,据仓,库,库的,基,基本,元,元素,是,是维,度,度表,。,。,6,、容,量,量不,同,同:,数,数据,库,库在,基,基本,容,容量,上,上要,比,比数,据,据仓,库,库小,的,的多,。,。,7,、服,务,务对,象,象不,同,同:,数,数据,库,库是,为,为了,高,高效,的,的事,务,务处,理,理而,设,设计,的,的,,服,服务,对,对象,为,为企,业,业业,务,务处,理,理方,面,面的,工,工作,人,人员,;,;数,据,据仓,库,库是,为,为了,分,分析,数,数据,进,进行,决,决策,而,而设,计,计的,,,,服,务,务对,象,象为,企,企业,高,高层,决,决策,人,人员,。,。,数据,仓,仓库,的,的组,成,成,数据,库,库,数据,抽,抽取,工,工具,元数,据,据,访问,工,工具,数据,集,集市,数据,仓,仓库,管,管理,工,工具,信息,发,发布,系,系统,数据,仓,仓库,数,数据,库,库,数据,仓,仓库,系,系统,中,中的,数,数据,库,库是,整,整个,数,数据,仓,仓库,系,系统,的,的核,心,心,,是,是数,据,据信,息,息存,放,放的,地,地方,,,,对,数,数据,提,提供,存,存取,和,和检,索,索支,持,持。,相,相对,于,于传,统,统数,据,据库,来,来说,,,,它,突,突出,的,的特,点,点是,对,对海,量,量数,据,据的,支,支持,和,和快,速,速的,检,检索,技,技术,。,。,数据,抽,抽取,工,工具,数据,抽,抽取,工,工具,把,把数,据,据从,各,各种,各,各样,的,的存,储,储环,境,境中,提,提取,出,出来,,,,进,行,行必,要,要的,转,转化,、,、整,理,理,,再,再存,放,放到,数,数据,仓,仓库,中,中。,对,对各,种,种不,同,同的,数,数据,存,存储,方,方式,的,的访,问,问能,力,力是,数,数据,抽,抽取,工,工具,的,的关,键,键,,数,数据,转,转换,通,通常,包,包括,:,:,删除,对,对决,策,策分,析,析没,有,有意,义,义的,数,数据,转换,成,成统,一,一的,数,数据,名,名称,和,和定,义,义,计算,统,统计,和,和衍,生,生数,据,据,填补,缺,缺失,数,数据,统一,不,不同,的,的数,据,据定,义,义方,式,式,元数,据,据,元数,据,据是,描,描述,数,数据,仓,仓库,内,内数,据,据的,结,结构,和,和建,立,立方,法,法的,数,数据,。,。元,数,数据,(,(,Metadata,)是,描,描述,数,数据,的,的数,据,据,。,。,在关,系,系数,据,据库,中,中,,数,数据,是,是存,放,放在,表,表中,的,的,,表,表结,构,构的,定,定义,、,、关,于,于结,构,构的,描,描述,就,就是,元,元数,据,据。,在,在数,据,据仓,库,库中,,,,元,数,数据,就,就是,定,定义,数,数据,仓,仓库,对,对象,的,的数,据,据。,元数,据,据分,为,为:,技术,元,元数,据,据,业务,元,元数,据,据,技术,元,元数,据,据,技术,元,元数,据,据是,系,系统,的,的开,发,发和,管,管理,人,人员,使,使用,的,的、,描,描述,数,数据,的,的技,术,术细,节,节的,元,元数,据,据。,主,主要,包,包括,:,:,数据,仓,仓库,结,结构,的,的描,述,述,仓库,模,模式,、,、视,图,图、,维,维、,层,层次,结,结构,、,、导,出,出数,据,据的,定,定义,,,,以,及,及数,据,据集,市,市的,位,位置,和,和内,容,容,操作元数据,包括数据血统,(data lineage),、数据类别,(currency of data),,以及监视信息,汇总用的算法,由操作环境到数,据,据仓库的映射,关于系统性能的,数,数据,索引,数据刷新,、,、更新或复制事,件,件的调度和定时,数据仓库的组成,业务元数据(商,务,务元数据),从业务角度描述,了,了系统中的数据,,,,是介于使用者,和,和真实系统之间,的,的语义层,使得,不,不懂计算机技术,的,的业务人员也能,够,够“理解”系统,中,中的数据。,业务元数据主要,包,包括:,用户的业务术语,和,和它们表达的数,据,据模型信息,对象名称及其属,性,性,数据的来源信息,和,和数据访问的规,则,则信息。,商务术语和定义,、,、数据拥有者信,息,息、收费政策等,元数据的作用,元数据与数据一,起,起,构成了数据,仓,仓库中的数据模,型,型,元数据所描,述,述的更多的是这,个,个模型的结构方,面,面的信息。,在数据仓库中,,元,元数据的主要用,途,途包括:,用作目录,帮助,决,决策支持系统分,析,析者对数据仓库,的,的内容定义,作为数据仓库和,操,操作性数据库之,间,间进行数据转换,时,时的映射标准,帮助业务人员和,技,技术
点击显示更多内容>>

最新DOC

最新PPT

最新RAR

收藏 下载该资源
网站客服QQ:3392350380
装配图网版权所有
苏ICP备12009002号-6