第13章联机分析处理(OLAP)技术完成.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第13章联机分析处理(OLAP)技术完成精要

第13章联机分析处理(OLAP)技术 13.1 什么是OLAP 13.2 多维数据模型 13.3 OLAP的实现 13.4 小结 13.1 什么是OLAP OLAP(On_Line Analytical Processing)即联机分析处理,是以海量数据为基础的复杂分析技术。 OLAP概念是由 E.F.Codd于1993年提出的。 OLAP软件提供的是多维分析和辅助决策功能。对于深层次的分析和发现数据中隐含的规律和知识,则需要数据挖掘(Data Mining)技术和相应的数据挖掘软件来完成。 13.2 多维数据模型 变量(Measure) 变量也称度量,是数据的实际意义,即描述数据“是什么”。例如:数据“10000”本身并没有意义或者说意义未定,它可能是一个学校的学生人数,也可能是某产品的单价,还可能是某商品的销售量等。一般情况下,变量是一个数值的度量指标,例如:“人数”、“单价”、“销售量”等都是变量或称为度量,而“10000万元”则是变量的一个值,销售量10000万元常称为度量值。 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.1 基本概念 13.2 多维数据模型 13.2.2 多维分析的基本操作 13.2 多维数据模型 13.2.2 多维分析的基本操作 13.2 多维数据模型 13.2.2 多维分析的基本操作 13.2 多维数据模型 13.2.2 多维分析的基本操作 13.2 多维数据模型 13.2.2 多维分析的基本操作 13.2 多维数据模型 时间维 13.2 多维数据模型 13.2.2 多维分析的基本操作 13.2 多维数据模型 13.2.2 多维分析的基本操作 13.2 多维数据模型 13.2.2 多维分析的基本操作 13.3 OLAP的实现 MOLAP结构直接以多维立方体CUBE来组织数据,以多维数组来存储数据,支持直接对多维数据的各种操作。人们也常常称这种按照多维立方体来组织和存储的数据结构为多维数据库( Multi-Dimension DataBase,简记为MDDB)。Arbor公司的Essbase是一个MOLAP服务器。MOLAP结构的系统环境如图13.8所示。 13.3 OLAP的实现 13.3.1 MOLAP结构 13.3 OLAP的实现 MOLAP如何以多维立方体Cube来组织数据的呢?前面我们已经讲解了多维立方体Cube的数据单元可以表示为:(维1维成员,维2维成员 ,··· ,维n维成员,度量值)。多维数组只存储Cube的度量值,维值由数组的下标隐式给出。关系表则维值和度量值都存储。 13.3 OLAP的实现 首先,和关系表相比,多维数据库组只存储Cube的度量值。例如图13.1中只存储销售量的值(在表的之间),不存储地区维和商品维的维成员值。多维数组的存储效率高;其次,多维数组可以通过数组的下标直接寻址,和关系表(通过表中列的内容寻址,常常需要索引或全表扫描)相比,它的访问速度快。更重要的是,多维数组有着高速的综合速度,因此可以较好地支持向上综合、向下钻取等多维分析操作。 13.3 OLAP的实现 多维数组存储方式存在如下不足: 1. 多维数组的物理存放方式通常是按照某个预定的维序线性存放的,不同维的访问效率差别很大。以图13-9(b)二维数组为例,如果按行存放的话,则访问某电器产品的销售额时,效率很高,因为一次I/O读取的页面包含了多个行值;但访问某地区的销售额时,效率就会降低。 13.3 OLAP的实现 2. 在数据稀疏的情况下,即Cube的许多数据单元(维1维成员,维2维成员 ,···,维n维成员,度量值)上无度量值,多维数组由于大量无效值的存在,存储效率会下降。 13.3 OLAP的实现 13.3.2 ROLAP结构 ROLAP将多维立方体结构划分为两类表,一类是事实(Fact)表,另一类是维表。事实表用来描述和存储多维立方体的度量值及各个维的码值;维表用来描述维信息,包括维的层次及成员类别等。ROLAP用关系数据库的二维表来表示事实表和维表。也就是说ROLAP用“星型模式”和“雪片模式”来表示多维数据模型。 13.3 OLAP的实现 13.3.2 ROLAP结构 同MOLAP相比,关系数据库表达多维立方体

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档