第2章联机分析处理.ppt

  1. 1、本文档共39页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第2章联机分析处理

第2章 联机分析处理 2.1联机分析处理概念 2.1.1 OLAP的定义 定义1:OLAP(联机分析处理)是针对特定问题的联机数据访问和分析。通过对信息(这些信息已经从原始的数据进行了转换,以反映用户所能理解的企业的真实的“维”)的很多种可能的观察形式进行快速、稳定一致的交互性的存取,允许管理决策人员对数据进行深入观察。 定义2(OLAP理事会的定义):OLAP(联机分析处理)是一种软件技术,他使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的,这些信息是从原始数据直接转换过来的,他们以用户容易理解的方式反映企业的真实情况。 2.1.2 OLAP的基本概念 变量:变量是数据的实际意义,即描述数据“是什么”。例如:数据“10000”本身没有意义或者说意义未定,它可能是一个学校的学生人数,也可能是某产品的单价,还可能是某商品的销售量,等等。一般情况下,变量总是一个数值度量指标,例如:“人数”、“单价”、“销售量”等都是变量,而“10000”则是变量的一个值。 维:是人们观察数据的特定角度,是考虑问题时的一类属性,属性集合构成一个维。例如,企业常常关心产品销售数据随着时间推移而产生的变化情况,这时他是从时间的角度来观察产品的销售,所以时间就是一个维(时间维)。企业也时常关心自己的产品在不同地区的销售分布情况,这时他是从地理分布的角度来观察产品的销售,所以地理分布也是一个维(地理维)。 维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的各个描述方面,我们称这多个描述方面为维的层次。一个维往往具有多个层次,例如描述时间维时,可以从日期、月份、季度、年等不同层次来描述,那么日期、月份、季度、年等就是时间维的层次;同样,城市、地区、国家等构成了地理维的多个层次。 维的成员:维的一个取值称为该维的一个维成员。如果一个维是多层次的,那么该维的维成员是在不同维层次的取值的组合。 例如,我们考虑时间维具有日期、月份、年这三个层次,分别在日期、月份、年上各取一个值组合起来,就得到了时间维的一个维成员,即“某年某月某日”。一个维成员并不一定在每个维层次上都要取值,例如,“某年某月”、“某月某日”、“某年”等等都是时间维的维成员。对应一个数据项来说,维成员是该数据项在某维中位置的描述。例如对一个销售数据来说,时间维的维成员“某年某月某日”就表示该销售数据是“某年某月某日”的销售数据,“某年某月某日”是该销售数据在时间维位置的描述。 多维数组:维和变量的组合表示。一个多维数组可以表示为:(维1,维2,…,维n,变量)。例如图2-1所示的日用品销售数据是按时间、地区和销售渠道组织起来的三维立方体,加上变量“销售额”,就组成了一个多维数组(地区,时间,销售渠道,销售额)。如果我们在图的基础上扩展一个维,产品维,就得到一个四维的结构。 数据单元(单元格):多维数组的取值。当多维数组的各个维都选中一个维成员,这些维成员的组合就唯一确定了一个变量的值。那么数据单元就可以表示为:(维1维成员,维2维成员,……,维n维成员,变量的值)。例如,我们在地区、时间和销售渠道上各取维成员“北京”、“2006年12月”和“批发”,就唯一确定了变量“销售额”的一个值(假设为10000),则该数据单元可表示为:(北京,2006年12月,批发,10000)。 2.1.3 OLAP与OLTP的关系与比较 OLAP是以数据仓库为基础的,其最终数据来源与OLTP一样均来自地层的数据库系统,但由于二者面对的用户不同,OLTP面对的是操作人员和低层管理人员,OLAP面对的是决策人员和高层管理人员,因而数据的特点与处理也明显不同。(见表2-1) 2.1.4 OLAP准则 准则1 OLAP模型必须提供多维概念视图。 准则2 透明性准则。 准则3 存取能力准则。 准则4 稳定的报表性能。 准则5 客户/服务器体系结构。 准则6 维的等同性原则。 准则7 动态的稀疏矩阵处理准则 准则8 多用户支持能力准则 准则9 非受限的跨维操作 准则10 直观的数据操纵 准则11 灵活的报表生成 报表必须从各种可能的方面显示出从数据模型重综合出的数据和信息,充分反映数据分析模型的多维特征。例如表2-2报表形式,该表为一个四维(包括统计指标自身)报表,分析人员可以根据需要对各维进行旋转,汇总以及合并操作(如将季度维合并,变成三位报表等)。 表2-2 准则12 不受限维与聚集层次 2.2 OLAP的多维数据分析 2.2.1 OLAP的基本分析动作 ⒈数据切片 ⒉数据切块 数据切块就是将完整的数据立方体切取一部分数据而得到的新的说句立方体,如图2-7所示。 图2-8示例了一个具体数据切块的例子。假设问题同时间维、地理维、产品维相关,指定时间维的取值维1998

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档