- 1、本文档共70页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5章数据管理技术
在线分析处理的概念 一、. OLAP的概念与操作 1、OLAP的概念 A.变量:变量是数据的实际意义,它主要描述数据“是什么”。 B.维:维是人们观察数据的特定角度。是考虑问题时的一类属性,该类属性的集合就构成一个维(时间维、地理维等)。 C.维的层次:人们观察数据的某个特定角度(即某个维)还可以存在细节程度不同的多个描述方面,这时称这多个描述方面为维的层次。(时间维:日期、月份、季度、年)。 * D.维成员:维的一个取值称为该维的一个维成员、如果一个维是多层次的,那么该维的维成员是由各个不同维层次的取值组合而成。 E.多维数组:一个多维数组可以表示为:维1,维2,…,维n,变量。(时间,地区,产品,销售额) F.数据单元(单元格)。多维数组的取值称为数据单元。(2000年1月,上海,笔记本电脑,$100000) * 2、OLAP的基本操作 OLAP的基本操作是指对以多维形式组织起来的数据采取切片、切块、旋转等各种分析动作,以求剖析数据,使最终用户能从多个角度、多侧面地观察数据仓库中的数据,从而深入地了解包含在数据中的信息和内涵。 A.多维的切片:在多维分析过程中,如果对多维数据集的某个维选定某一维成员,这种选择操作就称为切片。 * 在切片的概念中,有以下两个重要的概念必须掌握: 多维数据集的切片数量多少是由所选定的那个维的维成员数量的多少所决定的。 进行切片操作的目的是使人们能够更好地了解多维数据集,通过切片的操作可以降低多维数据集的维度,可使人们将注意力集中在较少的维度下进行观察。 * OLAP的分析方法(一)切片、切块 * OLAP的分析方法(二)钻取 按时间维向下钻取 按时间维向上卷取 60 1995年 * OLAP的分析方法(三)旋转 * 2002年 2003年 1季度 2季度 3季度 4季度 1季度 2季度 3季度 4季度 北京市 123 56 45 66 134 56 23 55 上海市 134 103 98 87 102 139 97 82 天津市 67 73 59 96 73 69 62 94 ? 北京市 上海市 天津市? 2002年 1季度 123 134 67? ? 2季度 56 103 73? ? 3季度 45 98 59? ? 4季度 66 87 96 2003年 1季度 134 102 73? ? 2季度 56 139 69? ? 3季度 23 97 62 ? 4季度 55 82 94 * 5.3 数据仓库与分析处理(续) 5.3.3 在线分析处理(OLAP)(续) 在线分析处理主要完成以下一些功能: 给出数据仓库中数据的多维的逻辑视图; 通常包含交互式查询和对数据的分析; 提供分析的建模功能; 在各个维度上对数据进行多层次的概括统计,并能够实现不同维度的交叉概括计算; 支持功能模型以进行预测、趋势分析和统计分析; 检索并显示二维或三维表格、图表和图形化的数据,并且应该能够容易地变换基准轴; 迅速响应查询; 具有多维数据存储引擎,按阵列存储数据,这些阵列是商业维的逻辑表示。 * 本章主要知识点回顾 * 数据库的两个主要目标: 减少数据冗余 以及获得数据独立性。 ER模型的含义及其基本图形元素: ER模型通过实体、关系和属性这三个方面来对现实世界中的对象进行描述。 数据仓库的含义: 即把一个组织中的历史数据收集到一个中央仓库中以便于处理;是支持决策过程的、面向主题的、集成的、随时间而变的、持久的数据集合。 OLAP完成的主要功能: 给出数据仓库中数据的多维的逻辑视图;通常包含交互式查询和对数据的分析;提供分析的建模功能;在各个维度上对数据进行多层次的概括统计,并能够实现不同维度的交叉概括计算;支持功能模型以进行预测、趋势分析和统计分析;检索并显示二维或三维表格、图表和图形化的数据,并且应该能够容易地变换基准轴…… 作业 P100 4. ER模型具有哪些基本的图形元素?如何能将ER模型转换为关系数据库的结构? 6. 什么是数据仓库?数据仓库与数据库有何区别与联系?什么是在线分析处理(OLAP)?在线分析处理与数据仓库具有怎样的关系? * END * 5.2 数据库与数据管理(续) 5.2.4 ER模型(续) 属性 属性用来描述实体的性质,例如,一个教师实体就是通过姓名、ID#(工作证号)、性别、生日、地址以及薪水来进行描述的; ER图中用椭圆表示属性,属性名称放在椭圆中; 关键属性的值能对实体进行唯一标识;ER图中关键属性在属性名称下加下划线。 * 图 5?7 一个大学的ER图 * 5.2 数据库与数据管理(续) 5.2.4 ER模型(续) 属性(续) 分为六类: 单值属性(single-va
文档评论(0)