第3章 多维数据分析基础与方法.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第3章 多维数据分析基础与方法

* 3.6 多维数据的存储方式 ROLAP ROLAP的数据与计算结果直接由原来的关系数据库取得。 ROLAP将支撑多维数据的原始数据、多维数据集数据、汇总数据和维度数据都存储在现有的关系数据库中,并用独立的关系表来存放聚集数据。 不存储源数据副本,占用的磁盘空间最少,但存取速度也比较低。 * 3.6 多维数据的存储方式 MOLAP MOLAP使用多维数组存储数据,它是一种高性能的多维数据存储格式。 多维数据在存储中将形成“立方体”的结构。MOLAP存储模式将数据与计算结果都存储在立方体结构中,并存储在分析服务器上。 该结构在处理维度时创建。 存取速度最快,查询性能最好,但占用磁盘空间较多。 * 3.6 多维数据的存储方式 HOLAP ROLAP与MOLAP存储方式的结合。 原始数据和ROLAP一样存储在原来的关系数据库中,而聚合数据则以多维的形式存储分析服务器。 优点: 既能与关系数据库建立连接,同时又利用了多维数据库的性能优势。 缺点 是在ROLAP和MOLAP系统之间的切换会影响它的效率。 * 3.6 多维数据的存储方式 内容 MOLAP ROLAP HOLAP 源数据的副本 有 无 无 占用分析服务器存 储空间 大 小 小 使用多维数据集 小 较大 大 数据查询 快 慢 慢 聚合数据的查询 快 慢 快 使用查询频度 经常 不经常 经常 三种存储方式的比较 * 小结 多维数据集是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。 度量值是决策者所关心的具有实际意义的数值,事实表。 维度是人们观察数据的角度,纬度表。 维的级别是维度的不同的细节程度。 维度成员是维的一个取值。 数据集合的常用操作有上卷、下钻、切片、切块和转轴。 维度表和事实表的连接方式主要有星型架构、雪花型架构以及星型雪花架构。 多维数据的存储模式有ROLAP、MOLAP和HOLAP。 * 第3章 多维数据分析基础与方法 3.1 数据仓库的体系结构 3.2 数据仓库的分类 3.3多维数据分析基础 3.4多维数据分析方法 3.5维度表与事实表的连接 3.6多维数据的存储方式 小结 * 3.1 数据仓库的体系结构 数据仓库体系结构示意图 * 3.1数据仓库体系结构 元数据(Metadata) 定义 描述数据仓库内数据的结构和建立方法的数据,即:定义数据的数据。 元数据是数据仓库的应用灵魂,没有元数据就没有数据仓库。 分类 技术元数据(Technical Metadata) 数据源信息、数据转换的描述、数据仓库内对象和数据结构的定义(多维数据库、立方体、时间维等) 商业元数据(Business Metadata) 业务主题的描述、包含的数据、查询、报表等。 * 3.1数据仓库体系结构 数据集市(Data Marts) 定义 为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也称部门数据或主题数据。 如:财务部门的数据集市 与数据仓库的关系 数据仓库是基于整个企业的数据模型建立的,它面向企业范围内的主题。而数据集市是按照某一特定部门的数据模型建立的。 * 3.1数据仓库体系结构 数据集市(Data Marts)(续) * 3.1数据仓库体系结构 数据集市(Data Marts)(续) 特性 规模小 特定的应用 面向部门 由业务部门定义,设计和开发 由业务部门管理和维护 快速实现 购买较便宜 投资快速回收 更详细的、预先存在的数据仓库的摘要子集 可升级到完整的数据仓库 * 3.2 数据仓库的分类 分类 标准数据仓库 以整个企业而构建 数据集市 针对某一主题或某个部门而建构的数据仓库 多层数据仓库 标准数据仓库与数据集市的一种组合应用方式 联合式数据仓库 包含多个数据仓库或是数据集市系统,也可以包含多层数据仓库 * 3.3 多维数据分析基础 多维数据分析(OLAP) 概念: 以海量数据为基础的复杂数据分析技术,侧重决策支持。 与OLTP的区别 面向对象不同 操作不同 * 3.3 多维数据分析基础 多维数据集(Cube) 概念 是一个数据集合,通常从数据仓库的子集构造,并组织和汇总成一个由一组维度和度量值定义的多维结构。 特性 多维,也称作立方体(Cube), 提供一种便于使用的查询数据的机制。 * 3.3 多维数据分析基础 度量值(Measure) 度量值是一组值,是客户发生事件或动作的事实记录。 如: 客户打电话,记录次数和费用等; 超市客户销售,记录销售数量、金额等等。 度量值所在的表称为事实数据表,常规多维数据集的结构中只能有一个事实数据表。 * 3.3 多维数据分析基础 维度(Dimension) 维度(也简称为维)是人们观察数据的角度。 例如,时间维,地区维等。

文档评论(0)

ligennv1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档