网站大量收购独家精品文档,联系QQ:2885784924

数据仓库和数据挖掘deolap技术.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库和数据挖掘deolap技术

多维分析的基本分析动作 旋转 旋转即是改变一个报告或页面显示的维方向。 旋转示例 时间维 产品维 行列交换 产品维 时间维 (a) 多维分析的基本分析动作 旋转示例(续) 北京 上海 地区→ 销售量 销售量 产品 ↓ : : 时间 ↓ 第一季度 第二季度 第一季度 第二季度 北京 地区→ 时间→ 产品 ↓ 上海 …… : : 将某行维 换向列维 (b) 多维分析的基本分析动作 旋转示例(续) 时间维 产品维 地区维 时间维 地区维 产品维 旋转以改变 页面显示 (c) 多维分析的基本分析动作 上钻(drill-up) 上钻操作通过一个维的概念分层向上攀升或者通过维归约,在数据方体上进行聚集。 下钻(drill-down) 下钻是上钻的逆操作,它有不太详细的数据到更详细的数据。下钻可以通过沿维的概念分层向下或引入新的维来实现。 OLAP 的准则 OLAP模型必须提供多维概念视图 透明性准则 存取能力推测 稳定的报表能力 客户/服务器体系结构 维的等同性准则 动态的稀疏矩阵处理准则 多用户支持能力准则 非受限的跨维操作 直观的数据操纵 灵活的报表生成 不受限的维与聚集层次 OLAP实现 基于多维数据库的OLAP实现 基于关系数据库的OLAP实现 RDBMS与MDDB数据组织比较 产品名称 地区 销售量 冰箱 冰箱 冰箱 彩电 彩电 彩电 空调 空调 空调 东北 西北 华北 东北 西北 华北 东北 西北 华北 50 60 100 40 70 80 90 120 140 东北 西北 华北 冰箱 空调 彩电 50 60 100 40 70 80 90 120 140 (a) (b) RDBMS与MDDB 在综合数据存放上的比较 产品名称 地区 销售量 冰箱 冰箱 冰箱 冰箱 彩电 彩电 彩电 彩电 空调 空调 空调 空调 总和 总和 总和 总和 东北 西北 华北 总和 东北 西北 华北 总和 东北 西北 华北 总和 东北 西北 华北 总和 50 60 100 210 40 70 80 190 90 120 140 350 180 250 320 750 东北 西北 华北 总和 冰箱 空调 彩电 总和 50 60 100 210 40 70 80 190 90 120 140 350 180 250 320 750 (b) (a) RDBMS与MDDB比较 关系数据库采用关系来表达某产品在某地区的销售情况,而多维数据库中的数据组织形式采用了二维矩阵的形式。显然,二维矩阵比关系表达更清晰而且占用存储少。 关于综合数据:对关系表而言,当数据苦太大时,预先处理计算各种综合需要的时间过长,并且这样会破坏列定义的统一语义。 由于在MDDB中,数据可以直接按行或列累加,并且由于MDDB不象关系表那样重复出现产品和地区信息,因此其统计速度远超过RDBMS。 维的层次关系 地区总和 西北地区 东北地区 华北地区 简单层次关系的层次图 维的层次关系 地区总和 辽宁省 华北地区 东北地区 西北地区 沈阳市 大连市 黑龙江省 吉林省 维的层次关系 产品维 时间维 西北 陕西 甘肃 … : 宁夏 东北 黑龙江 吉林 辽宁 沈阳 大连 有关维的层次信息需要放在元数据中,这样系统在进行各种综合查询时,就能通过元数据的信息区分不同的维层次,从而正确的执行查询。 类 类是指按一定的划分标准对维成员全集的一个分类划分。用集合论的概念来讲,设全体维成员为一个全集,则类是该全集的一个划分。 产品维 东北 西北 华北 华南 … 东北 西北 华北 华南 … 按“产品”销地划分 按“产品”产地划分 维层次关系 类划分1 类划分2 维层次和类的区别 层次和类表达的意义不同 维层次表达的是维所描述的变量的不同综合层次。维层次越高,对应综合层次越高,粒度也越大。维层次越多,粒度层次也越丰富。表现在层次图中,父子结点的关系就是层次关系。 维成员的类表达则是某一子集维成员的共同特征。这个共同特征由类属性的某一个值来表征。表现在层次图中,父子结点之间不存在类的关系,同一层次的维成员才可以划分为类。 维层次和类的区别 在层次和类上进行的分析动作不同 在维层次关系上进行的分析主要有上卷和下钻两种,其分析路径就是层次图中从根到叶或从叶到根的一条路径。 按照维成员的类进行的分析主要有两个目的:分类和归纳。即首先选择某个属性来对维成员的全集进行分类,然后再在分类的基础上归纳总结出类的共同特征(或一类别区别与他类的特征)。表现在层次图

文档评论(0)

wangyueyue + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档