数据仓库解释讲述.pptx

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库解释讲述

数据仓库 定义 数据仓库 数据仓库是一个面向主题的、集成的、稳定的、反映历史变化的、随着时间的流逝发生变化的数据集合。它主要用来支持企业管理人员的决策分析。 数据集市 也叫数据市场,是一个从操作的数据和其他的为某个特殊的专业人员团体服务的数据源中收集数据的仓库。从范围上来说,数据是从企业范围的数据库、数据仓库,或者是更加专业的数据仓库中抽取出来的。数据中心的重点就在于它迎合了专业用户群体的特殊需求,在分析、内容、表现,以及易用方面。数据中心的用户希望数据是由他们熟悉的术语表现的。 数据集市类型 独立型数据集市 从属型数据集市 操作型数据库 抽取 数据集市 操作型数据库 数据仓库 数据集市 数据仓库与数据集市区别 数据仓库 数据集市 数据来源 外部数据 数据仓库 范围 企业级 部门或者工作组级 主题 企业主题 部门或者特殊的分析主题 数据粒度 最细粒度 较粗的粒度 数据结构 规范化结构(第3范式) 星型模式、雪花模式或两者混合 历史数据 大量历史数据 适度的历史数据 优化 处理海量数据 数据探索 便于访问分析 快速查询 索引 高度索引 高度索引 数据仓库系统与数据库生产系统的区别 数据库生产系统 数据仓库系统 面向应用、事务处理 实时性高 数据检索量少 只存储当前数据 访问频率高 响应时间1s以下 用户并发高 面向主题,分析型处理数据 实时性要求不高 数据检索量大 存储大量的历史数据和当前数据 访问频率中、低 响应时间几秒或更长 用户并发低 分析型数据库 定义 OLAP 联机分析处理(On- Line Analytical Processing, OLAP) 是一类软件技术,它针对特定问题的联机数据访问和分析,可使决策者通过对信息的多种观察角度进行快速、一致和交互的存取,以获得对信息的深入理解。,通过对信息的 多种观察形式进行交互存取。 Cube Cube是多维立方体的简称,主要用于支持联机分析应用(OLAP),为企业决策提供支持。Cube就象一个坐标系,每一个Dimension代表一个坐标轴,要想得到一个点,就必须在每一个坐标轴上取的一个值,而这个点就是Cube中的Cell。 CUBE基本概念 时间 2011 2010 ∑(2010,x) ∑(一季度,x) ∑(1月份,x) ∑(2月份,x) ∑(3月份,x) 一季度 二季度 三季度 四季度 一季度 二季度 时间 2011 2012 ∑(2012,手机数码,x) 2010 2011 2012 广州 上海 北京 家用电器 手机数码 电脑办公 手机数码 电脑办公 时间 产品 产品 (2010,电脑办公,广州,x) 地区维度 时间维度 产品维度 ① ② ③ 2012 基本 单元 2010 电脑办公 时间层次结构 ∵年 ∵季度 ∵月 ∵日 广州 产品 时间 产品类别 产品 城市 CUBE星型模式 时间维度 产品维度 地区维度 用户多维数据视图 销售记录号(PK) 日期编号(FK) 地区编号(FK) 产品编号(FK) 销量 …… 日期编号(PK) 月 季度 年 地区编号(PK) 省 市 县 产品编号(PK) 类别 规格 生产日期 产地 …… 定义 一种使用关系数据库实现多维分析空间的模式,称为星型模式。星型模式的基本形式必须实现多维空间(常常被称为方块),以使用关系数据库的基本功能。 星型结构示意图 CUBE雪花型模式 时间维度 产品维度 地区维度 用户多维数据视图 销售记录号(PK) 日期编号(FK) 地区编号(FK) 产品编号(FK) 销量 …… 日期编号(PK) 月 季度 年 地区编号(PK) 省 市 县 产品编号(PK) 产品类别(FK) 规格 生产日期(FK) 产地(FK) 雪花型结构示意图 产品类别(PK) 时间维度 产品l类别维度 地区维度 定义 维度进行进一步规范化。我们不需要冗余的维度表,这只会使数据切片变得更加复杂。 这种过程中我们得到的模式被称为雪花模式。 CUBE基本操作——钻取、卷起 一季度 二季度 三季度 家用电器 手机数码 电脑办公 广州 上海 北京 7月份 8月份 9月份 家用电器 手机数码 电脑办公 广州 上海 北京 定义 钻取(Drill-down): 卷起(Roll-up): 钻取 卷起 第三季度 多维数据集 多维数据集—钻取 CUBE基本操作——切片、切块 一季度 二季度 三季度 家用电器 手机数码 电脑办公 广州 上海 北京 家用电器 手机数码 电脑办公 广州 上海 北京 定义 切片(Slice):在多维分析过程中,如果对多维数据集的某个维选定某一维成员,这种选择操作就称为切片。 切块(Dice):在多维分析过程中,如果对多维数据集的某个维选定多个维成员,这种选择操作就称为切块。 一季度 二季度 三季度 广州 上海 北京 一季度 二季度 三季度

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档