- 1、本文档共33页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库设计课件
数据仓库设计 内容提要 数据仓库的开发过程 数据仓库设计步骤 数据仓库的概念设计 概念设计步骤 星型模型 数据仓库的开发 与数据库应用系统的开发过程相比,有如下几方面不同: 面向的处理类型不同; 面向的需求不同; 系统设计的目标不同; 两者的数据来源或系统的输入不同; 系统设计的方法和步骤不同; 数据库应用开发过程——SDLC 数据仓库的开发过程——CLDS 数据仓库开发的特点:数据驱动 数据驱动 :从已有数据出发的数据仓库设计方法称为“数据驱动”的系统设计方法。 利用以前所取得的工作成果 不再是面向应用 利用数据模型 数据模型是联系操作型数据环境的设计、数据仓库数据环境的设计、操作型数据处理应用的开发和设计以及DSS应用的开发与设计的纽带 数据仓库的螺旋式开发方法 数据仓库实现策略 开发策略主要有: 自顶向下:实际应用比较困难 。 自底向上:用于一个数据集市或一个部门的数据仓库开发 ,容易获得成功 。 两种策略的联合使用 :能够快速地完成数据仓库的开发与应用,而且还可以建立具有长远价值的数据仓库方案。在实际使用中难以操作 。 数据仓库的结构 数据仓库的应用结构 基于业务处理系统的数据仓库 单纯数据仓库 单纯数据集市 数据仓库和数据集市 数据仓库的技术平台结构 单层结构 客户/服务器两层结构 三层客户/服务器 多层式结构 数据仓库使用方案和项目规划预算 数据仓库使用方案 最终用户的决策支持要求 数据仓库的技术要求 开发方案的预算进行估计 编制数据仓库开发说明书 说明系统与企业战略目标的关系,系统与企业急需处理的、范围相对有限的开发机会。 业务机会的说明以及任务概况说明、重点支持的职能部门和今后工作的建议。 计划中需要阐明期望取得的有形和无形利益 规划书中要确定数据仓库的开发目标实现范围、体系结构和使用方案及开发预算。 数据仓库的设计步骤 数据仓库的设计步骤 1.概念模型设计:界定系统边界、确定主要的主题域 2.技术准备工作:技术评估和环境的准备 3.逻辑模型设计:确定要装载的主题、粒度层次划分、数据分割策略、关系模式定义和记录系统定义 数据仓库的设计步骤 4.物理模型设计:确定数据的存储结构、索引策略、数据存放位置和存储分配 5.数据仓库生成:设计接口和将数据装入 6.数据仓库运行与维护:开发决策支持系统DSS的应用;进一步理解需求,调整和完善数据仓库系统,维护数据仓库; 概念模型设计 概念模型的设计阶段: 用户需求调查 模型定义 模型分析 模型设计 概念模型的需求调查 数据仓库开发的任务书 首先要明确用户的信息需求 了解管理人员在信息需求方面的内容 了解关于信息的来源 组织所使用的系统环境 概念模型的定义 数据仓库用户的决策分析 支持决策的数据需求分析 数据需求分析工具:CRUD矩阵 C:Create产生; R:Read引用; U:Update更新; D:Delete删除。 例:了解用户的决策分析问题 CRUD矩阵 企业业务处理系统数据存储表 概念模型的分析 简单的概念模型的缺陷 仅从数据模型的角度,会产生“平面”的效应; 实体之间不会是简单的对等的关系; 实体的三维透视 某些实体的数据载入量要远远大于其他实体; 星型模型 利用星型模型对要载入大量数据的实体进行管理; 产生大量数据的实体处于中央,称之为事实表; 其他实体处于周围,称之为维度表; 事实表包含了独有的标识数据,也包含了实体本身的独有数据; 事实表还包含了指向其周围的表—维表的外键; 如果非外键的信息经常被事实表使用,那么星型连接内的非外键信息将会伴随外键的关系共同存在。 例:星型模型例子 星型模型 星型模型中使用的表示方法 指标实体 (事实实体) 星型模型 文本数据常出现在维表中,数值数据常出现在事实表中; 星型连接的好处是为决策支持系统的处理优化了数据; 数据预连接; 建立有选择的数据冗余; 传统数据模型和星型连接的配合 传统数据模型应用于维表即数据不多的实体; 星形连接应用于事实表(即数据量大的实体); 文本数据与数值数据 数据模型依然是数据仓库的设计基础 概念模型的设计 雪花模型 概念模型设计文档 概念模型设计文档 数据仓库开发需求分析报告 概念模型分析报告 概念模型 概念模型的评审报告。 概念模型的评审 概念模型的评审人员 概念模型的评审内容 数据仓库开发任务书; 用户决策分析信息需求调查表; 数据仓库主题; E-R图、星型模型和雪花模型。 经济 (年收入) 100万以上 10万以上 1万以上 地点 国家 省 市 销售 销售ID 销售数量 销售价格 销售金额 时间ID 地点ID 商品ID 年龄 60岁以上 40岁以上 30岁以上 20岁以上 20岁以下 日期 年 月 日 商品ID 种类 小类 商品
文档评论(0)