网站大量收购闲置独家精品文档,联系QQ:2885784924

(数据仓库设计.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(数据仓库设计

数据仓库设计 二、建立DW的两种方式 1.自顶向下型 “自顶向下”的开发策略是指对原来分散存储在企业各处的OLTP数据库中的有用数据通过提取、清洁、转换、聚集等处理步骤建立一个全局性数据仓库。这个全局的数据仓库将提供给用户一个一致的数据格式,一致的软件环境。从理论上说,决策支持所需的数据都应该包含在这个全局数据仓库中。数据集市中存储的数据是为某个部门的DSS应用而专门从全局数据仓库中提取的,它是全局数据仓库中数据的一个子集。在“自顶向下”的模式中,数据集市和数据仓库的关系是单方向的,即数据从数据仓库流向数据集市。 二、建立DW的两种方式 2.自下向上型 “自底向上”模式是从建立各个部门或特定的商业问题的数据集市开始,全局性数据仓库建立在这些数据集市的基础上。“自底向上”模式的特点是初期投资少,见效快,因为它在建立部门数据集市时只需要较少的人做决策,解决的是较小的商业问题。“自底向上”的开发模式可以使一个单位在数据仓库发展初期尽可能少地花费资金,也可以在做出有效的投入之前评估技术的收益情况。 ??? “平行开发”模式是指在一个全局性数据仓库的数据模型的指导下,数据集市的建立和全局性数据仓库的建立同时进行。在“平行开发”模式中由于数据集市的建立是在一个统一的全局数据模型的指导下进行的,可避免各部门在开发各自的数据集市时的盲目性,减少各数据集市之间的数据冗余和不一致。在“平行开发”模式中数据集市的这种相对独立性有利于全局性数据库的建设。一旦全局性数据仓库建立好后,各部门的数据集市将成为全局数据仓库的一个子集#全局数据仓库将负责为各部门已建成和即将要建的数据集市提供数据。 二、建立DW的两种方式 两种方式的比较: ‘自顶向下’ 的方法是在单个项目阶段中实现数据仓库,需要在项目开始时完成更多计划和设计工作。这就需要涉及参与数据仓库实现的每个工作组、 部门或业务线中的人员。要使用的数据源、安全性、数据结构、数据质量、数据标准和整个数据模型的有关决策一般需要在真正的实现开始之前就完成,建设规模往往较大,建设周期长,投资大。 二、建立DW的两种方式 两种方式的比较: ‘自下向上’的实现包含数据仓库的计划和设计,无需等待安置好更大业务范围的数据仓库设计。这并不意味着不会开发更大业务范围的数据仓库设计;随着初始数据仓 库实现的扩展,将逐渐增加对它的构建。现在,该方法得到了比自顶向下方法更广泛的接受,因为数据仓库的直接结果可以实现,并可以用作扩展更大业务范围实现的证明。 二、建立DW的两种方式 两种方式的比较: 一种折中方案: 每种实现方法都有利弊。在许多情况下,最好的方法可能是某两种的组合。该方法的关键之一就是确定业务范围的架构需要用于支持集成的计划和设计的程度,因为数据仓库是用自底向上的方法进行构建。在使用自底向上或阶段性数据仓库项目模型来构建业务范围架构中的一系列数据集市时,您可以一个接一个地集成不同业务 主题领域中的数据集市,从而形成设计良好的业务数据仓库。这样的方法可以极好地适用于业务。在这种方法中,可以把数据集市理解为整个数据仓库系统的逻辑子 集,换句话说数据仓库就是一致化了的数据集市的集合。这种方案的实施步骤通常分如下几步: (1) 从整个企业的角度定义计划和需求 (2) 构建完整的仓库体系结构 (3) 使数据内容一致而且标准化 (4) 将数据仓库作为一种超级数据集市来实施 随着数据仓库技术的发展 , 数据仓库的实现策略已从原先的“自顶向下”一种模式发展到了六种模式。 1 、“自顶向下”模式 2 、“自底向上”模式 3 、“平行开发”模式 为了解决用户需求变化的问题 , 在业界引入了三种模式。 4 、“有反馈的自顶向下”模式 5 、“有反馈的自底向上”模式 6 、“有反馈的平行开发”模式 三、数据仓库构建步骤 三、数据仓库构建步骤 1)收集和分析业务需求; 2)建立数据模型和数据仓库的物理设计; 3)定义数据源; 4)选择数据仓库技术和平台; 5)从操作型数据库中提取、转换和净化数据到数据仓库; 6)选择访问和报表工具; 7)选择数据库连接软件; 8)选择数据分析和数据展示软件; 9)更新数据仓库; 三、数据仓库建立的基本框架 四、数据的获取 数据仓库所需要的数据不像业务处理系统那样直接从业务发生地获取,而是从与业务处理发生直接联系的业务处理系统那里获取,如传统的基于C/S结构的在线事物处理系统OLTP。这些业务处理系统中的数据往往与业务处理联系在一起,只为业务的日常处理服务,而不为决策分析服务。所以DW从业务处理系统那里获取数据时,并不能将原数据库中的数据直接加载到DW中,而是要进行一系列的处理。 四、数据的获取

文档评论(0)

wendan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档