数据仓库逻辑模型介绍.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据仓库逻辑模型介绍

数据仓库逻辑模型介绍 内容 相关概念介绍 数据仓库实施方法论 LDM介绍 学习经验分享 一、概念 -1 (1)为什么要建设数据仓库? 蜘蛛网问题 数据缺乏可信性 数据处理效率低下 难以将数据转化为信息 一、概念 -1 (1)为什么要建设数据仓库? 统一数据源 统一数据标准 一、概念 -2 (2) ODS、数据仓库、数据集市 操作数据存储(Operational Data Store)是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求。常常被作为数据仓库的过渡,也是数据仓库项目的可选项之一。 数据仓库是面向主题的、集成的、稳定的(不可更新)、反映历史变化(不同时间)的数据集合,用以支持经营管理中的决策制定过程。(Inmon,1991) 数据集市也可叫做“小数据仓库”。如果说数据仓库是建立在企业级的数据模型之上的话。那么数据集市就是企业级数据仓库的一个子集,他主要面向部门级业务,并且只面向某个特定的主题。数据集市可以在一定程度上缓解访问数据仓库的瓶颈。 一、概念 -2 ODS与数据仓库 共同点:面向主题的和集成的,需要进行转换、加工处理 区别:主要体现数据的可变性和当前性上 一、概念 -2 一、概念 -3 (3)ETL ETL是数据抽取(Extract)、转换(Transform)、清洗(Cleansing)、装载(Load)的过程。 是构建数据仓库的重要一环,用户从数据源抽取出所需的数据,经过数据清洗,最终按照预先定义好的数据仓库模型,将数据加载到数据仓库中去。 ETL主要解决各源数据的异构性和低质量(标准化、清除噪声数据 ) 、计算和汇总指标数据。 一、概念 -4 (4)数据加载策略 更新(Upsert、delete/insert) 拉链(时间拉链/自拉链, 历史) 追加(直接insert,防止重复加载先delete当天) 当前表、历史表、流水表 一、概念 -5 (5)元数据 元数据:是描述数据仓库内数据的结构和建立方法的数据。可将其按用途的不同分为两类,技术元数据和商业元数据。 技术元数据是数据仓库的设计和管理人员用于开发和日常管理数据仓库时用的数据。包括:数据源信息;数据转换的描述;数据仓库内对象和数据结构的定义;数据清理和数据更新时用的规则;源数据到目标的数据映射;用户访问权限,数据备份历史记录,数据导入历史记录,信息发布历史记录等。 一、概念 -5 (5)元数据 业务元数据从业务的角度描述了数据仓库中的数据。它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息。 元数据为访问数据仓库提供了一个信息目录(information directory),这个目录全面描述了数据仓库中都有什么数据、这些数据怎么得到的、和怎么访问这些数据。它是数据仓库运行和维护的中心,数据仓库服务器利用他来存贮和更新数据,用户通过他来了解和访问数据。 一、概念 -6 (6)数据粒度 粒度是指数据仓库的数据单位中保存数据的细化或综合程度的级别(详细程度 )。细化程度越高,粒度级就越小;相反,细化程度越低,粒度级就越大。 取决于:数据量大小 、存储设备的容量、查询分析的需要 一定的时间窗内存放细的粒度数据,超过一定的时期,只提供粗粒度的汇总数据,从而在性能与需求上达到一种平衡。 一、概念 -7 (7)OLAP及其相关 OLAP、维度、事实、度量值 切片、切块、上钻、下钻、旋转 星型模型、雪花模型 二、数据仓库实施方法论 -1 (1)实施流程 二、数据仓库实施方法论 -2 (2)信息调研 源系统调研 数据源分析 数据质量分析 数据缺口分析 数据更新周期及更新方式分析 用户需求分析 二、数据仓库实施方法论 -3 (3)逻辑数据模型设计 基于概念数据模型(CDM) 由一系列表和实体详细描述组成 通用的业务语言 便于业务与业务之间的功能理解 集成当前和未来数据的蓝图 独立于技术 为物理数据库设计作准备 是IT人员和业务人员沟通的工具 二、数据仓库实施方法论 -3 (3)逻辑数据模型设计 了解业务流程 分析源数据 建立实体模型 建立实体间依赖关系 填写并完善实体属性 二、数据仓库实施方法论 -4 (4)物理数据库设计 转换逻辑模型为物理模型 定义主索引、次索引 非正则化处理 数据库建立 设计优化 数据库功能测试 二、数据仓库实施方法论 -5 (5)数据模型的演变 概念数据模型(CDM) 逻辑数据模型(LDM) 扩展逻辑数据模型(ELDM) 物理数据模型(PDM) 三、LDM -1 主题例子-财务(Fina

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档