网站大量收购独家精品文档,联系QQ:2885784924

ETL模型介绍.pdf

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ETL模型介绍

ETL模型介绍 银泰网 BI team 孙 博 数据仓库架构 ETL理解 ETL工具介绍 ETL处理机制 数据仓库的定义 著名数据仓库专家W.H.Inmon  数据仓库是面向主题的、集成的、稳定的、 不同时间的数据集合,用于支持经营管理中 的决策制定过程。  A Data Warehouse is a subject-oriented, integrated, time-variant, nonvolatile collection of data in support of management’s decision making process  “Building the Data Warehouse ” (《建立数据仓库》)  “Corporation information factory” (《企业信息工厂》)  “Govment information factory” 《政府信息工厂》 数据仓库特征 面向主题——数据仓库中的数据按照主题进行 组织; 集成——从多个数据源将数据集合到数据仓库 中,并集成为一个整体; 稳定——数据仓库中的数据通常是历史数据, 很少进行更新;  时变——数据仓库中的所有数据都有特定的时 间标识 数据仓库整体架构 ETL特点 ETL定义 Extract-Transform-Load的缩写,数据抽取(Extract)、 转换 (Transform )、清洗(Cleansing)、装载(Load)的 过程。 ETL特点 实施时间长 整个项目实施工作量的60% - 70% 过程复杂 贯穿业务数据建模与存储的整个过程 决定BI项目成败的关键 数据的准确性、过程的执行成功与否 ETL抽取机制  增量机制 根据时间戳或是属性变化  全量机制 数据一次性加载或初始化数据 ETL处理模式  工具辅助 informatica,SSIS,datastage 手工模式 通过sql直接手工编写存储过程 ETL开发方式比较 开发方式 采用ETL工具 手工编码 比较方面 灵活性 比较灵活 最灵活 难易程度 相对容易 要求一定技术水平 管理和维护 容易 较难 可移值性 好 差 性能和效率 较高 取决于编写者水平 开发周期 较短 较长 价格 较高 相对较低 两大工具比较 Datastage和Powercenter可谓旗鼓相当 指标比较 Informatica DataStage 市场占用率 领先几个百分点 略低 引擎骚动 元数据方式 编码方

文档评论(0)

yaocen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档