- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ETL模型介绍
ETL模型介绍
银泰网 BI team
孙 博
数据仓库架构
ETL理解
ETL工具介绍
ETL处理机制
数据仓库的定义
著名数据仓库专家W.H.Inmon
数据仓库是面向主题的、集成的、稳定的、
不同时间的数据集合,用于支持经营管理中
的决策制定过程。
A Data Warehouse is a subject-oriented,
integrated, time-variant, nonvolatile
collection of data in support of
management’s decision making process
“Building the Data Warehouse ” (《建立数据仓库》)
“Corporation information factory” (《企业信息工厂》)
“Govment information factory” 《政府信息工厂》
数据仓库特征
面向主题——数据仓库中的数据按照主题进行
组织;
集成——从多个数据源将数据集合到数据仓库
中,并集成为一个整体;
稳定——数据仓库中的数据通常是历史数据,
很少进行更新;
时变——数据仓库中的所有数据都有特定的时
间标识
数据仓库整体架构
ETL特点
ETL定义
Extract-Transform-Load的缩写,数据抽取(Extract)、
转换 (Transform )、清洗(Cleansing)、装载(Load)的
过程。
ETL特点
实施时间长
整个项目实施工作量的60% - 70%
过程复杂
贯穿业务数据建模与存储的整个过程
决定BI项目成败的关键
数据的准确性、过程的执行成功与否
ETL抽取机制
增量机制
根据时间戳或是属性变化
全量机制
数据一次性加载或初始化数据
ETL处理模式
工具辅助
informatica,SSIS,datastage
手工模式
通过sql直接手工编写存储过程
ETL开发方式比较
开发方式
采用ETL工具 手工编码
比较方面
灵活性 比较灵活 最灵活
难易程度 相对容易 要求一定技术水平
管理和维护 容易 较难
可移值性 好 差
性能和效率 较高 取决于编写者水平
开发周期 较短 较长
价格 较高 相对较低
两大工具比较
Datastage和Powercenter可谓旗鼓相当
指标比较 Informatica DataStage
市场占用率 领先几个百分点 略低
引擎骚动 元数据方式 编码方
您可能关注的文档
- eos70d-基本使用说明.pdf
- EOU说明书.pdf
- EPC-6G2C-L 底板部分原理图.pdf
- EPA噪音法规.pdf
- EPLAN污水处理图纸.pdf
- EPS 地理信息工作站三维测图操作手册.pdf
- EPSON 实时时钟芯片RX-8010SJ Application Manual.pdf
- EPSONELPDC11实物展台(中文)说明书.pdf
- EPSON进阶培训资料.pdf
- Equinox操作及相关维护说明-集菌仪.pdf
- 2025年安徽工商职业学院单招职业技能测试题库带答案(典型题).docx
- 2025年洛阳科技职业学院单招职业技能测试题库带答案(新).docx
- 2025年荆门职业学院单招职业技能测试题库及答案(易错题).docx
- 2025年宣化科技职业学院单招职业技能测试题库(精练).docx
- 2025年包头职业技术学院单招职业技能测试题库带答案(新).docx
- 2025年江西工商职业技术学院单招职业技能测试题库带答案(精练).docx
- 2025年黑龙江农业经济职业学院单招职业技能测试题库精编.docx
- 2025年山东艺术设计职业学院单招职业技能测试题库带答案(基础题).docx
- 2025年陕西工商职业学院单招职业技能测试题库带答案(突破训练).docx
- 2025年承德护理职业学院单招职业技能测试题库【word】.docx
文档评论(0)