ETL培训ThridDay内容教案分析.ppt

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ETL抽取工具Informatica之开发篇(二) 2010年6月 回顾 我们回顾一下昨天的内容。 对于昨天5个基本组件的基本应用你掌握了吗? 今天将继续学习其他4个组件的基本用法: Joiner,Update?Strategy,Lookup和Sequence?Generator组件 Joiner组件(一) 作用:连接查询来自不同数据库的表或平文件 注意:下面情况下无法使用Joiner组件: 1.任何一个源包含了Update Strategy transformation 2.将Sequence Generator直接放在Joiner组件前 Joiner组件(二) 用法:创建好Joiner(下简称JNR)后,将需要的用的字段从transformation拖拽到JNR?,双击JNR,对JNR的属性进行设置。用于连接的两个表一个称为detail表,一个称为master表。JNR属性中可配置Join?Type(连接类型)为Normal?Join,Master?Outer?Join,Detail?Outer?Join?和Full?Outer?Join中任意一种。Normal?Join相当于常规的inner?join;?Master?Outer?Join相当于常规的Detail?left?outer?join?Master;Detail?Outer?Join相当于常规的Detail?right?outer?join?Master;?Full?Outer?Join相当于常规的full?outer?join。Join?Condition属性值就是常规sql语句on?后带的条件。 Joiner组件(三) 命名方式:JNR_Name 类型:Active/Connected 注意:尽量使用Normal?Join,Master?Outer?Join.这两个的效率比另外两个更好 大家来结合Joiner和SQ组件在关联表上有什么区别? Joiner组件(四) Defining a Join Condition 开始拖入到Joiner组件中的数据是detail sources 关联的字段格式要一样 只能使用 “=” 关联条件 一个关联条件不能重复定义多次 多个关联条件之间的逻辑是 AND 每一条Master 的数据都要根Detail数据关联 关联条件字段的顺序影响关联性能 Char跟Varchar的数据无法关联,因为Char会在后面补齐空格 Null跟Null无法使用=关联,必须在比较之前替换为缺省值 Joiner组件(五) Defining the Join Type normal或者master outer join 速度要快于 full outer 和detail outer join。 Master outer Join: 1.Master的值可以为空,即返回所有的Detail数据 2.对应的SQL为:select * Master left outer join Detail on(Master.ID=Detail.ID) Joiner组件(六) 尽量先在数据库作Join操作 尽量使用Sorted data Unsorted Joiner:Master数据源量尽量要少 Sorted joiner:Master数据源尽量减少重复主键,PowerCenter一次只cache100条主键记录 练习 参见实验7结合练习 Update?Strategy 组件(一) 作用:决定该行进行插入,删除,更新,忽略中的哪一种操作 有两种更新标准: 1.在session中:读取relational table 和flat file 源记录。 2.在mapping中:使用Update Strategy组件。 Update?Strategy 组件(二) 用法:创建好Update?Strategy(下简称US)后,将需要的用的字段从transformation拖拽到US?,双击US,对US的属性进行设置。US的设置关键是Update?Strategy?Expression属性的设置,这个表达式使用IIF?或DECODE?函数对记录的每一行进行判断,为每一行赋予DD_INSERT,DD_UPDATE,DD_DELETE,DD_REJECT(这四个是常量,值分别为0,1,2,3)中任意一个值,表明该行在数据库中将进行何种操作。 Update?Strategy 组件(三) 命名方式:UPD_Name 类型:Active/Connected 注意:mapping中有US时,ma

您可能关注的文档

文档评论(0)

武神赵子龙 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档