Informatica调优[高级].docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
接下来的这些条目是INFORMATICA 的高级调优建议。请极其谨慎地处理,每次试用一条建议。在没有试着使用初级和中级建议来提高INFORMATICA 的性能以前,不要尝试使用如下的高级建议。这些建议的实施可能需要系统管理员(SA)、数据库管理员(DBA)以及网络管理员之类的专家级人物的配合才可以,所以要细心。高级调优最重要的方面就是能够精确的查明瓶颈是什么,并且有能力定位这些瓶颈是如何引起的。 ? 根据常理,这些高级建议放在最后,并且是在系统级上的建议。还有其他的适用于数据仓库调优的高级建议,可以依据你的软硬件资源存在的问题去寻找相应的帮助。 ? 1、将MAPPING 分解。保留一个数据目标。如果必要每个数据目标保留一个数据源。为什么要这么做呢?在一个MAPPING 中减少数据目标的个数会大幅度的提高运行的速度。基本的情况是这样的:每个MAPPING/TARGET 对应一个SESSION。每个SESSION 都会建立它自己的数据库连接。因为对每个目标表建立一个单独的数据库连接,数据库管理器(DBMS)能将插入、更新和删除等操作需求并行地处理。在一个SESSION 中进行一个特定目的的操作也是很有帮助的(例如不在把以数据驱动地操作和直接插入操作混合地插入到同一个数据目标中)。如果实际情况运行, 每个SESSION 可以被放置到标记为“CONCURRENT”的BATCH(译者注:旧版本的术语)中。如果能够这样做,MAPPING。 和SESSION 的并行执行的情况就很显而易见了。关于并行处理的研究一再地表明:与直接将原本的操作单元简单地顺序执行相比,同一时刻开始的并行执行有时只需花费一半的时间。当一个MAPPING 中包含多个数据目标时,就会使得每个数据库连接去处理多个不同地数据库操作语句,有时会影响这个数据目标的性能,有时又是那个。请想一下,在这情况下,INFORMATICA(包括其他的任何工具)都很难进行BULK(并行)操作,即使在SESSION中已经设定了BULK 属性。记住,设定这个属性只是代表你的意愿,如果INFORMATICA不能在一系列连续的记录上执行BULK 操作,就会自动的变成NORMAL 的装载方式。很明显,数据在实际进入数据库以前,数据的实际情况导致了INFORMATICA 使用了内核中较低级别的代码来进行执行。 ? 2、对于复杂的业务逻辑,使用MAPLET。似乎MAPLET 本身并不对MAPING 的性能带来什么影响。MAPLET 的广泛应用意味着更好的、更具可管理性的业务逻辑。MAPLET也可以帮助你将MAPPING 分解。 ? 3、保证MAPPING 尽可能的简单。把复杂的业务逻辑(如果必需要这样处理)分解成MAPLET。如果可以避免所有的复杂的业务逻辑,这就成为性能调优的关键。下面这个公理在这里也使用(通常意义):两点之间的路径越直接,距离越短。在这里可以解释成:数据源和数据目标中间的处理越少,数据装载的速度越快。 ? 4、记住所需花费的时间是由READER/TRANSFORMER/WRITER 进程所影响的。对于复杂的MAPPING,每个元素(字段)都需要被考虑,这时对于如何理解由INFORMATICA所产生的性能统计信息就变得非常的重要。换句话说,如果READER 慢,其他的线程就会受到影响,如果WRITER 线程慢,也是一样的效果。一根水管的大小只取决于它最小的截面积,一根链条的耐拉力只取决于它的最薄弱的部分。比喻虽然不是非常的贴切,但是它能够说明问题。 ? 5、改变网络包的大小(对于SYBASE/SQL SERVER/ORACLE 的用户)。最大的网络包的大小是数据库的设置,通常是512 字节或者是1024 字节。设置网络包的大小一般不会影响其他的用户,但是却会使INFORMATICA 充分的利用到其优点,可以在同一个网络包中传输更多、更快的传输数据。典型的最优设置是使网络包的大小在10K 到20K 之间。在ORACLE 中,需要调整Listener.ORA 和TNSNames.ORA 文件中的SDU(Service Layer DataBuffer Size)和TDU(Transport Layer Data Buffer Size)参数。SDU 和TDU 应该被设置成为相等的大小。参见INFORMATICA 的常见问题解答页面来获得更多的信息。 ? 6、对于本地的ORACLE 数据库,把连接设置为IPC 方式。如果PMSERVER 和ORACLE运行在同一台机器上,使用IPC 连接方式,而不要使用TCP/IP 方式。在TNSName.ORA 和Listener.ORA 文件中进行修改,然后重新启动LISTENER 服务。注意,这个协议只能在本机使用,然而使用IPC 协议所带来的性能的提高

文档评论(0)

shaoye348 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档