- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Informatica快速入门讲述
1 Informatica概述 3
2 安装Informatica8.6.1 3
2.1 服务端安装 3
2.2 客户端安装 7
3 配置管理服务器 9
3.1 创建知识库和集成服务 9
3.2 客户端到集成服务端的连接 12
4 PowerCenter Designer学习 13
4.1 概念和基本定义 13
4.2 Mapping设计和组件的使用 15
4.2.1 实例一:聚合抽取 15
4.2.2 实例二:取TOP前三条记录 16
4.2.3 实例三:抽取XML源 19
4.3 WorkFlow的设计和使用 20
4.3.1 创建Session 20
4.3.2 设计WorkFlow 22
4.4 Repository Manager 23
Informatica概述
Informatica一直致力于为客户提供具有强大的元数据管理、数据集成和个性化分析递送功能的世界通行标准的统一数据服务平台。Informatica的基础设施产品以可伸缩的、可扩展的企业级数据集成平台为特点,并广泛支持来自Informatica和其他的领先商务智能提供商的数据仓库基础设施和分析型应用软件的开发和管理,提供元数据管理解决方案,帮助企业集成、优化、审核信息资产以提高运营效率,增加客户收益,取得竞争优势。
详见文档:
安装Informatica8.6.1
这里以Informatica8.6.1为例:
服务端安装
找到安装目录pc861_win32_x86.zip\Server\Windows\Disk1\InstData\VM下
点击安装
选择安装语言,这里以中文版为例
点击下一步,并选择安装PowerCenter8.6.1
必须选择事先准备好的安装密匙
选择安装路径
HTTPS配置,配置管理控制台与配置管理器的安全通信(如果没有使用该端口就采用默认)
配置好Informatica域并进行下一步,取掉为特定用户启动Informatica Services,点击完成安装
客户端安装
选择安装
设置安装路径
安装完成后可以看到包含的所有工具
配置管理服务器
创建知识库和集成服务
接下来我们主要是配置知识库管理服务器,PowerCenter数据整合引擎是基于元数据驱动的,提供了基于元数据驱动的元数据知识库(Repository),知识库是PowerCenter的核心。
在Informatica Services启动的的情况下,我们可以通过管理控制台来操作。
从控制台里我们可以看到很多选项,我们主要是创建存储库服务(Repository)和集成服务,存储库服务(Repository) 存储所有的ETL元数据,包括:源、目标表的物理和逻辑元数据, ETL转换规则,知识库用户权限,ETL任务运行历史信息等元数据。
首先我们创建一个用于测试学习的存储服务器,事先在Oracle中建好要用到的数据库
此处如果无法创建成功有以下可能:
需要设置环境变量,将C:\Informatica\PowerCenter8.6.1\Server\bin;C:\Informatica\PowerCenter8.6.1\RepositoryServer\bin;移到Path最前边
代码页一定要如下选择
设置知库链接用的数据库用户要有DBA角色权限
连接字符串设置为当前的Oracle服务名
接下来创建集成服务,因为集成服务是依赖于知识库的,注意关联的存储库服务选择刚建好的学习测试存储库,存储库默认要设置用户名和密码为:Administrator
至次我们完成了服务端的基本配置,服务端可以对知识库备份和恢复等很多功能,也可以建立其相应的服务,这里不再多述!
客户端到集成服务端的连接
我们开发ETL要使用到PowerCenter Designer工具,详细的介绍在概述中有,接下我们配置好Designer与集成服务的连接:
从客户端工具中打开PowerCenter Repository Manager
从菜单上选择存储库配置域 如下:
这样就连接上集成测试用例库,选择学习测试用例库,从文件夹选项目创建文件夹,相当于在集成库下的一层子目录
至此,打开PowerCenter Designer就可开发使用了
PowerCenter Designer学习
概念和基本定义
最基本的ETL包括源的定义,目标定义,和映射,另外我们还可以创建可以重用的Mapplet。
使用到的工具如下
源分析器:
目标设计器:
映射设计:
传输件设计:
Mapplet组件设计:
源分析器是用来定义源的结构,这里的源虽然是从某个数据库导出进来的表结构也可以是某个XSD定义的XML结构等等,但是仅仅绑定了数据库类型,并不是
文档评论(0)