网站大量收购闲置独家精品文档,联系QQ:2885784924

DataStage简介.doc

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DataStage简介

DataStage简单介绍: 一、DataStage的特性: DataStage是在构建数据仓库过程中进行数据清洗、数据转换的一套工具。它的工作流程如下图所示: DataStage包括设计、开发、编译、运行及管理等整套工具。通过运用DataStage能够对来自一个或多个不同数据源中的数据进行析取、转换,再将结果装载到一个或多个目的库中。 通过DataStage的处理,最终用户可以得到分析和决策支持所需要的及时而准确的数据及相关信息。 DataStage支持不同种类的数据源和目的库,它既可以直接从Oracle、Sybase等各种数据库中存取数据,也可以通过ODBC接口访问各种数据库,还支持Sequential file类型的数据源。这一特性使得多个数据源与目标的连接变得非常简单,可以在单个任务中对多个甚至是无限个数据源和目标进行连接。 DataStage自带了超过300个的预定义库函数和转换,即便是非常复杂的数据转换也可以很轻松的完成。它的图形化设计工具可以控制任务执行而无须任何脚本。 二、DataStage的架构: DataStage采用C/S模式工作,其结构如下: DataStage支持多种平台,其Server端可运行于以下平台:Windows 2000、Windows NT、COMPAQ Tru64、HP-UX、IBM AIX、Sun Solaris; Client端支持以下平台:Win95、Win98、Winme、Windows NT、Windows 2000; 三、功能介绍 DataStage的Server端由Repository、DataStage Server及DataStage Package Installer三部分组成,Client端则由DataStage Manager、DataStage Designer、DataStage Driect及DataStage Administrator四部分组成。其中各部分主要功能如下: Repository中央存储器,用于存放构造数据集市或数据仓库所需要的全部信息。 DataStage Server运行DataStage Director控制下的可执行任务,将萃取出来的数据通过转换后加载到数据仓库当中。 DataStage Package Installer一用来安装DataStage任务包和插件的用户接口。 DataStage Manager用于查看和编辑中央存储器中组件的用户接口。 DataStage Designer用于创建可执行任务的图形化工具。 DataStage Driect用于验证、定时及监控任务运行的用户接口。 DataStage Administrator用于创建DataStage的用户,控制净化标准以及安装NLS的用户接口。 四、设计流程简介 DataStage的可执行应用的最小单位为“任务”。创建一个任务通常需要经过三个步骤: 第一步:通过DataStag Manager将需要萃取和转换的元数据定义好,并把要用到的数据源通通引入到Repository中; 第二步:运用图形化的工具DataStage Designer设计数据转换的规则和顺序,这一工具功能强大,而且操作非常简单,该工具自带了超过300个预定义的库函数和转换,可以实现一些非常复杂的转换而无须书写太多的脚本。对于多个需要遵循一定顺序进行转换的任务也可以通过它来定义执行的顺序,还可以通过它来定义对运行结果的处置(以FTP或者E_MAIL的形式发送处理结果等)。对于设计好的任务,可以进行编译和调试,在任务运行过程中跟踪任务处理,使得效验任务的设计和修正逻辑错误更简单。 第三步:通过DataStag Director执行编译好的任务,可以在执行运行前效验任务,也可以在运行前定义运行结束前停止的条件。在这里还可以制定运行的时间表,定时自动运行任务。任务运行日志,详细的记录了任务运行情况,包括运行的时间及运行过程中所执行的操作,以及完成情况。对于出错任务,提供了恢复和诊断机制。DataStage Designer中设计的转换只有在经过DataStag Director运行后才能真正执行。 设计器——这是一个强大的,基于图形用户界面(GUI)的开发工具,它包含一个转换引擎,一个元数据存储和二种编程语言(SQL和BASIC)。使用设计器的拖拉功能,用户能在准备数据集市中建立一个数据转换过程模型,防止操作系统的中断及避免执行错误。   存储管理器——在开发数据集市的过程中,使用存储管理器浏览、编辑和输入元数据。这可能包括来自操作系统的元数据或目标集市以及来自开发项目中新的元数据(例如新的数据类型定义、传输定义和商业规则)。   控制器——使用控制器和运行引擎来规划运行中的解决方案

文档评论(0)

xcs88858 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档