DATASTAGE的介绍及基本操作说课材料.ppt

  1. 1、本文档共133页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DATASTAGE 介绍及基本操作;内容提要:;一,datastage的介绍;ETL概要 ;Ascential DataStage 是一套专门对多种操作数据源的数据抽取、转换和维护过程进行简化和自动化,并将其输入数据集市或数据仓库目标数据库的集成工具。 DataStage 能够处理多种数据源的数据,包括主机系统的大型数据库、开放系统上的关系数据库和普通的文件系统 。包括Oracle,Sybase,DB2,SQL Server,Teradata, FTP文件系统,文本文件等等。 数据清洗、转换、加载都可以在图形化工具里完成,同样可以灵活的被外部系统调度,提供专门的设计工具来??计转换规则和清洗规则等,实现了增量抽取、任务调度等多种复杂而实用的功能 。;Datastage的组成:; Datastage是C/S软件,服务器端存储所有的ds项目和元数据,由关系型数据库(RDBMS)组成。客户端具有同服务端一样的软件接口。 客户端运行于windows95或更高版本,服务端可运行于windowsNT4.0或windows2000 版本,datastage的很多版本都支持unix。;DS Administrator 在服务端管理ds的项目和服务端操作。主要用于工程的参数调整,变量设置,及command操作。 DS Designer 建立ds的job并且编译执行的程序。主要用于job的开发及编译。 DS Director 运行和监控ds的job。主要用于job调试。 DS Manager 允许编辑和查看在ds中存储的内容。主要用于项目管理或job的导入、导出、备份。;DataStage中的Administrator; 默认使用Administator来指定常规的服务端,用来增加或删除DataStage工程,并且可以设置工程的属性。 Administator也对于总库提供命令接口。 使用Administator的‘Project Propertities’ 工程属性的窗口,可以进行 1、在‘General’页框中,设置Job监控的一些限制信息和Director中的其他信息。 2、在‘Permission’页框中,设置并分配开发人员组的权限 。 3、在‘Tracing’ 页框中, 设置或取消服务端进行跟踪。 4、在‘Schedule’ 页框中, 设置调度时运行Job所用到的用户名和口令。 5、在‘Tunables’页框中,指定Hash文件Stage的读写的缓存大小。 在DataStage中的Administrator设置常用服务器的默认值: 1、改变Licence信息。 2、设置服务端连接超时时间。 ;DataStage中的Manager;使用DataStage中的Manager来存储和管理Job的元数据,使之可以在DataStage中的Designer中再度被使用。 元数据包括表单和文件结构和导出数据的Routines的转换等等。 Manager是DataStage存储的一个重要的部分,可以用来加入表单和文件的结构,在左侧分支树中显示Routines、Transforms和Jobs。 自定义的Routines和Transforms也在DataStage中的Manager里创建。;DataStage中的Designer;DataStage中的Designer允许使用熟练地拖拽图标和连线的方式来表示数据抽取、清洗、转换、整合和加载的过程,并将数据导入数据仓库的表单之中。 Designer提供一个数据流程的模式,轻松将设置和Job的设计有机的组成。 使用Designer,可以: 1、指定数据如何抽取。 2、指定数据的转换规则和进行转换。 3、使用参考性质的LookUp到数据集市中编辑数据。 a)例如,如果销售的记录集包括CustomerID,可以在CustomerMaster表中使用LookUp查找到Customer的名称。 b)当需要连接数据集市并使用查询,可以快速的进行访问。 4、对数据进行整合。 5、在定义的约束条件中将基础数据分割成为多个输出的连接。 在Tools菜单中可以轻松的于Director,Designer和Manager之间切换。 ;DataStage中的Director;使用Datastage的Director可以对设计的job进行验证、运行、任务调度和监控的工作。也 可以针对job 的运行查看运行的聚合统计情况。;在Datastage中进行开发;1、定义工程的属性——在Administrator中。 2、打开工程。 3、导入元数据,在job中定义格式、读入或写入——在Manager中。 4、设计jo

文档评论(0)

zjq110 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档