- 1、本文档共133页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
DATASTAGE 介绍及基本操作;内容提要:;一,datastage的介绍;ETL概要 ;Ascential DataStage 是一套专门对多种操作数据源的数据抽取、转换和维护过程进行简化和自动化,并将其输入数据集市或数据仓库目标数据库的集成工具。
DataStage 能够处理多种数据源的数据,包括主机系统的大型数据库、开放系统上的关系数据库和普通的文件系统 。包括Oracle,Sybase,DB2,SQL Server,Teradata, FTP文件系统,文本文件等等。
数据清洗、转换、加载都可以在图形化工具里完成,同样可以灵活的被外部系统调度,提供专门的设计工具来??计转换规则和清洗规则等,实现了增量抽取、任务调度等多种复杂而实用的功能 。;Datastage的组成:; Datastage是C/S软件,服务器端存储所有的ds项目和元数据,由关系型数据库(RDBMS)组成。客户端具有同服务端一样的软件接口。 客户端运行于windows95或更高版本,服务端可运行于windowsNT4.0或windows2000 版本,datastage的很多版本都支持unix。;DS Administrator
在服务端管理ds的项目和服务端操作。主要用于工程的参数调整,变量设置,及command操作。
DS Designer
建立ds的job并且编译执行的程序。主要用于job的开发及编译。
DS Director
运行和监控ds的job。主要用于job调试。
DS Manager
允许编辑和查看在ds中存储的内容。主要用于项目管理或job的导入、导出、备份。;DataStage中的Administrator; 默认使用Administator来指定常规的服务端,用来增加或删除DataStage工程,并且可以设置工程的属性。 Administator也对于总库提供命令接口。
使用Administator的‘Project Propertities’ 工程属性的窗口,可以进行
1、在‘General’页框中,设置Job监控的一些限制信息和Director中的其他信息。
2、在‘Permission’页框中,设置并分配开发人员组的权限 。
3、在‘Tracing’ 页框中, 设置或取消服务端进行跟踪。
4、在‘Schedule’ 页框中, 设置调度时运行Job所用到的用户名和口令。
5、在‘Tunables’页框中,指定Hash文件Stage的读写的缓存大小。
在DataStage中的Administrator设置常用服务器的默认值:
1、改变Licence信息。
2、设置服务端连接超时时间。
;DataStage中的Manager;使用DataStage中的Manager来存储和管理Job的元数据,使之可以在DataStage中的Designer中再度被使用。
元数据包括表单和文件结构和导出数据的Routines的转换等等。
Manager是DataStage存储的一个重要的部分,可以用来加入表单和文件的结构,在左侧分支树中显示Routines、Transforms和Jobs。
自定义的Routines和Transforms也在DataStage中的Manager里创建。;DataStage中的Designer;DataStage中的Designer允许使用熟练地拖拽图标和连线的方式来表示数据抽取、清洗、转换、整合和加载的过程,并将数据导入数据仓库的表单之中。
Designer提供一个数据流程的模式,轻松将设置和Job的设计有机的组成。
使用Designer,可以:1、指定数据如何抽取。
2、指定数据的转换规则和进行转换。
3、使用参考性质的LookUp到数据集市中编辑数据。
a)例如,如果销售的记录集包括CustomerID,可以在CustomerMaster表中使用LookUp查找到Customer的名称。
b)当需要连接数据集市并使用查询,可以快速的进行访问。
4、对数据进行整合。
5、在定义的约束条件中将基础数据分割成为多个输出的连接。
在Tools菜单中可以轻松的于Director,Designer和Manager之间切换。
;DataStage中的Director;使用Datastage的Director可以对设计的job进行验证、运行、任务调度和监控的工作。也 可以针对job 的运行查看运行的聚合统计情况。;在Datastage中进行开发;1、定义工程的属性——在Administrator中。
2、打开工程。
3、导入元数据,在job中定义格式、读入或写入——在Manager中。
4、设计jo
您可能关注的文档
- CTA在脑血管疾病中的运用教学教材.ppt
- ct原理及应用教程文件.ppt
- CT支气管动脉造影 - 副本复习课程.ppt
- CT的临床应用40431教学教材.ppt
- CT的基本结构和成像原理(2)演示教学.ppt
- CT肺叶分段及纵膈淋巴结分组复习课程.ppt
- Cushing综合征17260说课讲解.ppt
- CVP的测量与意义学习资料.ppt
- cvp的测量55908知识讲解.ppt
- CW03-3-以太网连接线电子教案.ppt
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
文档评论(0)