第五章 深入BI之Kettle篇2.pdf

  1. 1、本文档共26页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
深入BI 之 Kettle 篇 第2周 2013.03.302013.03.32 DATAGURUDATAGURU专业数据分析网站专业数据分析网站初建军初建军 法律声明 【声明】本视频和幻灯片为炼数成金网络课程的教 学资料,所有资料只能在课程内使用,不得在课 程以外范围散播,违者将可能被追究法律和经济 责任。 课程详情访问炼数成金培训网站 2013.03.30 DATAGURU专业数据分析网站初建军 2 课程内容 上周回顾 2013.03.30 DATAGURU专业数据分析网站初建军 课程内容 • Kettle 资源库-保存Kettle 元数据 • 运行方式- 图形、命令行、API • 日志-文件日志、数据库日志 2013.03.30 DATAGURU专业数据分析网站初建军 Kettle 资源库– 元数据 元数据的通用概念: • “描述性数据”或 “数据的数据” ETL 的元数据: • 描述ETL 要执行的任务 在Kettle里元数据的存储方式: • 资源库 资源库包括文件资源库、数据库资源库 Kettle 4.0 以后资源库类型可以插件扩展 • XML 文件 .ktr 转换文件的XML 的根节点必须是transformation .kjb 作业XML 的根节点是job 2013.03.30 DATAGURU专业数据分析网站初建军 Kettle 资源库– 资源库类型 数据库资源库: • 把Kettle 的元数据串行化到数据库中,如R_TRANSFORMATION 表保 存了Kettle 转换的名称、描述等属性。 • 在Spoon 里创建和升级数据库资源库 文件资源库: 在文件的基础上的封装,实现了org.pentaho.di.repository.Repository 接口。 是Kettle 4.0 以后版本里增加的资源库类型 不使用资源库: 直接保存为ktr 或kjb 文件。 2013.03.30 DATAGURU专业数据分析网站初建军 Kettle 资源库– 资源库操作 新建资源库: • Kettle 4.x 在Spoon 里新建资源库,并选择资源库类型。 • 傲飞数据整合平台在服务端新建资源库,只能使用数据库资源库。 资源库导出: • 全部导出 • 导出一个目录 资源库导入: 2013.03.30 DATAGURU专业数据分析网站初建军 Kettle 资源库– 如何选择资源库? 数据库资源库的缺点: • 不能存储转换或作业的多个版本。 • 严重依赖于数据库的锁机制来防止工作丢失。 • 没有考虑到团队开发,开发人员不能锁住某个作业自己开发。 文件资源库的缺点: • 对象(如转换、作业、数据库连接等对象)之间的关联关系难以处 理,所以删除、重命名等操作会比较麻烦。 • 没有版本历史。 • 难以进行团队开发。 不使用资源库:使用svn 进行文件版本控制。 参考: Kettle 企业版资源库:基于Apache Jackrabbit 的CMS 系统。 2013.03.30 DATAGURU专业数据分析网站初建军 Kettle资源库– 管

文档评论(0)

xuefei111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档