- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
开源⾎缘分析⼯具 atlas源码讲解
需求说明:公司进⾏⾎缘分析,但是没有好⽤的⾎缘分析⼯具,从开源的社区找到了atlas,感觉很智能,可以⾃动分析sql语句,做到字段
级别的拆分,回溯⾎缘很好⽤,下⾯就是atlas的代码讲解
sql分析器:Antlr (ANother Tool for Language Recognition) 是⼀个强⼤的 语法解析器,可以⽤来读取、处理、执⾏或翻译结构化⽂本
跨语⾔
或⼆进制⽂件。它被⼴泛⽤来构建语⾔,⼯具和框架。Antlr可以从语法上来⽣成⼀个可以构建和遍历解析树的解析器。可以参考:
Apache Atlas版本号:2.0.0
从官⽅⽹站下载Apache Atlas2.0.0版本源代码,⽤开发⼯具(如IntelliJ IDEA)打开。
根⽬录结构
⼀、3party-licenses
第三⽅组件许可,可以看出Atlas主要⽤到的第三⽅技术组件,绝⼤部分是前端技术组件,janusgraph 和titan是图数据库组
件,JanusGraph是Titan 的继承者,⽼版本⽤的是Titan ,新版本是⽤的JanusGraph
⼆ addons
安装扩展组件源代码,主要是Atlas接⼊各种Hadoop元数据数据源的桥接代码,对应Atlas架构图中的部分:
1 falcon-bridge
falcon桥接扩展模块,Apache Falcon 是⼀个开源的hadoop数据⽣命周期管理框架, 它提供了数据源 (Feed) 的管理服务,如⽣命周期管理,备
份,存档到云等,通过Web UI可以很容易地配置这些预定义的策略, 能够⼤⼤简化hadoop集群的数据流管理。falcon-bridge主要负责将Apache
Falcon元数据接⼊Atlas元数据管理系统。
bridge.FalconBridge类,提供了⼀系列注册Falcon元数据实体到Atlas 系统的桥接⼯具API ⽅法
hook.FalconHook 类,Falcon元数据通知事件钩⼦处理类
这个模块的详细介绍说明和使⽤说明见官⽅⽂档:,或者本地⽂档:docs/src/site/twiki/Hook-Falcon.twiki
2 falcon-bridge-shim
falcon桥接扩展垫⽚,即atlas的falcon桥接插件
3 hbase-bridge
Hbase桥接扩展模块,通过bin ⽬录下的import-hbase.sh脚本导⼊Hbase元数据到Atlas系统,脚本调⽤了桥接代码类HBaseBridge ,main⽅
法⼊⼝。这个模块的详细介绍说明和使⽤说明见官⽅⽂档:,或本地⽂档:docs/src/site/twiki/Hook-HBase.twiki
4 hive-bridge
hive桥接扩展模块,通过bin ⽬录下的import-hive.sh脚本导⼊hive元数据到Atlas系统,脚本调⽤了桥接代码类
HiveMetaStoreBridge ,main⽅法⼊⼝。
这个模块的详细介绍说明和使⽤说明见官⽅⽂档:,或本地⽂档:docs/src/site/twiki/Hook-Hive.twiki
5 kafka-bridge
Kafka桥接扩展模块,通过bin ⽬录下的import-kafka.sh脚本导⼊hive元数据到Atlas系统,脚本调⽤了桥接代码类KafkaBridge,main⽅法⼊
⼝。这个模块的详细介绍说明和使⽤说明见官⽅⽂档:
6 models
提供Atlas各种元数据模型类型定义json ⽂件
7 sqoop-bridge
Sqoop桥接扩展模块,主要提供⼀个SqoopHook类⽤于在sqoop将其他数据源数据同步到hive仓库后⾃动发送hive导⼊操作相关的元数据到
Atlas系统。这个模块的详细介绍说明和使⽤说明见官⽅⽂档:
8 storm-bridge
Storm桥接扩展模块,提供StormAtlasHook类⽤于将storm拓扑元数据信息通过Kafka Broker发送给Atlas系统进⾏持久化管理。这个模块的
详细介绍说明和使⽤说明见官⽅⽂档:
三 authorization
Atlas鉴权模块,⽀持Simple鉴权和Ranger鉴权两种⽅式,这个模块的详细介绍说明和使⽤说明见官⽅⽂档:
四 build-tools
构建⼯具,主要配置Checkstyle进⾏代码静态检查
您可能关注的文档
- 用心陪伴孩子一起成长(《指南》心得体会).pdf
- 28、醉翁亭记 答案.pdf
- 参加集团公司学习培训心得体会.pdf
- 康师傅公司财务报表分析.pdf
- 四年级作文自然景观.pdf
- 氧化镁脱硫原理.pdf
- 国外汽车检测技术及发展趋势.pdf
- 小学立定跳远体育.pdf
- 国际人才英语考试(国才考试ETIC)Task 4产品说明.pdf
- 小学心理教师的自我成长.pdf
- GB/T 32151.38-2024温室气体排放核算与报告要求 第38 部分:水泥制品生产企业.pdf
- 中国国家标准 GB/T 32151.38-2024温室气体排放核算与报告要求 第38 部分:水泥制品生产企业.pdf
- 《GB/T 22069-2024燃气发动机驱动空调(热泵)机组》.pdf
- GB/T 22069-2024燃气发动机驱动空调(热泵)机组.pdf
- 中国国家标准 GB/T 22069-2024燃气发动机驱动空调(热泵)机组.pdf
- 中国国家标准 GB/T 11064.1-2024碳酸锂、单水氢氧化锂、氯化锂化学分析方法 第1部分: 碳酸锂含量的测定 滴定法.pdf
- GB/T 11064.1-2024碳酸锂、单水氢氧化锂、氯化锂化学分析方法 第1部分: 碳酸锂含量的测定 滴定法.pdf
- 《GB/T 11064.1-2024碳酸锂、单水氢氧化锂、氯化锂化学分析方法 第1部分: 碳酸锂含量的测定 滴定法》.pdf
- GB/T 1148-2024内燃机 铝活塞.pdf
- 中国国家标准 GB/T 1148-2024内燃机 铝活塞.pdf
文档评论(0)