- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Sqoop数据导入工具节知识点掌握程度Sqoop概述Sqoop 简介 了解Sqoop架构了解Sqoop导入导出数据原理 掌握实验环境说明掌握Sqoop1工具使用安装部署 Sqoop1 掌握mysql导入到hdfs掌握HDFS导出到mysql掌握将mysql数据导入到hive掌握Hive数据导出到Mysql掌握Mysql导入到hbase掌握Sqoop2工具使用(可选)安装部署 Sqoop2 掌握客户端使用掌握mysql与hdfs之间互操作掌握本章教学内容本课程的目标是帮助学员掌握Sqoop工具的使用,了解Sqoop工作原理,掌握Sqoop1 的安装配置,能够使用Sqoop1进行mysql与hdfs、hbase、hive之间的数据导入导出课程目标Sqoop概述Sqoop1工具使用课程内容Sqoop 即 SQL to Hadoop ,是一款方便的在传统型数据库与 Hadoop 之间进行数据迁移的工具,充分利用 MapReduce 并行特点以批处理的方式加快数据传输,发展至今主要演化了二大版本,Sqoop1 和 Sqoop2。Sqoop 工具是 hadoop 下连接关系型数据库和 Hadoop 的桥梁,支持关系型数据库和 hive、hdfs、hbase 之间数据的相互导入,可以使用全表导入和增量导入。 Sqoop 简介 高效可控的利用资源,任务并行度,超时时间。数据类型映射与转化,可自动进行,用户也可自定义支持多种主流数据库,MySQL,Oracle,SQL Server,DB2 等等 Sqoop 优势Sqoop1 架构 Sqoop导入与导出在导入开始之前,Sqoop使用JDBC来检查将要导入的表,检索出表中所有的列以及列的SQL数据类型,这些SQL类型(VARCHAR、INTEGER)被映射到Java数据类型(String、Integer等),在MapReduce应用中将使用这些对应的java类型来保存字段的值。Sqoop的代码生成器使用这些信息来创建对应表的类,用于保存从表中抽取的记录。JDBC的ResultSet接口提供了检索记录的游标Sqoop启动的MapReduce作业,在生成反序列化代码和配置InputFormat之后,Sqoop将作业发送到MapReduce集群。Map任务将执行查询并将ResultSet中的数据反序列化到生成类的实例,写入到HDFS中。Sqoop从数据库导入到HDFS的原理Sqoop在执行导出操作之前,sqoop会根据数据库连接字符串来选择一个导出方法,一般为jdbc。sqoop会根据目标表的定义生成一个java类,这个生成的类能够从文本文件中解析记录,并能够向表中插入类型合适的值。接着会启动一个MapReduce作业,从HDFS中读取源数据文件,使用生成的类解析记录,并且执行选定的导出方法。Sqoop从HDFS导出到数据库的原理操作系统:Ubuntu16.04 ServerJDK版本:1.8Hadoop版本: 2.7.2Sqoop版本:sqoop-1.4.6 sqoop-1.99.7实验环境说明Sqoop概述Sqoop1工具使用课程内容下载 Sqoop/apache/sqoop//apache/sqoop/解压安装包tar -xzvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gzmv sqoop-1.4.6.bin__hadoop-2.0.4-alpha sqoop-1.4.6安装部署 Sqoop1 在.profile中配置环境变量export HADOOP_HOME=/home/hadoop/hadoop-2.7.2export? SQOOP_HOME=/home/hadoop/sqoop-1.4.6export? ZOOKEEPER_HOME=/home/hadoop/zookeeper-3.4.6export HIVE_HOME=/home/hadoop/hive-1.2.1export HBASE_HOME=/home/hadoop/hbase-1.2.4export PATH=$PATH:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$SQOOP_HOME/bin:$HIVE_HOME/bin:$ZOOKEEPER_HOME/bin:$HBASE_HOME/bin设置环境变量在sqoop配置目录中复制sqoop-env-template.sh文件为?sqoop-env.sh将hadoop的hadoop-common-2.7.2.jar包文件复制到sqoop的lib目录下将Java的MySQL连接器mysql-connector-java-5.1.39-bin.jar包文件复制到Sqoop的lib目录下复制文件修改sqoop-en
您可能关注的文档
- 二零二三年 优质公开课SQL的漏洞.pptx
- 二零二三年 优质公开课SQL语句建表.pptx
- 二零二三年 优质公开课Sqoop.pptx
- Sqoop介绍“十市联赛”一等奖.pptx
- Sqoop修改配置文件.pptx
- Sqoop修改配置文件(区一等奖).pptx
- 二零二三年 优质公开课Sqoop安装与配置.pptx
- 二零二三年 优质公开课sqoop安装使用.pptx
- Sqoop导入的数据格式问题省赛获奖.pptx
- Sqoop导入的数据格式问题.pptx
- Unit 1 Keeping Healthy Lesson 2 课件 2-经典通用.ppt
- Unit 1 Playtime Lesson 1 同步练习1-经典通用.doc
- 2019电力用户农排费控采集系统第7部分农排费控终端信息交换安全技术规范.pdf
- 2024用电信息采集系统技术规范第2部分:集中器和采集器.docx
- 2019电力用户农排费控采集系统第3部分农排费控智能电能表型式规范.pdf
- 2019电力用户农排费控采集系统第4部分农排费控智能电能表信息交换安全技术规范.pdf
- 2019电力用户农排费控采集系统第5部分农排费控终端技术规范.docx
- 2019电力用户农排费控采集系统第3部分农排费控智能电能表型式规范.docx
- 2019电力用户农排费控采集系统第2部分农排费控智能电能表功能规范.pdf
- 2020水利工程建设标准强制性条文实施指南第2部分水利工程施工.docx
文档评论(0)