Sqoop数据库数据导入导出.docx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Sqoop数据库数据导入导出

Sqoop数据库数据导入导出Sqoop是什么?Sqoop:?SQL-to-Hadoop连接传统关系型数据库和Hadoop的桥梁把关系型数据库的数据导入到Hadoop系统(如HDFS,Hbase和Hive中)把数据从Hadoop系统里面抽取并导出到关系型数据库中利用MapReduce加快数据处理速度批处理方式进行数据传输Sqoop优势?高效、可控地利用资源任务并行度,超时时间等?数据类型映射与转换?可自动进行,用户也可自定义支持多种数据库? MySQL OraclePostgreSQL?...Sqoop1架构?Sqoop2架构?Sqoop import??将数据从关系型数据库导入Hadoop中?Sqoop与数据库Server?通信,获取数据库表的元数据信息;?Sqoop启动一个Map-Only的MR作业,利用元数据信息并行将数据写入Hadoop。??Sqoop import使用?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table cities--connnect:?指定JDBC URL??--username/password:mysql数据库的用户名??--table:要读取的数据库表bin/hadoop fs -cat cities/part-m-*1,USA,Palo Alto2,Czech Republic,Brno3,USA,Sunnyvale?Sqoop import示例?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \?--password sqoop \--table cities \?--target-dir /etl/input/citiessqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table cities \?--where country = USA?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table cities \?--as-sequencefile?sqoop import \--connect?jdbc:mysql:///sqoop?\--username sqoop \--password sqoop \--table cities \--num-mappers 10??Sqoop import—导入多个表?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--query SELECT normcities.id, \?countries.country, \? ? ? ? normcities.city \FROM normcities \?JOIN countries USING(country_id) \ WHERE $CONDITIONS \--split-by id \ --target-dir cities??Sqoop import增量导入??sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table visits \--incremental append \--check-column id \--last-value 1??适用于数据每次被追加到数据库中,而已有数据不变的情况;?仅导入id这一列值大于1的记录。??sqoop job \--create visits \--import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table visits \--incremental append \--check-column id \--last-value 0运行sqoop作业:sqoop job --exec visits?每次成功运行后,sqoop将最后一条记录的id值保存到metastore中,供下次使用。?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table

您可能关注的文档

文档评论(0)

159****0071 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档