- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Sqoop数据库数据导入导出
Sqoop数据库数据导入导出Sqoop是什么?Sqoop:?SQL-to-Hadoop连接传统关系型数据库和Hadoop的桥梁把关系型数据库的数据导入到Hadoop系统(如HDFS,Hbase和Hive中)把数据从Hadoop系统里面抽取并导出到关系型数据库中利用MapReduce加快数据处理速度批处理方式进行数据传输Sqoop优势?高效、可控地利用资源任务并行度,超时时间等?数据类型映射与转换?可自动进行,用户也可自定义支持多种数据库? MySQL OraclePostgreSQL?...Sqoop1架构?Sqoop2架构?Sqoop import??将数据从关系型数据库导入Hadoop中?Sqoop与数据库Server?通信,获取数据库表的元数据信息;?Sqoop启动一个Map-Only的MR作业,利用元数据信息并行将数据写入Hadoop。??Sqoop import使用?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table cities--connnect:?指定JDBC URL??--username/password:mysql数据库的用户名??--table:要读取的数据库表bin/hadoop fs -cat cities/part-m-*1,USA,Palo Alto2,Czech Republic,Brno3,USA,Sunnyvale?Sqoop import示例?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \?--password sqoop \--table cities \?--target-dir /etl/input/citiessqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table cities \?--where country = USA?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table cities \?--as-sequencefile?sqoop import \--connect?jdbc:mysql:///sqoop?\--username sqoop \--password sqoop \--table cities \--num-mappers 10??Sqoop import—导入多个表?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--query SELECT normcities.id, \?countries.country, \? ? ? ? normcities.city \FROM normcities \?JOIN countries USING(country_id) \ WHERE $CONDITIONS \--split-by id \ --target-dir cities??Sqoop import增量导入??sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table visits \--incremental append \--check-column id \--last-value 1??适用于数据每次被追加到数据库中,而已有数据不变的情况;?仅导入id这一列值大于1的记录。??sqoop job \--create visits \--import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table visits \--incremental append \--check-column id \--last-value 0运行sqoop作业:sqoop job --exec visits?每次成功运行后,sqoop将最后一条记录的id值保存到metastore中,供下次使用。?sqoop import \--connect?jdbc:mysql:///sqoop?\ --username sqoop \--password sqoop \--table
您可能关注的文档
- SDH题库.doc
- SDTGA5000工业分析仪说明书.doc
- Servlet详解.ppt
- SF-1无油轴承尺寸公差表__NDC标准.doc
- SF6抽真空充气装置说明书.doc
- SF6断路器作业指导书.doc
- SF500使用说明书A4.docx
- SEL551微机保护说明书.doc
- SF6继电器三通阀安装方案.docx
- SFZ型智能控制发气性能试验仪操作规程.doc
- 广东省深圳市龙岗区德琳学校初中部2022-2023学年七年级上学期期中考试英语试题(原卷版+解析).docx
- 广东省珠海市第四中学、立才学校、梅华中学2022-2023学年七年级上学期期中质量检测英语试题(原卷版+解析).docx
- 教科版2024-2025学年六年级科学上册第一单元第4课时《生物细胞》同步练习(含答案).docx
- 牛津沪教版七年级英语上册单元速记•巧练 Unit 7 【单元测试 · 提高卷】.docx
- 牛津沪教版七年级英语上册单元速记•巧练 Unit 5【单元测试 · 基础卷】.docx
- 广东省深圳市南山区太子湾学校2022-2023学年七年级上学期期中考试英语试题(原卷版+解析).docx
- 广东省深圳市南山第二外国语学校(集团)2022-2023学年七年级上学期期中考试英语试题(含听力)(原卷版+解析).docx
- 牛津沪教版七年级英语上册单元速记•巧练 2023-2024学年七年级上学期期末英语全真模拟卷(深圳适用02).docx
- 广东省阳江市江城区2022-2023学年七年级上学期期中考试英语试题(原卷版+解析).docx
- 广东省梅州市梅县区宪梓中学2022-2023学年七年级上学期期中英语试题(原卷版+解析).docx
文档评论(0)