- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
湖南汽车工程职业学院
教师授课教案
第6周第1-4课时累计44课时
课程名称
大数据仓库HIVE
授课课题
导入:向表中装载数据
授课专业班级
大数据2101、大数据2102、大数据2103
教学目标
能熟练使用多种方式将数据装载进Hive表中;
教学要点
教学重点
使用查询语句装载数据到分区表
教学难点
使用查询语句装载数据到分区表
课型
一体化授课
教法与学法(教具)
示范演示法、任务驱动教学法、分组合作教学法
课后作业
完成智课堂作业、看视频熟练操作
教学后记
(教师课后填写)
授课教师
王海霞、黄史记
【课前复习】
表的存储格式的基本语法是什么?
【作业点评】
展示智课堂学生作业完成情况,并做点评。
【学习目标】
能熟练使用多种方式将数据装载进Hive表中;
【课程导入】
本章讨论HiveQL向表中装载数据和从表中抽取数据到文件系统的数据操作语言部分,即HiveDML。HiveDML是Hive生态系统中所有数据处理的基础。
在本章中,当讨论通过查询语言生成目标表时,大量使用了SELECT...WHERE语句。那么,我们为什么不先讲述SELECT...WHERE语句,而直到下一章也就是第8章才阐述呢?
因为我们刚讨论了如何创建数据库、创建表,就会期望先解决随之而来的下一个问题,即如何装载数据到这些表中,然后才能有数据供查询!我们假定用户已经理解了SQL的基础知识,因此这些语句对用户来说应该不陌生。如果用户对此并不熟悉,那么请到第8章获取相关更详细的介绍。
【新课讲授】
Hive没有行级别的数据插入、数据更新和删除操作,常见往表中装载数据的方式是将文件写入到表对应的目录下。
处理数据并形成信息需要对数据进行呈现。Hive环境可以接受任何可用分隔符来结构化的数据。
使用以下DML处理可以将数据装载到平台中。要将数据装载到平台,需要两个组件。
待装载数据的来源(源)
用于装载数据的表(目标)
一、使用存储在HDFS中的文件迁移数据到表
Hive支持从Hadoop分布式文件系统(HDFS)迁移数据到表。这是将数据迁移到Hive生态系统最基本的方法。
其语法如下:
LOADDATA[LOCAL]INPATHfilepath[OVERWRITE]INTOTABLEtablename
其中,所有[]中的内容都是可选项,详细语法解释如下表。
表7-1装载数据到表的语法详解
关键字
语法解释
LOADDATA
是向Hive装载数据的关键字。
LOCAL
为可选项。如果包含该关键字,则支持用户从其指定的filepath本地文件拷贝数据到HDFS的目标位置;如果省略该关键字,则从指定的HDFS中filepath迁移数据到目标位置,即Hadoop配置变量fs.default.name中设定的路径加载文件。
INPATHfilepath
如果使用LOCAL,则路径为本地文件系统:file:///user/hive/example;如果省略LOCAL,则路径为分布式文件系统路径:hdfs://namenode:9000/user/hive/example。
OVERWRITE
如果包含,支持用户将数据装载到一个早已建好的表中并且替换原来的数据;如果省略,支持用户将数据装载到一个早已建好的表中并且将新数据追加到原来的数据后面。
INTOTABLEtablename
tablename是Hive中已经存在的表的名称。
【讲练结合】
【例7-1】将HDFS文件系统中phy_course_part.txt的数据装载到表phy_course_hdfs中。
【例7-2】接着上题的基础上,将HDFS文件系统中phy_course_part2.txt的数据overwrite方式覆盖装载到表。
【新课讲授】
二、使用存储在本地文件系统中的文件拷贝数据到表
Hive支持从本地文件系统中拷贝数据到表中。
【讲练结合】
【例7-3】将本地文件系统中phy_course_part.txt的数据装载到表phy_course_local中。
【例7-4】使用执行脚本方式将本地文件系统中phy_course_part2.txt的数据覆盖装载到表中。
[hadoop@hiveroot]$hive-f/opt/script/LoadDataLocal-phy_course_local.hql
【例7-5】将本地文件系统文本文件phy_course_part.txt装载数据到分区表phy_course_partition中。
【新课讲授】
使用查询语句装载数据到表
Hive支持将从已有表查询到的数据装载到Hive生态系统中。这也是Hive导出数据的方式之一,即将Hive表中的数据导出到另一个Hive表
您可能关注的文档
- 《物流系统分析》课件 任务二 分拣作业优化.pptx
- 《物流系统分析》课件 任务一 认识仓储设施布局.pptx
- 《物流系统分析》课件 任务三 掌握库存管理任务.pptx
- 《物流系统分析》课件 项目七任务四 了解物流系统仿真实践.pptx
- 《物流系统分析》课件 项目七任务三 了解物流系统仿真技术与常用软件.pptx
- 《物流系统分析》课件 项目七任务一 认识物流系统控制.pptx
- 《物流系统分析》课件 项目二任务三 了解物流需求预测.pptx
- 《物流系统分析》课件 项目二任务二 认识物流需求分析.pptx
- 《物流系统分析》课件 项目二任务一 认识物流系统分析.pptx
- 数据仓库Hive应用实战 教案61-64课时_查询语言之简单SELECT语句.doc
- 建银国际证券-港股熊牛切换走向深化:新质生产力助力打开港股长期上升空间.pdf
- 国金证券-创业板50择时跟踪:2月进一步提升创业板50看涨比例.pdf
- 信用|关注存单和城投下沉的机会.pdf
- 政策半月观:三大方向进一步受重视.pdf
- 固定收益专题报告:建筑行业信用风险及投资价值全梳理.pdf
- AI行业跟踪报告第58期:华勤技术,AI云、端全线卡位,全面受益于AI落地.pdf
- 高频选股因子:大单因子表现继续反弹,AI增强组合持续回撤.pdf
- 投资策略研究*专题报告:科技引领“中国资产”价值重估进度加快.pdf
- 电子行业:高阶智驾加速普及,催动硬件快速放量.pdf
- 浙商证券-北汽蓝谷-600733-北汽蓝谷深度报告:联袂小马打造无人出租,携手华为进军全民智驾.pdf
文档评论(0)