网站大量收购独家精品文档,联系QQ:2885784924

数据仓库Hive应用实战 教案37-40课时_查看表、表结构、创建和查询分区表、表属性及存储格式.doc

数据仓库Hive应用实战 教案37-40课时_查看表、表结构、创建和查询分区表、表属性及存储格式.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

湖南汽车工程职业学院

教师授课教案

第5周第5-8课时累计40课时

课程名称

大数据仓库HIVE

授课课题

Hive基本操作

授课专业班级

大数据2101、大数据2102、大数据2103

教学目标

熟练查看表及表结构

能熟练创建和查看外部、内部分区表

理解表属性及表的存储结构

教学要点

教学重点

能熟练创建和查看外部、内部分区表

教学难点

外部分区表和内部分区表的区别及各自使用场景

课型

一体化授课

教法与学法(教具)

示范演示法、任务驱动教学法、分组合作教学法

课后作业

完成智课堂作业、看视频熟练操作

教学后记

(教师课后填写)

授课教师

王海霞、黄史记

【课前复习】

外部表和内部表的区别是什么?

【作业点评】

展示智课堂学生作业完成情况,并做点评。

【学习目标】

熟练查看表及表结构

能熟练创建和查看外部、内部分区表

理解表属性及表的存储结构

【课程导入】

本章继续HiveDDL中表的操作,主要是创建、查看、修改、保护、删除Hive中的内部表、外部表、分区表。在实现各类表的各种操作时,要特别理解各类表间的区别及各类表的表结构与表数据之间的关联。

【新课讲授】

一、查看表

1、使用SHOWTABLES命令查看当前活动数据库中的表。

【例6-9】查看当前活动的default数据库中的所有表

hiveSHOWTABLES;

2、查看指定数据库中所有表使用SHOWTABLESIN。

【例6-10】查看指定的studentdb中的数据库:

hiveSHOWTABLESINstudentdb;

3、当数据库中表非常多时,使用SHOWTABLESLIKE后跟正则表达式匹配筛选出需要查看的表名。

【例6-11】筛选出当前活动的default数据库中所有以字母s开头,以其他字符结尾的表名:

hiveSHOWTABLESLIKEs.*;

查看表结构

查看表结构的语法格式:

DESCRIBE[EXTENDED/FORMATTED][db_name.]table_name;

其中,所有[]中的内容都是可选项,详细语法解释如下表。

表6-1查看表结构语句语法详解

关键字

语法解释

DESCRIBE

用于描述表的关键字。

EXTENDED/FORMATTED

可选项,使用后会输出更详细的表结构信息。使用FORMATTED关键字比EXTENDED关键字输出的信息更详细,且可读性更高。

[db_name.]

可选项,如果表在当前所处的工作数据库下,可以省略;如果需要查看其他数据库下的表结构,则需要通过这个前缀指定表所在的数据库。

【例6-12】使用三个方式查看当前活动的default数据库中创建的city_external_one表结构。

三、分区表

1、创建和查询内部分区表

分区表改变了Hive对数据存储的组织方式,提高了查询速度。

【例6-14】创建分区表student_in_partition,以学生班级class为分区字段,并插入数据stname=Zhangsan,av_score=92.5,class=BigData1901和数据stname=Zhouhui,av_score=83.5,class=Network1901后,查看分区表的存储目录。

分区表可以创建多个分区字段,分区字段的顺序将决定谁是父目录,谁是子目录。

【例6-15】创建分区表student_in_partition2,以学生入学年份grade和学生班级class为分区字段,并插入数据stname=Luotian,av_score=88.1,grade=2018,class=BigData1801、数据stname=Wangan,av_score=75.5,grade=2018,class=BigData1802、数据stname=Zhangsan,av_score=83.5,grade=2019,class=Network1901、数据stname=Liming,av_score=80,grade=2019,class=Network1902后,查看分区表的存储目录。

分区字段(上例中是grade和class)一旦创建好,其就和普通的字段一样。对数据进行分区,最重要的原因是为了更快地查询。

【例6-16】查询student_in_partition2表中的所有数据信息。

【例6-17】查询2018年的所有班级信息。

2、创建和查询外部分区表

外部表也可以使用分区,而且这是管理大型生产数据集最常见的情况。外部和分区的结合不仅给用户提供了可以和其他工具共享数据的方式,同时也可以优化查询性能。由于用户可以

您可能关注的文档

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档