网站大量收购独家精品文档,联系QQ:2885784924

Hive编程指南(中文版).pdfVIP

  1. 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
  2. 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
  3. 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
查看更多

Hive

编程指南

(中文版)

目录

第1章基础知识

1.1Hadoop和MapReduce综述

MapReduce

1.2Hadoop生态系统中的Hie

1.2.1Pig

1.2.2HBase

1.2.3CascadingsCrunch及其他

1.3Jaa和Hie:词频统计算法

1.4后续事情

第2章基础操作

2.1安装预先配置好的虚拟机

2.2安装详细步骤

2.2.1装Jaa

2.2.2安装Hadoop

2.2.3本地模式、伪分布式模式和分布式模式

2.2.4测试Hadoop

2.2.5安装Hie

2.3Hie内部是什么

2.4启动Hie

2.5配置Hadoop环境

2.5.1本地模式配置

2.5.2分布式模式和伪分布式模式配置

2.5.3使用JDBC连接元数据

2.6Hie命令

命令选项

2.7命令行界面

2.7.1CLI选项

2.7.2变量和属性

2.7.3Hie中“一次使用”命令

2.7.4从文件中执行Hie查询

2.7.5hierc文件

2.7.6使用HieCL1的更多介绍

2.7.7查看操作命令历史

2.7.8执行shell命令

2.7.9在Hie内使用Hadoop的dfs命令

2.7.10Hie脚本中如何进行注释

2.7.11显示字段名称

第3章数据类型和文件格式

3.1基本数据类型

3.2集合数据类型

3.3文本文件数据编码

3.4读时模式

第4章HieQL:数据定义

4.1Hie中的数据库

4.2修改数据库

4.3创建表

4.3.1管理表

4.3.2外部表

4.4分区表、管理表

4.4.1外部分区表

4.4.2自定义表的存储格式

4.5删除表

4.6修改表

4.6.1表重命名

4.6.2增加、修改和删除表分区

4.6.3修改列信息

4.6.4增加列

4.6.5删除或者替换列

4.6.6修改表属性

4.6.7修改存储属性

4.6.8众多的修改表语句

第5章HieQL:数据操作

5.1向管理表中装载数据

5.2通过查询语句向表中插入数据

动态分区插入

5.3单个查询语句中创建表并加载数据

5.4导出数据

第6章HieQL:查询

6.1SELECT-FROM语句

6.1.1使用正则表达式来指定列

6.1.2使用列值进行计算

6.1.3算术运算符

6.1.4使用函数

6.1.5LIMIT语句

6.1.6列别名

6.1.7嵌套SELECT语句

6.1.8CASE•••WHEN…THEN句式

6.1.9什么情况FHie可以避免进行MapReduce

6.2WHERE语句

6.2.1谓词操作符

6.2.2关于浮点数比较

6.2.3LIKE和RLIKE

6.3GROUPBY语句

HAVING语句

6.4JOIN语句

6.4.1INNERJOIN

6.4.2JOIN优化

6.4.3LEFTOUTERJOIN

6.4.4OUTERJOIN

6.4.5RIGHTOUTERJOIN

6.4.6FULLOUTERJOIN

6.4.7LEFTSEMI-JOIN

6.4.8笛卡尔积JOIN

6.4.9map-sideJOIN

6.5ORDERBY和SORTBY

6.6含有SORTBY的DISTRIBUTEBY

6.7CLUSTERBY

6.8类型转换

类型转换BINARY值

6.9抽样查询

6.9.1数据块抽样

6.9.2分桶表的输入裁剪

6.10UNIONALL

第7章HiveQL:图

7.1使用

文档评论(0)

微传科技 + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体唐山市微传科技有限公司
IP属地河北
统一社会信用代码/组织机构代码
91130281MA0DTHX11W

1亿VIP精品文档

相关文档