- 1、本文档被系统程序自动判定探测到侵权嫌疑,本站暂时做下架处理。
- 2、如果您确认为侵权,可联系本站左侧在线QQ客服请求删除。我们会保证在24小时内做出处理,应急电话:400-050-0827。
- 3、此文档由网友上传,因疑似侵权的原因,本站不提供该文档下载,只提供部分内容试读。如果您是出版社/作者,看到后可认领文档,您也可以联系本站进行批量认领。
Hive
编程指南
(中文版)
目录
第1章基础知识
1.1Hadoop和MapReduce综述
MapReduce
1.2Hadoop生态系统中的Hie
1.2.1Pig
1.2.2HBase
1.2.3CascadingsCrunch及其他
1.3Jaa和Hie:词频统计算法
1.4后续事情
第2章基础操作
2.1安装预先配置好的虚拟机
2.2安装详细步骤
2.2.1装Jaa
2.2.2安装Hadoop
2.2.3本地模式、伪分布式模式和分布式模式
2.2.4测试Hadoop
2.2.5安装Hie
2.3Hie内部是什么
2.4启动Hie
2.5配置Hadoop环境
2.5.1本地模式配置
2.5.2分布式模式和伪分布式模式配置
2.5.3使用JDBC连接元数据
2.6Hie命令
命令选项
2.7命令行界面
2.7.1CLI选项
2.7.2变量和属性
2.7.3Hie中“一次使用”命令
2.7.4从文件中执行Hie查询
2.7.5hierc文件
2.7.6使用HieCL1的更多介绍
2.7.7查看操作命令历史
2.7.8执行shell命令
2.7.9在Hie内使用Hadoop的dfs命令
2.7.10Hie脚本中如何进行注释
2.7.11显示字段名称
第3章数据类型和文件格式
3.1基本数据类型
3.2集合数据类型
3.3文本文件数据编码
3.4读时模式
第4章HieQL:数据定义
4.1Hie中的数据库
4.2修改数据库
4.3创建表
4.3.1管理表
4.3.2外部表
4.4分区表、管理表
4.4.1外部分区表
4.4.2自定义表的存储格式
4.5删除表
4.6修改表
4.6.1表重命名
4.6.2增加、修改和删除表分区
4.6.3修改列信息
4.6.4增加列
4.6.5删除或者替换列
4.6.6修改表属性
4.6.7修改存储属性
4.6.8众多的修改表语句
第5章HieQL:数据操作
5.1向管理表中装载数据
5.2通过查询语句向表中插入数据
动态分区插入
5.3单个查询语句中创建表并加载数据
5.4导出数据
第6章HieQL:查询
6.1SELECT-FROM语句
6.1.1使用正则表达式来指定列
6.1.2使用列值进行计算
6.1.3算术运算符
6.1.4使用函数
6.1.5LIMIT语句
6.1.6列别名
6.1.7嵌套SELECT语句
6.1.8CASE•••WHEN…THEN句式
6.1.9什么情况FHie可以避免进行MapReduce
6.2WHERE语句
6.2.1谓词操作符
6.2.2关于浮点数比较
6.2.3LIKE和RLIKE
6.3GROUPBY语句
HAVING语句
6.4JOIN语句
6.4.1INNERJOIN
6.4.2JOIN优化
6.4.3LEFTOUTERJOIN
6.4.4OUTERJOIN
6.4.5RIGHTOUTERJOIN
6.4.6FULLOUTERJOIN
6.4.7LEFTSEMI-JOIN
6.4.8笛卡尔积JOIN
6.4.9map-sideJOIN
6.5ORDERBY和SORTBY
6.6含有SORTBY的DISTRIBUTEBY
6.7CLUSTERBY
6.8类型转换
类型转换BINARY值
6.9抽样查询
6.9.1数据块抽样
6.9.2分桶表的输入裁剪
6.10UNIONALL
第7章HiveQL:图
7.1使用
文档评论(0)