- 1、本文档共51页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
大数据技术原理与应用-1pdfnet
14.5.4 Impala与Hive的比较 Hive与Impala的相同点总结如下: Hive与Impala使用相同的存储数据池,都支持把数据存储于HDFS和HBase中 Hive与Impala使用相同的元数据 Hive与Impala中对SQL的解释处理比较相似,都是通过词法分析生成执行计划 图 Impala与Hive的对比 14.5.4 Impala与Hive的比较 总结 Impala的目的不在于替换现有的MapReduce工具 把Hive与Impala配合使用效果最佳 可以先使用Hive进行数据转换处理,之后再使用Impala在Hive处理后的结果数据集上进行快速的数据分析 14.6 Hive编程实践 14.6.1 Hive的安装与配置 14.6.2 Hive的数据类型 14.6.3 Hive基本操作 14.6.4 Hive应用实例:WordCount 14.6.5 Hive编程的优势 Hive上机实践详细过程,请参考厦门大学数据库实验室建设的 “中国高校大数据课程公共服务平台”中的 “大数据课程学生服务站”中的“学习指南”栏目: 学生服务站地址:/post/4331/ 学习指南栏目中包含了《Hive 实践教程》 /blog/hive-in-practice 扫一扫访问学生服务站 14.6.1 Hive的安装与配置 1. Hive安装 下载安装包apache-hive-1.2.1-bin.tar.gz 下载地址:/dyn/closer.cgi/hive/ 解压安装包apache-hive-1.2.1-bin.tar.gz至路径 /usr/local 配置系统环境,将hive下的bin目录添加到系统的path中 2. Hive配置 Hive有三种运行模式,单机模式、伪分布式模式、分布式模式。均是通过修改hive-site.xml文件实现,如果 hive-site.xml文件不存在,我们可以参考$HIVE_HOME/conf目录下的hive-default.xml.template文件新建。 安装Hive之前需要安装jdk1.6以上版本以及启动Hadoop 14.6.2 Hive的数据类型 表 Hive的基本数据类型 类型 描述 示例 TINYINT 1个字节(8位)有符号整数 1 SMALLINT 2个字节(16位)有符号整数 1 INT 4个字节(32位)有符号整数 1 BIGINT 8个字节(64位)有符号整数 1 FLOAT 4个字节(32位)单精度浮点数 1.0 DOUBLE 8个字节(64位)双精度浮点数 1.0 BOOLEAN 布尔类型,true/false true STRING 字符串,可以指定字符集 “xmu” TIMESTAMP 整数、浮点数或者字符串 1327882394(Unix新纪元秒) BINARY 字节数组 [0,1,0,1,0,1,0,1] 14.6.2 Hive的数据类型 表 Hive的集合数据类型 类型 描述 示例 ARRAY 一组有序字段,字段的类型必须相同 Array(1,2) MAP 一组无序的键/值对,键的类型必须是原子的,值可以是任何数据类型,同一个映射的键和值的类型必须相同 Map(‘a’,1,’b’,2) STRUCT 一组命名的字段,字段类型可以不同 Struct(‘a’,1,1,0) 14.6.3 Hive基本操作 1. create: 创建数据库、表、视图 创建数据库 创建数据库hive hive create database hive; 创建数据库hive。因为hive已经存在,所以会抛出异常,加上if not exists关键字,则不会抛出异常 hive create database if not exists hive; 14.6.3 Hive基本操作 创建表 在hive数据库中,创建表usr,含三个属性id,name,age hive use hive; hivecreate table if not exists usr(id bigint,name string,age int); 在hive数据库中,创建表usr,含三个属性id,name,age,存储路径为“/usr/local/hive/warehouse/hive/usr” hivecreate table if not exists hive.usr(id bigint,name string,age int) location ‘/usr/local/hive/warehouse/hive/usr’; 14.6.3 Hive基本操作 创建视图 创建视图little_
您可能关注的文档
- 培训演示文稿标题-中国标准化研究院.PDF
- 城融合发展临空经济-中国民用机场网.PDF
- 基于DS融合的混合专家知识系统故障诊断方法-JournalofElectronic.PDF
- 基于企业资源的竞争情报知识元构建与融合机制研究-情报理论与实践.PDF
- 基于情景分析的应急装备多层级协同布局问题研究-中国管理科学.PDF
- 基于微球液态阵列分子技术的沙门菌血清分型研究-中华流行病学杂志.PDF
- 基于异构描述子的新型高斯混合模型图像自动标注方法-电子测量技术.PDF
- 基于数值模拟的语言计算方法-东南大学学报.PDF
- 基于改进K-MEANS算法的舆情热点自动发现-中原工学院学报.PDF
- 基于改进经验模态я解的三维重建-四川大学学报自然科学版.PDF
- [中央]2023年中国电子学会招聘应届生笔试历年参考题库附带答案详解.docx
- [吉安]2023年江西吉安市青原区总工会招聘协理员笔试历年参考题库附带答案详解.docx
- [中央]中华预防医学会科普信息部工作人员招聘笔试历年参考题库附带答案详解.docx
- [保定]河北保定市第二医院招聘工作人员49人笔试历年参考题库附带答案详解.docx
- [南通]江苏南通市崇川区人民法院招聘专职人民调解员10人笔试历年参考题库附带答案详解.docx
- [厦门]2023年福建厦门市机关事务管理局非在编工作人员招聘笔试历年参考题库附带答案详解.docx
- [三明]2023年福建三明市尤溪县招聘小学幼儿园新任教师79人笔试历年参考题库附带答案详解.docx
- [哈尔滨]2023年黑龙江哈尔滨市木兰县调配事业单位工作人员笔试历年参考题库附带答案详解.docx
- [上海]2023年上海市气象局所属事业单位招聘笔试历年参考题库附带答案详解.docx
- [台州]2023年浙江台州椒江区招聘中小学教师40人笔试历年参考题库附带答案详解.docx
最近下载
- 关于2025年度组织生活会谈心谈话记录(书记对委员、班子主要负责人与成员)+组织生活会一对一谈心谈话记录(支委之间).pdf VIP
- 2023年新高考八省必威体育精装版名校联考高一英语试题应用文写作汇编(解析版).pdf VIP
- 10KV电缆工程拟配备的试验和检测仪器设备表.docx VIP
- 2023年韩山师范学院公共课《C语言》科目期末试卷A(有答案).docx VIP
- 深基坑开挖对周边建筑物的影响和治理方案.docx VIP
- 中考文言文总复习资料.doc
- 虾皮shopee新手卖家考试题库及答案.pdf VIP
- 2009上汽荣威r550维修手册电路图原厂.pdf
- 家庭教育指导师国家职业标准(2024版).pdf
- 庆阳市交通运输局所属事业单位选调工作人员笔试真题2023.docx VIP
文档评论(0)