- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
hive常常用命令课案
???大数据学习总结?
? 公司对大数据方面也做了不少的培训,自己也学习了一些,在实际应用中也有所体会。针对大数据和关系型数据库有几点感触比较深刻:1.数据存储位置不同。Hive 是建立在 Hadoop 之上的,所有 Hive 的数据都是存储在 HDFS 中的。而数据库则可以将数据保存在块设备或者本地文件系统中。2.数据更新。由于 Hive 是针对数据仓库应用设计的,而数据仓库的内容是读多写少的。因此,Hive 中不支持对数据的改写和添加,所有的数据都是在加载的时候中确定好的。而数据库中的数据通常是需要经常进行修改的,因此可以使用 INSERT INTO ...? VALUES 添加数据,使用 UPDATE ... SET修改数据.这也是在汇总数据比较痛苦的地方。~~(_)~~3.访问速度。hive 在查询时有延迟,因为没有索引需要扫描整个表,还有就是mapreduce框架,MapReduce本身具有较高的延迟,所以在利用它来执行hive 查询时就会多的延迟了。Hive 不适合在线数据查询,针对数据量比较小的表数据库更快一些。目前来说除了详单其他数据量还不是特别大,访问速度很多时候没有关系型数据库查询的快。????还有很多不同的地方,这里就不多说了,就简单说一下常用的命令吧:一、Hive?1.1建表:CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name? [(col_name data_type [COMMENT col_comment], ...)]? [COMMENT table_comment]? [PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)]? [CLUSTERED BY (col_name, col_name, ...)? [SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS]? [ROW FORMAT row_format]? [STORED AS file_format]? [LOCATION hdfs_path]举例说明:CREATE EXTERNAL TABLE IF NOT EXISTS IN_BILL_GG_D1512(? SOURCE_TYPE???????????????? STRING? ,BIZ_TYPE?????????????????? STRING...)PARTITIONED BY (dt string)ROW FORMAT DELIMITED? FIELDS TERMINATED BY , LINES TERMINATED BY \nLOCATION /etldata/cdr/gg/1512;1.2Hive下查看数据表信息的方法:方法1:查看表的字段信息??desc table_name;方法2:查看表的字段信息及元数据存储路径??desc extended table_name;方法3:查???表的字段信息及元数据存储路径??desc formatted table_name;
Ef:
hive desc formatted t_cdr_wn1609;
OK
# col_name data_type comment
system_type string
record_type string
msisdn string
real_number string
start_datetime string
end_datetime string
call_duration int
session_id
您可能关注的文档
- hadoop与MapReduce详细文档课案.doc
- 养殖场环境风险评估课件.doc
- 兹维博迪金融学第二版课件Chapter02课件.ppt
- 养猪场建设项目现状环境影响评估报告.doc
- Hadoop入门体验.pptx
- HAD2258C型多功能数字式四探针测试仪.doc
- 养猪场环境影响评价(全面版).doc
- Hadoop大数据技术系列二:BasicHBase.pptx
- Hadoop最全面试题整理(附目录).doc
- Hadoop本地运行模式深入理解.doc
- 亳州广场景观膜施工方案.docx
- 2025年北京住宅小区物业服务合同范例3篇.docx
- 亳州小区铁艺栏杆施工方案.docx
- 博士论文写作指导-博士生导师的角色.pptx
- 宁波锦纶股份有限公司2024年定向招聘历年高频难、易错点模拟试题附带答案完整版【原创题】.docx
- 宁波锦纶股份有限公司2024年招聘3人历年(高频重点提升专题训练)附带答案真题附答案【完整版】.docx
- 粉尘防控:人健康守护者-云母制品制造业中的粉尾污染防治.pptx
- 毕业季旅行,安全你我他-传递安全信息,保障每一次旅行.pptx
- 亳州彩钢屋面防水施工方案.docx
- 宁波锦纶股份有限公司2023-2024年招聘762人公开引进急需紧缺人才笔试参考题库答案通关秘籍题库.docx
文档评论(0)