网站大量收购独家精品文档,联系QQ:2885784924

Hive编程入门-weibo-大数据文档资料.docx

  1. 1、本文档共80页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Hive编程入门

集团技术平台部-核心系统-海量数据天

1

Agenda

Agenda

?简介

?部署/配置

?HiveQL编程

?HiveQLvs.SQL

什么是

什么是Hive?

建立在Hadoop上的数据仓库基础构架

什么是

什么是Hive?

?Hadoop

–OpenSourceMapReduceframework

–SponsoredbyYahoo!

?Hive

–支持SQL语义的大规模数据分析工具

–离线/数据仓库应用

–FileProcessor

–SponsoredbyFacebook

为什么选择

为什么选择Hive?

?为超大数据集设计的计算/扩展能力

–basedonHadoop

?支持SQLlike查询语言

?统一的元数据管理

为什么选择

为什么选择Hive?

?简单

selectword,count(*)

from(

select

explode(split(sentence.))word

fromarticle

)t

groupbyword

整体架构

Oracle备库爬虫数据

Oracle备库

爬虫数据

日志系统MySQL

日志系统

MySQL备库

天网调度系统DataSyncTimeTunnelDataExchange

天网调度系统

DataSync

TimeTunnel

DataExchange

HadoopMapReduceJava

Hadoop

MapReduceJavaJobs

HiveJobs

GatewayServers

Cluster:云梯1

StreamingJobs

StreamingJobs

数据平台广告BI有哪些信誉好的足球投注网站口碑B2B云梯

数据平台

广告

BI

有哪些信誉好的足球投注网站

口碑

B2B

云梯2

支付宝

数据魔方淘数据推荐系统有哪些信誉好的足球投注网站排行…量子统计

数据魔方

淘数据

推荐系统

有哪些信誉好的足球投注网站排行

量子统计

Architect

Architect

?Client端应用程序

?元数据

?编程接口

配置

配置/部署

?客户端

?元数据服务器

客户端部署

客户端部署

?依赖

–Linux

–Java1.6

–Hadoop0.18-0.20?安装

–yuminstallt_dp_dw_hive

–rpm-ivhhive.rpm

配置

配置

?环境变量

–HIVE_HOME

–HIVE_CONF_DIR

–HIVE_AUX_JARS_PATH

–HADOOP_HOME/HADOOP_CONF_DIR

?配置文件

–hive-default.xml(默认不做修改)/hive-site.xml(用户的配

置)

–perties

元数据服务器

元数据服务器

?配置

–javax.jdo.option.ConnectionURL

–javax.jdo.option.ConnectionUserName

–javax.jdo.option.ConnectionPassword

?选择一个元数据服务器

–Derby

–MySQL(推荐)

–javax.jdo.option.ConnectionDriverName

Single

SingleUserMode(Default)

Multi

MultiUserMode

HiveQL

HiveQL编程

?SQLlike,butnotthesame

数据模型

数据模型

?Database

?Table

?Partition

?File

数据类型

数据类型

?Primitive

–int/bigint/smallint/tinyint

–boolean

–double/float

–string

?Array?Map

?Struct

?没有精度/长度设定

?没有date/datetime类型

DDL

DDL

CREATE[EXTERNAL]TABLE[IFNOTEXISTS]table_name

(col_namedata_type,...)

[PARTITIONEDBY(col_namedata_type,...)]

[[ROWFORMATrow_format][STOREDAS

file_format]|[WITHSER

文档评论(0)

分享吧 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档