- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
HAWQ与Hive查询性能对比测试
一、实验目的
本实验通过模拟一个典型的应用场景和实际数据量,测试并对比HAWQ内部表、外部表与Hive的查询性能。
二、硬件环境
1. 四台VMware虚机组成的Hadoop集群。
2. 每台机器配置如下:
(1)15K RPM SAS 100GB
(2)Intel(R) Xeon(R) E5-2620 v2 @ 2.10GHz,双核双CPU
(3)8G内存,8GSwap
(4)10000Mb/s虚拟网卡
三、软件环境
1. Linux:CentOS release 6.4,核心2.6.32-358.el6.x86_64
2. Ambari:2.4.1
3. Hadoop:HDP 2.5.0
4. Hive(Hive on Tez):2.1.0
5. HAWQ:
6. HAWQ PXF:3.1.1
四、数据模型
1. 表结构
实验模拟一个记录页面点击数据的应用场景。数据模型中包含日期、页面、浏览器、引用、状态5个维度表,1个页面点击事实表。表结构和关系如图1所示。
五、建表并生成数据
1. 建立hive库表
[sql] view plain copy
create database test;
use test;
create table browser_dim(
browser_sk bigint,
browser_nm varchar(100),
browser_version_no varchar(100),
flash_version_no varchar(100),
flash_enabled_flg int,
java_version_no varchar(100),
platform_desc string,
java_enabled_flg int,
java_script_enabled_flg int,
cookies_enabled_flg int,
user_language_cd varchar(100),
screen_color_depth_no varchar(100),
screen_size_txt string)
row format delimited
fields terminated by ,
stored as orc;
create table date_dim(
cal_dt date,
day_in_cal_yr_no int,
day_of_week_no int,
start_of_month_dt date,
start_of_quarter_dt date,
start_of_week_dt date,
start_of_year_dt date)
row format delimited
fields terminated by ,
stored as orc;
create table page_dim(
page_sk bigint,
domain_nm varchar(200),
reachability_cd string,
page_desc string,
protocol_nm varchar(20))
row format delimited
fields terminated by ,
stored as orc;
create table referrer_dim(
referrer_sk bigint,
referrer_txt string,
referrer_domain_nm varchar(200))
row format delimited
fields terminated by ,
stored as orc;
create table status_code_dim(
status_cd varchar(100),
client_error_flg int,
status_cd_desc string,
server_error_flg int)
row format delimited
fields terminated by ,
stored as orc;
create table pa
您可能关注的文档
- 基于Zigbee的智能家居环境监测系统的设计 毕业论文 (1).doc
- 基于TOP225Y开关电源的设计 开关电源毕业设计.doc
- 肩周炎课件-精简版.ppt
- 2012非ST段抬高急性冠状动脉综合征诊断和治疗指南 - 副本.pdf
- 毕业论文---单相逆变电源的设计(含外文翻译) (1).doc
- (繁体)机组使用说明书机调24AEFG-中英对照.pdf
- 《矿业》专项练习合集.pdf
- 《计算机操作系统》.docx
- 《软件工程》实验指导与报告书.doc
- 『原创』必威体育精装版班组建设方案.docx
- GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 中国国家标准 GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs).pdf
- 《GB/T 39560.10-2024电子电气产品中某些物质的测定 第10部分:气相色谱-质谱法(GC-MS)测定聚合物和电子件中的多环芳烃(PAHs)》.pdf
- GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- 中国国家标准 GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 中国国家标准 GB/T 39560.302-2024电子电气产品中某些物质的测定 第3-2部分:燃烧-离子色谱法(C-IC)筛选聚合物和电子件中的氟、氯和溴.pdf
- GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样.pdf
- 《GB/T 39560.2-2024电子电气产品中某些物质的测定 第2部分:拆解、拆分和机械制样》.pdf
- 《GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯》.pdf
- 中国国家标准 GB/T 39560.303-2024电子电气产品中某些物质的测定 第3-3部分:配有热裂解/热脱附的气相色谱-质谱法(Py/TD-GC-MS)筛选聚合物中的多溴联苯、多溴二苯醚和邻苯二甲酸酯.pdf
文档评论(0)