- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HBase应用场景、原理与基本架构
HBase应用场景、原理与基本
架构
讲师:董西成
博客:
Open Passion Value
目录
1. HBase概述
2. HBase物理模型
3. HBase数据模型
4. HBase基本架构
5. HBase应用举例
6. 总结
2
HBase概述
HBase是一个构建在HDFS上的分布式列存
储系统;
HBase是Apache Hadoop生态系统中的重要
一员,主要用于海量结构化数据存储;
从逻辑上讲,HBase将数据按照表、行和列
进行存储。
3
Hbase是Hadoop生态系统的一个组成部分
HBase 构建在HDFS之上
Hbase 内部管理的
文件全部存储在
HDFS中
4
Hbase与HDFS对比
两者都具有良好的容错性和扩展性,都可以
扩展到成百上千个节点;
HDFS适合批处理场景
不支持数据随机查找
不适合增量数据处理
不支持数据更新
5
Hbase表的特点
大:一个表可以有数十亿行,上百万列;
无模式:每行都有一个可排序的主键和任意多的列,列可以
根据需要动态的增加,同一张表中不同的行可以有截然不同的
列;
面向列:面向列(族)的存储和权限控制,列(族)独立检
索;
稀疏:对于空(null)的列,并不占用存储空间,表可以设计
的非常稀疏;
数据多版本:每个单元中的数据可以有多个版本,默认情况
下版本号自动分配,是单元格插入时的时间戳;
数据类型单一:Hbase中的数据都是字符串,没有类型。
6
行存储与列存储
传统行式数据库
数据是按行存储的
没有索引的查询使用大量I/O
建立索引和物化视图需要花费大量时间和资源
面向查询的需求,数据库必须被大量膨胀才能满
足性能要求
列式数据库
数据是按列存储-每一列单独存放
数据即是索引
指访问查询涉及的列-大量降低系统I/O
每一列由一个线索来处理-查询的并发处理
数据类型一致,数据特征相似-高效压缩
7
目录
1. HBase概述
2. HBase数据模型
3. HBase物理模型
4. HBase基本架构
文档评论(0)