HBase应用场景、原理与基本架构.pdf

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HBase应用场景、原理与基本架构

HBase应用场景、原理与基本 架构 讲师:董西成 博客: Open Passion Value 目录 1. HBase概述 2. HBase物理模型 3. HBase数据模型 4. HBase基本架构 5. HBase应用举例 6. 总结 2 HBase概述  HBase是一个构建在HDFS上的分布式列存 储系统;  HBase是Apache Hadoop生态系统中的重要 一员,主要用于海量结构化数据存储;  从逻辑上讲,HBase将数据按照表、行和列 进行存储。 3 Hbase是Hadoop生态系统的一个组成部分 HBase 构建在HDFS之上 Hbase 内部管理的 文件全部存储在 HDFS中 4 Hbase与HDFS对比  两者都具有良好的容错性和扩展性,都可以 扩展到成百上千个节点;  HDFS适合批处理场景  不支持数据随机查找  不适合增量数据处理  不支持数据更新 5 Hbase表的特点 大:一个表可以有数十亿行,上百万列; 无模式:每行都有一个可排序的主键和任意多的列,列可以 根据需要动态的增加,同一张表中不同的行可以有截然不同的 列; 面向列:面向列(族)的存储和权限控制,列(族)独立检 索; 稀疏:对于空(null)的列,并不占用存储空间,表可以设计 的非常稀疏; 数据多版本:每个单元中的数据可以有多个版本,默认情况 下版本号自动分配,是单元格插入时的时间戳; 数据类型单一:Hbase中的数据都是字符串,没有类型。 6 行存储与列存储 传统行式数据库 数据是按行存储的 没有索引的查询使用大量I/O 建立索引和物化视图需要花费大量时间和资源 面向查询的需求,数据库必须被大量膨胀才能满 足性能要求 列式数据库 数据是按列存储-每一列单独存放 数据即是索引 指访问查询涉及的列-大量降低系统I/O 每一列由一个线索来处理-查询的并发处理 数据类型一致,数据特征相似-高效压缩 7 目录 1. HBase概述 2. HBase数据模型 3. HBase物理模型 4. HBase基本架构

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档