大数据存储与处理-第五讲.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
逻辑表到物理存储-HFile ?→ ?Block ? 逻辑表到物理存储-HFile ?→ ?HDFS ?Block ? ? 速度 ? 速度的关键 ? !? 第1步:快速找到RegionServer ? !? 第2步:快速找到HFile ? ? 第1步:定位RegionServer ? !? 如何通过表名和行关键字找到所在的RegionServer? ? 定位RS-找到Region(.META.表) ? !? .META.表 ? –? 存储了所有表的元数据信息 ? –? 支持以表名和行关键字(或关键字的范围)查找到对应的RegionServer ? ? 行关键字:表名、此Region起始关键字和Region的id ? –? info:regioninfo:记录Region的一些必要信息 ? –? info:server:Region所在的RegionServer的地址和端口 ? –? infor.serverstartcode:RegionServer对应.META.表持有进程的启动时间 ? 第32页 ? 行关键字 table, ?region ?start ?key, ?region ?id 列1 info:regioninfo 列2 info:server 列3 info:serverstartcode 定位RS-找到.META.(-ROOT-表) ? !? -ROOT-表 ? –? 根数据表,存放了.META.表的HRegionServer信息,存放在Zookeeper服务器 ? –? -ROOT-表的Region不会被拆分,永远只有一个 ? –? 客户端首次访问获取-ROOT-表的位置并存入缓存 ? –? 行关键字:每个.META.表的Region索引 ? –? info:regioninfo:记录Region的一些必要信息 ? –? info:server:Region所在的RegionServer的地址和端口 ? –? info.serverstartcode:RegionServer对应.META.表持有进程的启动时间 ? 行关键字 .META. ?Region ?Key 列1 info:regioninfo 列2 info:server 列3 info:serverstartcode 第2步-快速找到HFile ? 定位HFile-Memstore与Store对StoreFile的索引 ? !? B+ ?tree(RDMBS时代的索引表) ?→ ? ?LSM ?tree ? –? 查询优化 ?VS. ?插入优化 ? –? 内存 ?VS. ?磁盘 ? /viewdoc/summary?doi=4.2782 ? 定位HFile-Memstore带来的问题 ? !? memStore带来的问题:RegionServer宕机怎么办? ? –? Write-Ahead ?Logging ?(WAL)+HLog ? 本节目录 ? !? 为什么需要HBase ? !? HBase特性及实现原理 ? !? Hbase的部署与操作流程 ? HBase典型物理部署 ? !? !? MasterServer控制节点 ? –? HBase的HMaster ? –? HDFS的NameNode ? –? MapReduce的JobTracker ? RegionServer ? –? R、M1、M2存放-ROOT-表 和.META.表 ? –? 数据表存放在Region ? Server ?U1至Un中 ? –? Region ?Server ?U1至Un部署 了HDFS的DataNode组件以 提高数据访问效率 ? –? Region ?Server ?U1至Un运行 MapReduce作业时的 TaskTracker ? HBase读/写数据流程 ? !? Client首次读取tableA中第1行数据: ? –? 从Zookkeeper中获取-ROOT-表的Region服务器R(步骤①) ? –? 从Region ?Server ?R中根据表的名称索引找到.META.表所在的Region服务器M1(步骤②) ? –? C

您可能关注的文档

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档