网站大量收购闲置独家精品文档,联系QQ:2885784924

《Hadoop技术原理》课件——3.pptx

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

Hadoop技术原理

HDFS分布式文件系统

HDFS简介

·hadoop的核心模块

Common:封装大量的API,为其他模块做技术支持

HDFS:hadoop的分布式文件系统,功能是存储海量数据YARN:分布式计算平台

MapReduce:分布式计算框架

Hadoop的核心模块

01

HDFS简介

概念

HDFS:HadoopDistributedFileSystem,是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础。

支持海量数据的存储,成百上千的计算机组成存储集群,HDFS可以运行在低成本的硬件之上,具有的高容错、高可靠性、高可扩展性、高吞吐率等特征,非常适合大规模数据集上的应用。

02

·

·特征

分布式文件系统

基于廉价的普通硬件,可以容忍硬件出错

当系统中的某一台或几台服务器出现故障的时候,系统仍可用且数据保持完整大数据集(大文件)

·HDFS适合存储大量文件,总存储量可以达到PB,EB级

·HDFS适合存储大文件,单个文件大小一般在百MB级之上

·文件数目适中

大型分布式计算的底层存储

HDFS简介

03

高容错性

·数据自动保存多个副本

·副本丢失后,自动恢复适合批处理

·移动计算而非移动数据

·数据位置暴露给计算框架适合大数据处理

·GB、TB、甚至PB级数据·百万规模以上的文件数量·10K+节点

流式文件访问

·一次性写入,多次读取·保证数据一致性

可构建在廉价机器上

·通过多副本提高可靠性·提供了容错和恢复机制

HDFS简介

·优点

04

·缺点

不适合低延迟数据访问

·比如毫秒级

·低延迟与高吞吐率

不适合小文件存取

·占用NameNode大量内存·寻道时间超过读取时间

不适合并发写入、文件随机修改·一个文件只能有一个写入者·仅支持append(追加)

HDFS简介

05

02

HDFS基本架构

2.通过水平复制,达到数据冗余的要求

机架感知,决定数据块保存的位置

DataNode硬盘DataNode硬盘DataNode

服务端

SecondaryNameNode

第二名称节点(默认在NameNode上)

HDFS

管理节点NameNode

名称节点

1.上传一个数据块

客户端

数据

block

当保存数据块的时候,NameNode会维护数据块的位置信息

HDFS基本架构

·HDFS的组成

硬盘

block

block

block

·NameNode的职责

管理维护HDFS(管理DataNode上文件Block的均衡,维持副本数量)

接收客户端的请求:上传、下载、删除文件等

维护了两个非常重要的文件:

·edits文件(操作日志文件)--记录操作日志(editlog)

主要是在NameNode已经启动情况下对HDFS进行的各种更新操作进行记录,HDFS客户端执行所有的写操作都会被记录到editlog中

·fsimage文件--HDFS的元信息

(1)包含HDFS中的所有目录和文件信息(二进制格式)

(2)对于目录来说,包含的信息主要有修改时间、访问控制权限等信息。

(3)对于文件来说,包含的信息有修改时间、访问时间、访问控制、块大小和组成一个文件块信息等;

HDFS基本架构

02

[rootDsinglecurrent]#hdfsoeu-i

03HDFS基本架构

·NameNode的职责

查看Edits

必威体育精装版的操作日志:edits_inprogress****

·都是二进制

·HDFS提供一个工具:editsviewer日志查看器----XML

edits记录了HDFS的操作日志

[rootDsinglecurrent]#cd

[rootCsingle~J#catedits.×ml

?×mlversion=1.8encod

文档评论(0)

乐毅淘文斋 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8121131046000040

1亿VIP精品文档

相关文档