- 1、本文档共2页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
HDFS(分布式文件系统)宕机处理的方法
数据存储在文件系统中,如果某个节点宕机,那么很容易造成数据流失。HDFS针对节点宕机也提供了有效的保护措施,具体如下:
1、副本备份
在数据存储的过程中,对每个数据块都进行了副本备份,副本个数可以自行设置。
2、副本存放
仅仅对数据进行副本备份还不够,如果所有的备份都在一个节点上,那么该节点宕机后,数据一样会丢失。因此HDFS需要有一个更有效的副本存放策略。目前使用的策略是,以存放3个副本(dfs.replication=3)为例,在同一台机器的两个节点上各备份一个副本,再在另一台机器的某个节点上存放一个副本,前者可防止当该机器的某个节点宕机时数据丢失,后者可防止当某台机器宕机时数据丢失。
3、宕机处理
宕机即人们口头常说的“死机”,当HDFS遇上宕机时将做出相应的处理。在3种不同的宕机情况下,HDFS的宕机处理方式如下。
(1)当一切运行正常时,DataNode将周期性地发送心跳信息给NameNode(默认是每3s发送一次)。如果NameNode在预定的时间内没有收到心跳信息(默认是10min),那么NameNode将认为DataNode出现了问题,并将该DataNode从集群中移除。对于HDFS而言,丢失一个DataNode意味着丢失了存储在该DataNode上的数据块的副本。同时,HDFS会检测出存储在该DataNode上的数据块的副本数量低于要求,并主动让副本数量不符合要求的数据块继续创建需要的副本,以达到满副本数量状态为止。DataNode可能因为多种原因脱离集群,如硬件故障、主板故障、电源老化和网络故障等。
(2)当HDFS读取某个数据块信息时,如果正好存储该数据块的某个节点宕机,那么客户端将会在存储该数据块的其他节点上读取数据块信息,除非其他节点损坏或该数据块在存储时损坏,否则依然可以得到该数据块的信息。同时,HDFS也会检测到该数据块副本数量不符合要求而重新补全副本数量。
(3)当HDFS存储数据时,如果需要存放数据的节点宕机,那么HDFS将会重新分配一个节点给该数据块,并备份宕机节点中的数据。
您可能关注的文档
- 风机盘管系统的新风供给方法.docx
- 风机盘管的分类方法.docx
- 双风道式空调系统的工作原理.docx
- 全空气式空调系统的工作原理.docx
- HDFS(分布式文件系统)的特点.docx
- 大数据的数据处理过程.docx
- 云计算的运行维护方法.docx
- 轻量级虚拟化Docker容器原理.docx
- 虚拟桌面技术介绍.docx
- 服务器虚拟化技术介绍.docx
- 甘肃省白银市会宁县第一中学2025届高三3月份第一次模拟考试化学试卷含解析.doc
- 2025届吉林市第一中学高考考前模拟生物试题含解析.doc
- 四川省三台县芦溪中学2025届高三下第一次测试生物试题含解析.doc
- 2025届江苏省启东市吕四中学高三适应性调研考试历史试题含解析.doc
- 浙江省宁波市十校2025届高三二诊模拟考试历史试卷含解析.doc
- 甘肃省甘南2025届高考生物必刷试卷含解析.doc
- 河北省石家庄市一中、唐山一中等“五个一”名校2025届高考历史四模试卷含解析.doc
- 江西省南昌市进贤一中2025届高考生物考前最后一卷预测卷含解析.doc
- 甘肃省白银市会宁县第四中学2025届高三第二次模拟考试历史试卷含解析.doc
- 宁夏银川市宁夏大学附属中学2025届高考化学押题试卷含解析.doc
文档评论(0)