HDFS(分布式文件系统)的特点.docx

  1. 1、本文档共2页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

HDFS(分布式文件系统)的特点

随着互联网的发展,所产生的数据越来越多,传统的单机文件系统已经不能满足需求,进而产生了分布式文件系统HDFS。作为分布式文件系统,HDFS能够解决海量数据的存储问题,其具有的优点如下:

(1)高容错性

HDFS上传的数据自动保存多个副本,通过增加副本的数量来提高HDFS的容错性。如果某一个副本丢失,那么HDFS将复制其他节点上的副本。

(2)适合大规模数据的处理

HDFS能够处理上百万的GB、TB甚至PB级别的数据,数量非常大。

(3)流式数据访问

HDFS以流式数据访问模式来存储超大文件,有着“一次写入,多次读取”的特点,文件一旦写入,不能修改,只能增加,以保证数据的一致性。当然HDFS也不是完美的,同样存在局限性,其具有如下缺点:

(1)不适合低延迟数据访问

若处理一些低延迟应用请求,则不适合使用HDFS。HDFS是为了处理大型数据集分析任务而设计的,目的是达到较高的数据吞吐量,通常是需要以高延迟作为代价的。

(2)无法高效存储大量小文件

因为NameNode将文件系统的元数据存储在内存中,所以文件系统所能容纳的文件数目是由NameNode的内存大小决定的,即每存入一个文件都会在NameNode中写入文件信息。如果写入太多小文件,那么NameNode内存会被占满而无法写入更多文件信息,而与多个小文件大小相同的较大单一文件只会写入一次文件信息到内存中,因此HDFS更适合大文件存储。

(3)不支持多用户写入及任意修改文件

在HDFS的一个文件中只能有一个写入者,而且写操作只能在文件末尾完成,即只能执行追加操作。目前HDFS还不支持多用户对同一文件的写操作,以及在文件任意位置进行修改。

文档评论(0)

chinablue_133 + 关注
实名认证
内容提供者

信息系统项目管理师持证人

各类知识和解决方案的Super Sharer~~

领域认证该用户于2024年08月15日上传了信息系统项目管理师

1亿VIP精品文档

相关文档