- 1、本文档共2页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
HDFS(分布式文件系统)的特点
随着互联网的发展,所产生的数据越来越多,传统的单机文件系统已经不能满足需求,进而产生了分布式文件系统HDFS。作为分布式文件系统,HDFS能够解决海量数据的存储问题,其具有的优点如下:
(1)高容错性
HDFS上传的数据自动保存多个副本,通过增加副本的数量来提高HDFS的容错性。如果某一个副本丢失,那么HDFS将复制其他节点上的副本。
(2)适合大规模数据的处理
HDFS能够处理上百万的GB、TB甚至PB级别的数据,数量非常大。
(3)流式数据访问
HDFS以流式数据访问模式来存储超大文件,有着“一次写入,多次读取”的特点,文件一旦写入,不能修改,只能增加,以保证数据的一致性。当然HDFS也不是完美的,同样存在局限性,其具有如下缺点:
(1)不适合低延迟数据访问
若处理一些低延迟应用请求,则不适合使用HDFS。HDFS是为了处理大型数据集分析任务而设计的,目的是达到较高的数据吞吐量,通常是需要以高延迟作为代价的。
(2)无法高效存储大量小文件
因为NameNode将文件系统的元数据存储在内存中,所以文件系统所能容纳的文件数目是由NameNode的内存大小决定的,即每存入一个文件都会在NameNode中写入文件信息。如果写入太多小文件,那么NameNode内存会被占满而无法写入更多文件信息,而与多个小文件大小相同的较大单一文件只会写入一次文件信息到内存中,因此HDFS更适合大文件存储。
(3)不支持多用户写入及任意修改文件
在HDFS的一个文件中只能有一个写入者,而且写操作只能在文件末尾完成,即只能执行追加操作。目前HDFS还不支持多用户对同一文件的写操作,以及在文件任意位置进行修改。
您可能关注的文档
- 风机盘管系统的新风供给方法.docx
- 风机盘管的分类方法.docx
- 双风道式空调系统的工作原理.docx
- 全空气式空调系统的工作原理.docx
- HDFS(分布式文件系统)宕机处理的方法.docx
- 大数据的数据处理过程.docx
- 云计算的运行维护方法.docx
- 轻量级虚拟化Docker容器原理.docx
- 虚拟桌面技术介绍.docx
- 服务器虚拟化技术介绍.docx
- 甘肃省白银市会宁县第一中学2025届高三3月份第一次模拟考试化学试卷含解析.doc
- 2025届吉林市第一中学高考考前模拟生物试题含解析.doc
- 四川省三台县芦溪中学2025届高三下第一次测试生物试题含解析.doc
- 2025届江苏省启东市吕四中学高三适应性调研考试历史试题含解析.doc
- 浙江省宁波市十校2025届高三二诊模拟考试历史试卷含解析.doc
- 甘肃省甘南2025届高考生物必刷试卷含解析.doc
- 河北省石家庄市一中、唐山一中等“五个一”名校2025届高考历史四模试卷含解析.doc
- 江西省南昌市进贤一中2025届高考生物考前最后一卷预测卷含解析.doc
- 甘肃省白银市会宁县第四中学2025届高三第二次模拟考试历史试卷含解析.doc
- 宁夏银川市宁夏大学附属中学2025届高考化学押题试卷含解析.doc
文档评论(0)