极融并行集群文件系统技术白皮书2018211.pdfVIP

下载本文档

0
0
约9.93千字
约 14页
2019-03-07 发布于浙江
举报
版权申诉

极融并行集群文件系统技术白皮书2018211.pdf

1、本文档共14页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

极融并行集群文件系统技术白皮书 2018.2.11 1. ParaFS 设计目标极融并行集群文件系统(ParaFS),是专门为大中型大数据平台打造的超大规模文件存储系统;支持高达1000PB 级的文件存储。主要的应用场景是大规模语义里的热数据处理。完全兼容Hadoop 生态;考虑性能和稳定的原因,可无缝替换hadoop 生态中的HDFS;考虑“去IOE” 政策,ParaFS 同样可以无缝替换Google 大数据平台中的GFS2。 ParaFS的设计目标旨在把大批量普通的、不可靠的、廉价的服务器组织起来，向外提供海量的、无差别的、高可用的数据处理服务。从外部的角度看，ParaFS如同一个巨大的，有序的，可伸缩的存储资源池，同时也具备大规模的抽象化计算能力。因而，ParaFS从宏观角度上来说分成两部分，一部分是把硬件资源组织起来，变成一个可统一调度的资源；另一部分把资源抽象化后，组织成标准的文件系数统接口。从外部的角度看，ParaFS的运行实体是一个存储集群，一个集群是一个整体的存储单位，不管集群由多少台物理计算机组成。总结为以下几个要点： 1. 支持商用场景的海量文件存储系统； 2. 信息安全贯穿整个产品生命周期； 3. 支持1000PB 级的文件存储; 4. 支持超大型文件，也支持海量超小文件； 5. 支持在线扩容,支持弹性扩容； 6. 兼容hadoop 生态（支持hadoop fs 接口），也支持仿posix 接口。 2. 极融并行集群文件系统解决什么问题在开源大数据基础平台Hadoop 中，有两个主要的子系统：Hadoop 分布式文件系统 HDFS 和 Hadoop Map/Reduce ；hadoop HDFS 通过 Namenode 来维护整个文件系统的索引信息；对于任何一个HDFS 文件， Namenode 会在内存中维护两种meta data：第一种:1）HDFS 文件和 block 的对应关系，2）block 在data node 上存放的位置。Namenode 会在磁盘上保存第一种meta data，第二种：meta data 则是DataNode 通过block report 定时发送给NameNode。以上架构虽然简洁明了，但也出现以下三个问题: 1. 性能问题, 一系列测试发现，尤其是同硬件的理论性能相比， Hadoop 在性能上还有很大的提高空间，造成这个的原因主要有：在当前Hadoop 的设计中，所有的meta data 操作都要通过集中式的Namenode 来进行，Namenode 有可能是性能的瓶颈；M/R 应用程序需要通过DataNode 来访问HDFS, 这就涉及到频繁的进程切换和网络传输开销；还有在M/R 应用程序端的开销也有值得改进的地方。 2. 可扩展性和可靠性,当前的 Hadoop 采用单一 Namenode ，单一 Jobtracker 的设计，严重制约了整个 Hadoop 的可扩展性和可靠性。首先，Namenode 和Jobtracker 是整个系统中明显的单点故障源（SPOF）。其次，单一Namenode 的内存容量有限，使得Hadoop 集群的节点数量被限制到2000 个左右，能支持的文件系统大小被限制在10-50PB, 最多能支持的文件数量大约为1.5 亿左右（注：实际数量取决于Namenode 的内存大小）。并且集中式的Namenode 使得DataNode 的blocks report 也会对Namenode 的性能造成严重的影响。例如:系统有1800 个Datanode，每个Datanode 有3T 存储，整个集群大约有 1.8P 有效存储（1800*3T/3，假设每个数据块有3 份replica）。那么每个Datanode 上有大约50000 个左右的block （假设block 大小是64M，然后有的block 并没有达到 64M 大小），假设Datanode 每小时会发送一次block report，那么Namenode 每两秒会收到一次block report，每个block report 包含50000 条数据，处理这些数据无疑会占用相当资源。实际上，有用户抱怨其集群的Namenode 重启需要数小时，这大大降低了系统的可用性。 3. 各种企业