hadoop生态系统概述以与版本演化.pdfVIP

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
hadoop生态系统概述以与版本演化

Hadoop生态系统概 述以及版本演化 主要内容 1 Hadoop生态系统特点 2 Hadoop介绍 3 Hadoop生态系统 4 Hadoop生态系统版本演化 主要内容 1 Hadoop生态系统特点 2 Hadoop介绍 3 Hadoop生态系统 4 Hadoop生态系统版本演化 Hadoop生态系统特点 ü  源代码开源(免费) ü  社区活跃、参与者众多 ü  涉及分布式存储和计算的方方面面 ü  已得到企业界验证 Hadoop 1.0与2.0 主要内容 1 Hadoop生态系统特点 2 Hadoop介绍 3 Hadoop生态系统 4 Hadoop生态系统版本演化 Hadoop介绍: 概述 Ø 分布式存储系统HDFS (Hadoop Distributed File System ) ü 分布式存储系统 ü 提供了高可靠性、高扩展性和高吞吐率的数据存储服务 Ø 资源管理系统YARN (Yet Another Resource Negotiator ) ü 负责集群资源的统一管理和调度 Ø 分布式计算框架MapReduce ü 分布式计算框架 ü 具有易于编程、高容错性和高扩展性等优点 Hadoop介绍: 概述 MapReduce (分布式计算层) YARN (集群资源管理层) HDFS (分布式存储层) Hadoop 构成:HDFS (分布式文件系统) Ø  基本原理 ü  将文件切分成等大的数据块,存储到多台机器上 ü  将数据切分、容错、负载均衡等功能透明化 ü  可将HDFS看成一个容量巨大、具有高容错性的磁盘 Ø  应用场景 ü  海量数据的可靠性存储 ü  数据归档 Hadoop 构成:HDFS (分布式文件系统) Hadoop 构成:YARN (资源管理系统) Ø  YARN是什么 ü  Hadoop 2.0新增系统 ü  负责集群的资源管理和调度 ü  使得多种计算框架可以运行在一个集群中 Ø  YARN 的特点 ü  良好的扩展性、高可用性 ü  对多种类型的应用程序进行统一管理和调度 ü  自带了多种多用户调度器,适合共享集群环境 Hadoop 构成:YARN (资源管理系统) Hadoop 构成:YARN (资源管理系统) Hadoop 构成:MapReduce (分布式计算框架) Ø  源自于Google的MapReduce论文 ü  发表于2004年12月 ü  Hadoop MapReduce是Google MapReduce克隆版 Ø  MapReduce特点 ü  良好的扩展性 ü  高容错性 ü  适合PB级以上海量数据的离线处理 Hadoop 构成:MapReduce (分布式计算框架) Hadoop 构成:MapReduce (分布式计算框架) Hadoop 构成:MapR

您可能关注的文档

文档评论(0)

celkhn0303 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档