大厂学苑-数据人工智能基础框架hadoop hdfs.pdfVIP

大厂学苑-数据人工智能基础框架hadoop hdfs.pdf

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第1章Hadoop概述

1.1Hadoop

从2000年开始,网络逐渐在世界各个角落流行起来,以谷歌为首的互联网公司开始从

网络中获取大量的数据,依托于这些数据,各大公司急需能够快速从海量数据中检索特定有

价值信息的技术,此时,Lucene作为高质量的开源Java产品应运而生。

Lucene最初是由DougCutting开发的。在2001年9月作为高质量的开源Java产品加入

到Apache软件的Jakarta中。随着每个版本的发布,这个项目得到明显的增强,

也吸引了的用户和开发人员。

Hadoop于ApacheNutch项目,始于2002年,是ApacheLucene的子项目之一。

2004年,在“操作系统设计与实现”(OperatingSystemDesignandImplementation,

OSDI)会议上公开了题为MapReduce:SimplifiedDataProcessingonLargeClusters

(Mapreduce:简化大规模集群上的数据处理)的,受到启发的DougCutting等人

开始尝试实现MapReduce计算框架,并将它与NDFS(NutchDistributedFileSystem)结合,

用以支持Nutch引擎的主要算法。由于NDFS和MapReduce在Nutch引擎中有着良好的应

用,所以它们于2006年2月被分离出来,成为一套完整而独立的软件,并被命名为Hadoop。

到了2008年年初,Hadoop已成为Apache的顶级项目,包含众多子项目,被应用到包括

Yahoo在内的很多互联网公司

总体来说,Hadoop是一个由Apache所开发的分布式系统基础框架,主要解决海

量数据的和分析计算的问题。不过随着Hadoop的版本升级,以及周边软件的不断出现,

现在咱们一般所提到的Hadoop其实指的是泛Hadoop生态圈,而不仅仅指Hadoop软件本

1.2Hadoop版本

1.2.1ApacheHadoop

Apache版本最原始(最基础)的版本,对于学习最好。2006

官网地址:

地址:

1.2.2Cloudera

Cloudera集成了很多大数据框架,对应产品CDH。2008

官网地址:

地址:

notes/topics/rg_cdh_6_download.html

(2)2009年Hadoop的创始人DougCutting也加盟Cloudera公司。Cloudera产品主要为

CDH,ClouderaManager,ClouderaSupport

(3)CDH是Cloudera的Hadoop版,完全开源,比ApacheHadoop在兼容性,安全性,

稳定性上有所增强。Cloudera的标价为每年每个节点10000。

(4)ClouderaManager是集群的软件分发及管理平台,可以在几个小时署好一个

Hadoop集群,并对集群的节点及服务进行实时。

1.2.3Hortonworks

Hortonworks文档较好,对应产品HDP。2011

Hortonworks现在已经被Cloudera公司收购,推出新的品牌CDP。

官网地址:

地址:

(1)2011年成立的Hortonworks是雅虎与硅谷风司BenchmarkCapital合资组建。

(2)公司成立之初就吸纳了大约25名至30名专门研究Hadoop的雅虎工程师,上述工程

师均在2005年开始协助雅虎开发Hadoo

文档评论(0)

159****9610 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:6044052142000020

1亿VIP精品文档

相关文档