- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第1章Hadoop概述
1.1Hadoop
从2000年开始,网络逐渐在世界各个角落流行起来,以谷歌为首的互联网公司开始从
网络中获取大量的数据,依托于这些数据,各大公司急需能够快速从海量数据中检索特定有
价值信息的技术,此时,Lucene作为高质量的开源Java产品应运而生。
Lucene最初是由DougCutting开发的。在2001年9月作为高质量的开源Java产品加入
到Apache软件的Jakarta中。随着每个版本的发布,这个项目得到明显的增强,
也吸引了的用户和开发人员。
Hadoop于ApacheNutch项目,始于2002年,是ApacheLucene的子项目之一。
2004年,在“操作系统设计与实现”(OperatingSystemDesignandImplementation,
OSDI)会议上公开了题为MapReduce:SimplifiedDataProcessingonLargeClusters
(Mapreduce:简化大规模集群上的数据处理)的,受到启发的DougCutting等人
开始尝试实现MapReduce计算框架,并将它与NDFS(NutchDistributedFileSystem)结合,
用以支持Nutch引擎的主要算法。由于NDFS和MapReduce在Nutch引擎中有着良好的应
用,所以它们于2006年2月被分离出来,成为一套完整而独立的软件,并被命名为Hadoop。
到了2008年年初,Hadoop已成为Apache的顶级项目,包含众多子项目,被应用到包括
Yahoo在内的很多互联网公司
总体来说,Hadoop是一个由Apache所开发的分布式系统基础框架,主要解决海
量数据的和分析计算的问题。不过随着Hadoop的版本升级,以及周边软件的不断出现,
现在咱们一般所提到的Hadoop其实指的是泛Hadoop生态圈,而不仅仅指Hadoop软件本
身
1.2Hadoop版本
1.2.1ApacheHadoop
Apache版本最原始(最基础)的版本,对于学习最好。2006
官网地址:
地址:
1.2.2Cloudera
Cloudera集成了很多大数据框架,对应产品CDH。2008
官网地址:
地址:
notes/topics/rg_cdh_6_download.html
(2)2009年Hadoop的创始人DougCutting也加盟Cloudera公司。Cloudera产品主要为
CDH,ClouderaManager,ClouderaSupport
(3)CDH是Cloudera的Hadoop版,完全开源,比ApacheHadoop在兼容性,安全性,
稳定性上有所增强。Cloudera的标价为每年每个节点10000。
(4)ClouderaManager是集群的软件分发及管理平台,可以在几个小时署好一个
Hadoop集群,并对集群的节点及服务进行实时。
1.2.3Hortonworks
Hortonworks文档较好,对应产品HDP。2011
Hortonworks现在已经被Cloudera公司收购,推出新的品牌CDP。
官网地址:
地址:
(1)2011年成立的Hortonworks是雅虎与硅谷风司BenchmarkCapital合资组建。
(2)公司成立之初就吸纳了大约25名至30名专门研究Hadoop的雅虎工程师,上述工程
师均在2005年开始协助雅虎开发Hadoo
文档评论(0)