- 1、本文档共28页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
玄计算平台研究
三种平■台子项目对照表
子项目HadoopOpenStackAmazon
网络管理Nova-network
数据管理HBaseNova-databaseSimpleDB
计算Map/ReduceNova-computeEC2
存储HDFSObject-storeS3
消息管理QueueSQ3
镜像管理GlanceAMI
同步管理ZookeeperNtp
监控管理Chukwa
I.Hadoop平台研究
1.1Hadoop架构
在Google发表MapReduce后,2004年开源社群用Java搭建出一套Hadoop
框架,用丁实现MapReduce算法,能够把应用程序分割成许多很小的工作单元,
每个单元可以在任何集群节点上执行或重复执行。
此外,Hadoop还提供一个分布式文件系统GFS(Googlefilesystem),是
一个可扩展、结构化、具备日志的分布式文件系统,支持大型、分布式大数据量的读
写操作,其容错性较强。
而分布式数据库(BigTable)是一个有序、稀疏、多维度的映射表,有良好的伸缩
性和高可用性,用来将数据存储或部署到各个计算节点上。Hadoop框
架具有高容错性及对数据读写的高吞吐率,能自动处理失败节点,如图3-5所示为
GoogleHadoop架构。
在架构中MapReduceAPI提供Map和Reduce处理、GFS分布式文件系统和
BigTable分布式数据库提供数据存取。基丁Hadoop可以非常轻松和方便完成处理海
量数据的分布式并行程序,并运行丁大规模集群上。
云计算架构Hadoop
MapReduceAPBigTable
(Map,Reduce)(分布式数据库)
GFS(googl盼布式文件系统)
图3-3GoogleHadoop架构
Hadoop有许多元素构成。最底部是HadoopDistributedFileSystem(HDFS),它
存储Hadoop集群中所有存储节点上的文件。HDFS的上一层是MapReduce引擎,
该引擎由JobTracker和TaskTracker组成。
HDFS和MapReduce的关系如图3-4所示:
ComputeCluster
□F5Btokl
Iksuhs
datadataMmdFEWPFSBh-liJWMfrtBW
争■申加曲uid
文档评论(0)