- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
云计算体系结构学习课件.ppt
云计算体系结构 MapReduce分布式处理技术 MapReduce是Google开发的Java、Python、C++编程工具,用于大规模数据集(大于1TB)的并行运算,也是云计算的核心技术,一种分布式运算技术,也是简化的分布式编程模式,适合用来处理大量数据的分布式运算,用于解决问题的程序开发模型,也是开发人员拆解问题的方法。 MapReduce模式的思想是将要执行的问题拆解成Map(映射)和Reduce(化简)的方式,先通过Map程序将数据切割成不相关的区块,分配(调度)给大量计算机处理达到分布运算的效果,再通过Reduce程序将结果汇整,输出开发者需要的结果。 MapReduce的软件实现是指定一个Map(映射)函数,把键值对(key/value)映射成新的键值对(key/value),形成一系列中间形式的key/value对,然后把它们传给Reduce(化简)函数,把具有相同中间形式key的value合并在一起. map和reduce函数具有一定的关联性 1. map?(k1,v1)?-?list(k2,v2) ? 2. reduce?(k2,list(v2))?-list(v2)? * 云计算体系结构 其中v1、v2可以是简单数据,也可以是一组数据,对应不同的映射函数规则。在 Map过程中将数据并行,即把数据用映射函数规则分开,而Reduce则把分开的数据用化简函数规则合在一起,也就是说Map是一个分的过程,Reduce则对应着合。MapReduce应用广泛,包括简单计算任务、海量输入数据、集群计算环境等,如分布grep、分布排序、单词计数、Web连接图反转、每台机器的词矢量、Web访问日志分析、反向索引构建、文档聚类、机器学习、基于统计的机器翻译等。 * 云计算体系结构 Hadoop架构 在Google发表MapReduce后,2004年开源社群用Java搭建出一套Hadoop框架,用于实现MapReduce 算法,能够把应用程序分割成许多很小的工作单元,每个单元可以在任何集群节点上执行或重复执行。 此外,Hadoop 还提供一个分布式文件系统GFS(Google file system),是一个可扩展、结构化、具备日志的分布式文件系统,支持大型、分布式大数据量的读写操作,其容错性较强。 而分布式数据库(BigTable)是一个有序、稀疏、多维度的映射表,有良好的伸缩性和高可用性,用来将数据存储或部署到各个计算节点上。 Hadoop 框架具有高容错性及对数据读写的高吞吐率,能自动处理失败节点,如图3-5所示为Google Hadoop架构。 在架构中MapReduce API提供Map和Reduce处理、GFS分布式文件系统和BigTable分布式数据库提供数据存取。基于Hadoop可以非常轻松和方便完成处理海量数据的分布式并行程序,并运行于大规模集群上。 * 云计算体系结构 Google云计算执行过程 云计算服务方式多种多样,通过对Google云计算架构及技术的理解,在此我们给出用户将要执行的程序或处理的问题提交云计算的平台Hadoop,其执行过程如下图所示: * .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. .. 云计算体系结构 云计算基本原理 云计算是对分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)及分布式数据库的改进处理,其前身是利用并行计算解决大型问题的网格计算和将计算资源作为可计量的服务提供的公用计算,在互联网宽带技术和虚拟化技术高速发展后萌生出云计算。 许多云计算公司和研究人员对云计算采用各种方式进行描述和定义,基于云计算的发展和我们对云计算的理解,概括性给出云计算的基本原理为:利用非本地或远程服务器(集群)的分布式计算机为互联网用户提供服务(计算、存储、软硬件等服务)。这使得用户可以将资源切换到需要的应用上,根据需求访问计算机和存储系统。云计算可以把普通的服务器或者PC连接起来以获得超级计算机计算机的计算和存储等功能,但是成本更低。云计算真正实现了按需计算,从而有效地提高了对软硬件资源的利用效率。云计算的出现使高性并行计算不再是科学家和专业人士的专利,普通的用户也能通过云计算享受高性能并行计算所带来的便利,使人人都有机会使用并行机,从而大大提高了工作效率和计算资源的利用率。云计算模式中用户不需要了解服务器在哪里,不用关心内部如何运作,通过高速互联网就可以透明地使用各种资源。 * 云计算体系结构 云计算是全新的基于互联网的超级计算理念和模式,实现云计算需要多种技术结合,并且需要用软件实现将
您可能关注的文档
- 2018工程技术中心汇报1课件课件课件.ppt
- 中考命题 行走的风景--几何命题研究与复习思考学习课件.ppt
- 中职生就业与创业指导第七单元--华中师范大学主编:景红芹老师学习课件.ppt
- 中职生就业与创业指导第五单元--华中师范大学主编:景红芹老师学习课件.ppt
- 中职生就业与创业指导第四单元--华中师范大学主编:景红芹老师学习课件.ppt
- 中英旅游地理课程交流汇报学习课件.ppt
- 中药基础知识学习课件.ppt
- 丹东市教师进修学院 李连海13358770665lilianhai06@126.com学习课件.ppt
- 主讲人:殷守梅学习课件.ppt
- 主题团日策划书学习课件.ppt
- 2024年树脂捕捉器项目可行性研究报告.docx
- 2024年工具包装盒项目可行性研究报告.docx
- 2024至2030年沉头磁铁项目投资价值分析报告.docx
- 2024年03月云南丽江市委党校招考聘用急需紧缺教师笔试历年典型考题与考点剖析含答案详解.docx
- 2024年03月华东师范大学教育集团2024年面向全国招聘高中校长笔试历年典型考题与考点剖析含答案详.docx
- 2024至2030年中国单扶手浴缸数据监测研究报告.docx
- 2024至2030年防潮包装袋项目投资价值分析报告.docx
- 2024年垂直式扁锭铸造机项目可行性研究报告.docx
- 2024年指点标遥控处理器项目可行性研究报告.docx
- 2024至2030年户内全彩LED显示屏项目投资价值分析报告.docx
最近下载
- 部编版道德与法治三年级上8.安全记心上(教学设计)册.docx
- 2024年《信访工作条例》知识竞赛题库及答案.pdf VIP
- 2次供水单位试题.doc VIP
- 第8课 在实践中提高认识能力 课件-2023-2024学年中职高教版(2023)哲学与人生_46364012.pptx VIP
- GB_T50795-2012:光伏发电工程施工组织设计规范.pdf VIP
- 中国大唐集团公司电力生产事故调查规程(新版).docx
- GB50794-2012:光伏发电站施工规范.pdf VIP
- 健康教育特色幼儿园.pptx
- 新能源汽车专业的职业生涯规划书.pdf
- 人教版六年级上册数学全册课时练习(含答案).pdf
文档评论(0)