- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
本文由简悦SimpRead转码,原文地址
你好,我是你的Spark老师范东来,今天是本课程基础模块的第一节课,我们来聊聊一个比较基础也比
较重要的内容MapReduce,说它基础,是因为它诞生的时间实在是太久远了,并不是什么新东西,说
它重要则是因为基于它的提出衍生出很多重要的技术,比如我们关心的Spark。
今天的内容主要有以下几点:
1.的三驾马车;
2.MapReduce编程模型与MapReduce计算框架;
3.并发与并行;
4.如何理解分布式计算框架的编程接口与背后的工程实现。
###
的三驾马车
USNew把计算机科学分为4个领域:人工智能、编程语言、系统以及理论。其中的系统领域有两大顶
级会议,一个是ODSI(USENIXconferenceonOperatingSystemsDesignandImplementation),
另一个是SOSP(ACMSymposiumonOperatingSystemsPrinciples),这两个会议在业界的分量非
常重,如果把近几十年关于这两个会议的重要收录到一本书,就可以看作是操作系统和分布式系统
的一本教科书。
从2003年到2006年,分别在ODSI与SOSP了3篇,引起了业界对于分布式系统的
广泛讨论,这三篇分别是:
SOSP2003:TheFileSystem;
ODSI2004:MapReduce:SimplifedDataProcessingonLargeClusters;
ODSI2006:Bigtable:ADistributedStorageSystemforStructuredData。
在2006年,首席执行官提出了云计算这个,的这3篇也被称为
的三驾马车,代表大数据处理的基石、云计算的基础。不过值得注意的是,虽然
作为业界领军者经常会将自己的技术开源出来,但是客观地讲,开源出来的技术并不是
的技术,中间甚至会有代差,这也侧面反映出的技术实力。
第1篇主要讨论分布式文件系统,第2篇主要讨论的分布式计算框架,第3篇则主要讨论
分布式数据。这3篇揭开了分布式系统神秘的面纱,为大数据处理技术做出了重要的贡献。
有了这3篇的理论基础与后续的一系列文章,再加上开源社区强大的实践能力,Hadoop、
HBase、Spark等很快走上了台前,大数据技术开始呈现出一个百花齐放的状态。
###
MapReduce编程模型与MapReduce计算框架
在的第2篇文章中,很明确地表示MapReduce是其实现的一个分布式计算框架,其编程
模型名为MapReduce。开源社区基于这篇的内容,照猫画虎地实现了一个分布式计算框架,也叫
作MapReduce。但一些书籍和网上的资料在提到MapReduce的时候并未说明,容易造成困惑。其实
拿编程模型的名字直接作为计算框架的名字这种例子还有很多,比如Dataflow。而
MapReduce有两个含义,一般来说,在说到计算框架时,我们指的是开源社区的MapReduce计算框
架,但随着新一代计算框架如Spark、Flink的崛起,开源社区的MapReduce计算框架在生产环境中
使用得越来越少,逐渐舞台。
MapReduce的第二个含义是一种编程模型,这种编程模型于古老的函数式编程思想,在Lisp等比
较老的语言中也有相应的实现,并随着计算机CPU单核性能以及数量的飞速提升在分布式计算中
焕发出新的生机。
MapReduce模型将数据处理方式抽象为map和reduce,其中map也叫映射,顾名思义,它表现的
是数据的一对一映射,通常完成数据转换的工作,如下图
您可能关注的文档
- 饮食补品红三叶草red clover tablets1423.pdf
- 交货前产品检查共编号j436-数量单位期ibj 0284IBJ0279.pdf
- 高纯度一个优秀运营怎么样把控你用户.pdf
- 计算机体系结构实验5.pdf
- f2管理会计模拟考试问题纸时间允许小时mock exam dec 2015F2.pdf
- 2025运动户外市场趋势洞察.pdf
- 艾瑞咨询:2025年中国女性私密健康白皮书.pptx
- 艾瑞咨询:2025年中国互联网麦克风行业研究报告.pptx
- B2B 电子商务入门的终极指南.docx
- 艾瑞咨询:2025年中国互联网麦克风行业研究报告.docx
- 国家安全教育大学生读本高教社2024年8月版课件全套合集(包括绪论总共11章PPT课件).pdf
- 国家安全教育大学生读本高教2024版课件-第三章更好统筹发展和安全.pptx
- 国家安全教育大学生读本高教社2024年8月版教材讲义-第四章 坚持以人民安全为宗旨.docx
- 国家安全教育大学生读本高教2024版课件-第九章筑牢其他各领域国家安全屏障-.pptx
- 国家安全教育大学生读本高教2024版课件-第一章完全准确领会总体国家安全观.pptx
- 国家安全教育大学生读本高教社2024年8月版-导论课件.pptx
- (已瘦身)国家安全教育大学生读本高教社2024年8月版课件全套合集(包括绪论总共11章PPT课件).pptx
- 市直单位党员干部2024年度组织生活会对照检查材料四个带头+上年度查摆问题整改落实情况+自我批评意见.docx
- 某中学委员会关于巡察整改进展情况的报告材料.docx
- 经验交流发言材料:“五向发力”建强堡垒 集聚高质量发展动能.docx
文档评论(0)