- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Map-Reduce入门过程解释(温度示例)
?/forfuture1978/article/details/6043926Hadoop学习总结之三:Map-Reduce入门2010-11-29 21:31?2632人阅读?/forfuture1978/article/details/6043926评论(0)?javascript:void(0);收藏?/forfuture1978/article/details/6043926举报/tag/hadoophadoop/tag/%e4%bb%bb%e5%8a%a1任务/tag/inputinput/tag/outputoutput/tag/interfaceinterface/tag/iteratoriterator目录/forfuture1978/article/details/6043926(?)/forfuture1978/article/details/6043926[+]1、Map-Reduce的逻辑过程假设我们需要处理一批有关天气的数据,其格式如下:按照ASCII码存储,每行一条记录每一行字符从0开始计数,第15个到第18个字符为年第25个到第29个字符为温度,其中第25位是符号+/-0067011990999991950051507+0000+0043011990999991950051512+0022+0043011990999991950051518-0011+0043012650999991949032412+0111+0043012650999991949032418+0078+0067011990999991937051507+0001+0043011990999991937051512-0002+0043011990999991945051518+0001+0043012650999991945032412+0002+0043012650999991945032418+0078+现在需要统计出每年的最高温度。Map-Reduce主要包括两个步骤:Map和Reduce每一步都有key-value对作为输入和输出:map阶段的key-value对的格式是由输入的格式所决定的,如果是默认的TextInputFormat,则每行作为一个记录进程处理,其中key为此行的开头相对于文件的起始位置,value就是此行的字符文本map阶段的输出的key-value对的格式必须同reduce阶段的输入key-value对的格式相对应对于上面的例子,在map过程,输入的key-value对如下:(0, 0067011990999991950051507+0000+)(33, 0043011990999991950051512+0022+)(66, 0043011990999991950051518-0011+)(99, 0043012650999991949032412+0111+)(132, 0043012650999991949032418+0078+)(165, 0067011990999991937051507+0001+)(198, 0043011990999991937051512-0002+)(231, 0043011990999991945051518+0001+)(264, 0043012650999991945032412+0002+)(297, 0043012650999991945032418+0078+)在map过程中,通过对每一行字符串的解析,得到年-温度的key-value对作为输出:(1950, 0)(1950, 22)(1950, -11)(1949, 111)(1949, 78)(1937, 1)(1937, -2)(1945, 1)(1945, 2)(1945, 78)在reduce过程,将map过程中的输出,按照相同的key将value放到同一个列表中作为reduce的输入(1950, [0, 22, –11])(1949, [111, 78])(1937, [1, -2])(1945, [1, 2, 78])在reduce过程中,在列表中选择出最大的温度,将年-最大温度的key-value作为输出:(1950, 22)(1949, 111)(1937, 1)(1945, 78)其逻辑过程可用如下图表示:2、编写Map-Reduce程序编写Map-Reduce程序,一般需要实现两个函数:mapper中的map函数和reducer中的reduce函数。一般遵循以下格式:map: (K1, V1)? - list(K2, V2)public interface Mapper?extends JobConfigurable, Closeable { void map(K1 key, V
您可能关注的文档
- 文件收索作业1.docx
- 软件需求分析复习要点.doc
- 上海电视台外语频道ICS实习总结.doc
- 关于奥运会的英文原文.doc
- 教学设计整合-MODULE 5 A Lesson in a Lab.doc
- 四六级阅读理解训练.doc
- 模拟练习题十及解析.doc
- 纠正措施评审表.doc
- le passé composé-exercice.doc
- 英语泛读教程2 词汇.doc
- ltilineageof dental follicle cells and the roles runx2 over-expression enhancing osteoblast cementoblast related gene牙齿卵泡过表达在增强中与成骨细胞相关基因作用.pdf
- 改造升级数字内容汇.pptx
- 移动开发京东商城三天.pdf
- thermodynamics-engineering approach 7th edition solutions manual热力学工程学溶液.pdf
- unit6an老人试图移动这座山old man tried to move the共练习题.pptx
- uuit 6 old man tried 1a2d市一等奖优质课.pdf
- 电机损失分析用悬垂磁铁内容物概述2jac029spm-overhang.pdf
- msds-kiss collector satin lipsticksor201 kinda orangeMSDS KISS收集器缎面唇膏.pdf
- 电子政务论文范文(必威体育精装版篇).pdf
- 电子商务基础考试模拟题.pdf
最近下载
- 人血白蛋白临床应用管理中国专家共识2024解读课件.pptx VIP
- DB32/T 4446-2023 公共机构能源托管规程.docx
- 华为公司基本管理法.pdf
- 4、实验室生物安全组织管理框架图).pdf
- 中国流感疫苗市场竞争状况及前景发展趋势预测报告2025-2030年.docx
- 2023年武汉科技大学计算机科学与技术专业《数据库原理》科目期末试卷A(有答案).docx VIP
- 2024江苏常熟农村商业银行校园招聘100人笔试历年典型考题及考点剖析附带答案详解.docx
- 2025年民主生活会相互批评意见清单、批评意见及建议、自我批评意见4篇(供借鉴).docx VIP
- 2023年广东省深圳市福田区中考历史一模试卷.doc
- 2025陕投集团校园招聘(256人)笔试备考题库及答案解析.docx
文档评论(0)