MapReduce入门编程陆小马功钟浩.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
继承Mapper; 定义输入输出键值对类型; 实现setup、cleanup函数(不必须),setup函数在第一次运行,主要用于初始化;cleanup函数在最后一次运行,主要用于关闭资源等; 实现map函数,主要的逻辑处理程序,针对每条键值对记录执行一次; 1. 继承Reducer; 2. 定义输入输出键值对格式; 3. 实现setup、cleanup函数(不必须),setup函数在第一次运行,主要用于初始化;cleanup函数在最后一次运行,主要用于关闭资源等; 4. 实现reduce函数,主要的逻辑处理程序,针对所有键相同的值进行处理; * 此处实验耗时20分钟左右 1. 使用Eclipse建立MapReduce程序; 2. 编译打包java MR程序并上传到linux; 3. 执行Hadoop jar 命令; 4. 对比combiner的区别; 此处实验耗时20分钟左右 1. 使用Eclipse建立MapReduce程序; 2. 编译打包java MR程序并上传到linux; 3. 执行Hadoop jar 命令; 4. 对比combiner的区别; 此处实验耗时20分钟左右 1. 使用Eclipse建立MapReduce程序; 2. 编译打包java MR程序并上传到linux; 3. 执行Hadoop jar 命令; 4. 对比combiner的区别; 此处实验耗时20分钟左右 1. 使用Eclipse建立MapReduce程序; 2. 编译打包java MR程序并上传到linux; 3. 执行Hadoop jar 命令; 4. 对比combiner的区别; 单词计数源码分析Driver—流程 FileInputFormat Mapper Combiner Reducer Partitioner FileOutputFormat 单词计数源码分析Driver—键值对类型 Hadoop MapReduce– 单词计数源码分析Mapper Hadoop MapReduce– 单词计数源码分析Reducer 下载和安装Eclipse 1 2 MapReduce原理与编程 3 实践操作 目录 Hadoop MapReduce–—获取成绩表中最高分 打开eclipse,新建MapReduce工程; 参考上面单词计数代码编写程序; 使用eclipse的Export- JAR file工具打包成jar包,并运行; 查看输出结构:终端输出信息、Job任务监控、HDFS输出信息; Hadoop MapReduce–—获取成绩表中最高分 Mapper类 Hadoop MapReduce–—获取成绩表中最高分 Reducer类 Hadoop MapReduce–—获取成绩表中最高分 Driver类 PPT问题反馈: /tj/840.jhtml 在数据存储的位置 在数据存储的位置 在数据存储的位置 在数据存储的位置 在数据存储的位置 在数据存储的位置 在数据存储的位置 在数据存储的位置 * 在hadoop的 发行版中查看源码包 在hadoop的源码包中查看 此处实验耗时5分钟左右 1.注意数据直接使用单词计数的输出即可 此处实验耗时5分钟左右 1.注意数据直接使用单词计数的输出即可 此处实验耗时5分钟左右 1.注意数据直接使用单词计数的输出即可 此处实验耗时5分钟左右 1.注意数据直接使用单词计数的输出即可 在hadoop的 发行版中查看源码包 此处实验耗时5分钟左右 1.注意数据直接使用单词计数的输出即可 此处实验耗时5分钟左右 1.注意数据直接使用单词计数的输出即可 初始化相关配置; 新建Job,并设置主类; 设置Mapper、Reducer、Combiner; 设置输出键值对格式; 设置输入、输出文件格式以及路径; FileInputFormat 读取文件,把文件生成键值对 Mapper 针对键值对生成处理逻辑 Combiner 在map端合并部分键值对 Partitioner: 把键值对分组输送到Reducer; Reducer针对合并的键值对进行逻辑处理; FileOutput,把键值对写入到HDFS Combiner 和Partitioner放在后面讲 键值对类型一共有四个,分别对应输入输出; 加上Map端和reduce端的话,就需要设置八个; 但是实际只有四个,因为mapper的输出和reducer的输入的键值对类型是一致的 大数据,成就未来 * 大数据挖掘专家 * 大数据挖掘专家 * 大数据挖掘专家 大数据,成就未来 * 大数据挖掘专家 * 大数据挖掘专家 大数据,成就未来 Hadoop大数据开发基础 * 1 MapReduce原理与编程 目录 下载和安装Eclipse 2 实践操作

文档评论(0)

陆小马公主号 + 关注
实名认证
内容提供者

陆小马 功钟浩 分享资源

1亿VIP精品文档

相关文档