大数据技术与应用基础第5章MapReduce应用开发.pptx

大数据技术与应用基础第5章MapReduce应用开发.pptx

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
能力 CAPACITY 要求 了解Mapreduce的定义、功能和发展历程。 理解Map过程与Reduce过程的工作模式与任务调度。 掌握使用Hadoop进行分布式运算的方法与技能。 编写和运行第一个MapReduce程序之前的准备 配置Hadoop MapReduce开发环境 MapReduce应用案例 一、配置Hadoop MapReduce开发环境 Windows 7 64位操作系统 hadoop2.6.0 Eclipse hadoop-eclipse-plugin-2.6.0.jar 系统环境及所需文件 安装Eclipse 安装配置时所用的Eclipse版本是Eclipse IDE for Java EE Developers,其下载地址如下: /downloads/download.php?file=/technology/epp/downloads/release/neon/R/eclipse-jee-neon-R-win32-x86_64.zipmirror_id=448 一、配置Hadoop MapReduce开发环境 安装Eclipse 将下载好的Eclipse压缩包解压,即完成安装配置。 向Eclipse中添加插件 插件包hadoop-eclipse-plugin-2.6.0.jar充当的作用是使Eclipse连接Hadoop集群,方便在Eclipse上面进行hadoop mapreduce方面的开发。 该插件包可以在网上有哪些信誉好的足球投注网站关键字进行下载,将下载下来的插件包复制进Eclipse安装目录中的plugins文件夹中,再重启Eclipse即可。 在Eclipse中添加map/reduce Locations窗口的方式: 依次选择“Window”→“Show View”→“Other”,打开MapReduce Tools选择Map/Reduce Locations然后单击“OK”按钮。这样就能在Eclipse上通过Map/Reduce Locations窗口进行Hadoop location添加删除和配置等操作。 一、配置Hadoop MapReduce开发环境 通过Eclipse来管理Hadoop HDFS 修改集群中namenode节点的hdfs-site.xml,添加如下内容: property namedfs.permissions/name valuefalse/value /property 在Map/Reduce Locations窗口中 添加一个名为hadoop的Hadoop location 然后重启Hadoop集群,即可在Eclipse中管理 HDFS,进行一些增删改查看等操作。 配置Hadoop MapReduce开发环境 编写和运行第一个MapReduce程序之前的准备 MapReduce应用案例 一、编写和运行第一个MapReduce程序之前的准备 Windows 7 64位操作系统 hadoop2.6.0 Eclipse hadoop.dll winutils.exe java jdk1.8.0 系统环境及所需文件 建立运行MapReduce程序的依赖 (1)下载安装Hadoop (2)下载hadoop.dll winutils.exe并将其添加到windows下的Hadoop安装目录中的bin目录里。 (3)在Eclipse中设置Windows中Hadoop安装目录的绝对路径。 “Window”→“Preferences”→“Hadoop Map/Reduce”。 一、编写和运行第一个MapReduce程序之前的准备 在Eclipse中新建一个maven工程; 建立编写MapReduce程序的依赖包 (1)在Eclipse Project Explorer窗口右击,选择“New”→“Other”; (2)选择“Maven Project” →“Next”; (3)选择相应的maven架包→“Next”; (4)根据实际情况进行配置→“Finish”; 在新建的maven工程里,找到pom.xml。在这里可以添加编写MapReduce程序所需要的依赖包。进入/,在有哪些信誉好的足球投注网站栏上查找你所需要添加的依赖包,选择对应的Hadoop版本号,然后单击进入。将其中Maven选项栏里的内容复制粘贴到pom.xml中保存,即可自动下载。 一、编写和运行第一个MapReduce程序之前的准备 下载完成后的结果 建立编写MapReduce程序的依赖包 编写和运行第一个MapReduce程序之前的准备 MapReduce应用案例 配置Hadoop MapReduce开发环境 三、MapReduce应用案例 MapReduce应用案例 三、MapReduce应用案例 在HDFS根目录下 有一文件words,

文档评论(0)

132****9295 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档