基于Hadoop的数据分析.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实 验 报 告 (2014 / 2015 学年 第 二 学期) 课程名称 云计算 实验名称 基于Hadoop的数据分析 2015 年 5 月 20 日 指导单位 指导教师 学生姓名 班级学号 学院(系) 专 业 实 验 报 告 实验名称 指导教师 实验类型 上机 实验学时 2 实验时间 2015.5.20 实验目的和要求 【实验要求】 掌握基于Hadoop单机版的 学会不同数据集与挖掘 虚拟机Ubuntu14.04,hadoop-1.2.1,eclipse-SDK-4.3.1 三、实验原理及内容 (1)在第一次实验的基础上安装eclipse 1.将eclipse解压到usr/local目录下: sudo tar xzvf eclipse-SDK-4.3.1-linux-gtk-x86_64.tar.gz -C/usr/local 2.授权:sudo chmod -R 777 /usr/local/eclipse 将hadoop插件拷贝到/usr/local/eclipse/plugins下 4.设置eclipse的Java环境:在eclipse下创建一个jre文件夹sudo mkdir jre,进入该文件夹:cd jre, 加入一条连接指令ln -s /usr/lib/jvm/java-7-sun/bin bin (2)在eclipse中添加Map/Reduce:点击上方window选项,依次选择open perspective,other,Map、Reduce,如下图所示: (3)设置Map/Reduce location,选择Map/Reduce locations,new hadoop location,将其中的内容设置成下图所示的内容: 设置Advanced parameters中的tmp文件夹位置为/usr/local/hadoop/tmp,如下图所示: (4)设置hadoop的安装路径:依次点击window,preferences,Hadoop Map/Reduce,设置hadoop安装路径为/usr/local/hadoop (5)在桌面新建三个文件,如图所示: 新建一个Map/Reduce Project:右击左侧空白处,选择新建一个如下图所示的Map/Reduce Project: 点击Next,输入工程名为average,再点击finish。 新建一个Java class:右击左侧的average,依次选择New,class,设置内容如下图所示: 点击finish完成。 (8)加入Java代码: package?com.hebut.mr; import?java.io.IOException; import?java.util.Iterator; import?java.util.StringTokenizer; import?org.apache.hadoop.conf.Configuration; import?org.apache.hadoop.fs.Path; import?org.apache.hadoop.io.IntWritable; import?org.apache.hadoop.io.LongWritable; import?org.apache.hadoop.io.Text; import?org.apache.hadoop.mapreduce.Job; import?org.apache.hadoop.mapreduce.Mapper; import?org.apache.hadoop.mapreduce.Reducer; import?org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import?org.apache.hadoop.mapreduce.lib.input.TextInputFormat; import?org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; import?org.apache.hadoop.mapreduce.lib.output.TextOutputFormat; import?org.apache.hadoop.util.GenericOptionsParser; ?public?class?Score { ?public?static?class?Map?extends ?MapperLongWritable, Text, Text, IntWritable { ?//?实现map函数 ?public?void?map(LongWritable?key, Text va

文档评论(0)

xingyuxiaxiang + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档