基于Hadoop的数据分析.doc

下载文档

14
0
约5.04千字
约 9页
2018-01-18 发布于山东
举报
版权申诉
保障服务

基于Hadoop的数据分析.doc

1、本文档共9页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

实验报告（2014 / 2015 学年第二学期）课程名称云计算实验名称基于Hadoop的数据分析 2015 年 5 月 20 日指导单位指导教师学生姓名班级学号学院(系) 专业实验报告实验名称指导教师实验类型上机实验学时 2 实验时间 2015.5.20 实验目的和要求【实验要求】掌握基于Hadoop单机版的学会不同数据集与挖掘虚拟机Ubuntu14.04，hadoop-1.2.1，eclipse-SDK-4.3.1 三、实验原理及内容 (1)在第一次实验的基础上安装eclipse 1.将eclipse解压到usr/local目录下： sudo tar xzvf eclipse-SDK-4.3.1-linux-gtk-x86_64.tar.gz -C/usr/local 2.授权：sudo chmod -R 777 /usr/local/eclipse 将hadoop插件拷贝到/usr/local/eclipse/plugins下 4.设置eclipse的Java环境：在eclipse下创建一个jre文件夹sudo mkdir jre，进入该文件夹：cd jre，加入一条连接指令ln -s /usr/lib/jvm/java-7-sun/bin bin (2)在eclipse中添加Map/Reduce：点击上方window选项，依次选择open perspective，other，Map、Reduce，如下图所示： (3)设置Map/Reduce location，选择Map/Reduce locations，new hadoop location，将其中的内容设置成下图所示的内容：设置Advanced parameters中的tmp文件夹位置为/usr/local/hadoop/tmp，如下图所示： (4)设置hadoop的安装路径：依次点击window，preferences，Hadoop Map/Reduce，设置hadoop安装路径为/usr/local/hadoop (5)在桌面新建三个文件，如图所示：新建一个Map/Reduce Project：右击左侧空白处，选择新建一个如下图所示的Map/Reduce Project：点击Next，输入工程名为average，再点击finish。新建一个Java class：右击左侧的average，依次选择New，class，设置内容如下图所示：点击finish完成。 (8)加入Java代码： package?com.hebut.mr; import?java.io.IOException; import?java.util.Iterator; import?java.util.StringTokenizer; import?org.apache.hadoop.conf.Configuration; import?org.apache.hadoop.fs.Path; import?org.apache.hadoop.io.IntWritable; import?org.apache.hadoop.io.LongWritable; import?org.apache.hadoop.io.Text; import?org.apache.hadoop.mapreduce.Job; import?org.apache.hadoop.mapreduce.Mapper; import?org.apache.hadoop.mapreduce.Reducer; import?org.apache.hadoop.mapreduce.lib.input.FileInputFormat; import?org.apache.hadoop.mapreduce.lib.input.TextInputFormat; import?org.apache.hadoop.mapreduce.lib.output.FileOutputFormat; import?org.apache.hadoop.mapreduce.lib.output.TextOutputFormat; import?org.apache.hadoop.util.GenericOptionsParser; ?public?class?Score { ?public?static?class?Map?extends ?MapperLongWritable, Text, Text, IntWritable { ?//?实现map函数 ?public?void?map(LongWritable?key, Text va