- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
实训1Hadoop集群环境搭建
一、实训目的与要求
1、掌握Hadoop集群环境搭建的环境准备工作,包括配置主机名、防火墙设置、免密登录设置、Java环境设置。
2、掌握安装Hadoop的过程、配置文件设置及启动集群的方法。
3、会在Hadoop集群运行经典案例wordcount。
二、操作训练
1、环境准备
主机名
IP地址
角色
xxmaster
192.168.128.130
ResourceManager
SecondaryNameNode
NameNode
DataNode
NodeManager
xxslave01
192.168.128.131
DataNode
NodeManager
xxslave02
192.168.128.132
DataNode
NodeManager
xx为姓名缩写
从BaseNode链接克隆3个虚拟机
(1)配置主机名、IP
配置xxmaster主机名、IP
操作结果截图+签名
配置xxslave01主机名、IP
操作结果截图+签名
配置xxslave02主机名、IP
操作结果截图+签名
(2)关闭防火墙
关闭xxmaster主机防火墙,并设置开机不自启
操作结果截图+签名
关闭xxslave01主机防火墙,并设置开机不自启
操作结果截图+签名
关闭xxslave02主机防火墙,并设置开机不自启
操作结果截图+签名
(3)关闭SElinux
关闭xxmaster主机SElinux
操作结果截图+签名
关闭xxslave01主机SElinux
操作结果截图+签名
关闭xxslave02主机SElinux
操作结果截图+签名
(4)修改/etc/hosts文件
修改xxmaster主机/etc/hosts文件
操作结果截图+签名
修改xxslave01主机/etc/hosts文件
操作结果截图+签名
修改xxslave02主机/etc/hosts文件
操作结果截图+签名
(5)配置免密登录
在xxmaster创建公钥和私钥
操作结果截图+签名
拷贝公钥到xxmaster
操作结果截图+签名
拷贝公钥到xxslave01
操作结果截图+签名
拷贝公钥到xxslave02
操作结果截图+签名
(6)配置Java环境
配置xxmaster主机Java环境
操作结果截图+签名
配置xxslave01主机Java环境
操作结果截图+签名
配置xxslave02主机Java环境
操作结果截图+签名
2、安装hadoop
在xxmaster主机修改hadoop的配置文件
配置hadoop-env.sh
操作结果截图+签名
配置core-site.xml
操作结果截图+签名
配置hdfs-site.xml
操作结果截图+签名
配置mapred-site.xml
操作结果截图+签名
配置yarn-site.xml
操作结果截图+签名
配置workers
操作结果截图+签名
分发hadoop文件
分发hadoop程序给xxslave01
操作结果截图+签名
分发hadoop程序给xxslave02
操作结果截图+签名
格式化HDFS文件系统
操作结果截图+签名
3、启动Hadoop集群
在xxmaster启动Hadoop集群
操作结果截图+签名
在xxmaster确认
操作结果截图+签名
在xxslave01确认
操作结果截图+签名
在xxslave02确认
操作结果截图+签名
4、网页确认
YARN画面
操作结果截图+签名
HDFS画面
操作结果截图+签名
5、运行wordcount例子
运行
操作结果截图+签名
查看结果
操作结果截图+签名
实训2Spark集群部署与使用
一、实训目的与要求
1、掌握Spark集群安装配置方法。
2、会启动关闭Spark集群。
3、能使用Spark-shell进行简单编程测试。
4、会下载、安装配置Scala工具。
5、能启动Scala进行编程测试。
二、操作训练
1、Spark安装部署
(1)使用MobaXterm工具,将软件包上传至master节点的root目录下,然后将其解压到/usr/local目录中,修改名称。
操作结果截图+签名
(2)在.bash_profile文件中修改环境变量,并使其生效。
操作结果截图+签名
(3)修改Spark配置文件。
1)配置spark-env.sh文件
操作结果截图+签名
2)配置workers文件
操作结果截图+签名
(4)复制修改spark启动脚本,避免和hadoop的启动脚本冲突。
操作结果截图+签名
(5)分发Spark文件
1)分发Spark文件到slaver01节点
操作结果截图+签名
2)分发Spark文件到slaver02节点
操作结果截图+签名
(6)启动Spark
操作结果截图+签名
(7)查看各节点服
您可能关注的文档
- 大数据分析及应用项目教程(Spark SQL)(微课版) 实训单 实训1 Hadoop集群环境搭建.docx
- 大数据分析及应用项目教程(Spark SQL)(微课版) 实训单 实训2 Spark集群部署与使用.docx
- 大数据分析及应用项目教程(Spark SQL)(微课版) 实训单 实训3 Scala基础(一).docx
- 大数据分析及应用项目教程(Spark SQL)(微课版) 实训单 实训4 Scala基础(二).docx
- 大数据分析及应用项目教程(Spark SQL)(微课版) 实训单 实训6 售房网站的销售房屋情况.docx
- 大数据分析及应用项目教程(Spark SQL)(微课版) 实训单 实训7 电商大数据分析与探索.docx
- 大数据分析及应用项目教程(Spark SQL)(微课版) 实训单 实训8 某化妆品在线商店的客户行为数据分析.docx
- 大数据分析及应用项目教程(Spark SQL)(微课版) 实训单 实训9 Zepplin安装部署与使用.docx
- 大数据分析及应用项目教程(Spark SQL)(微课版) 实训单 实训10 Zepplin数据可视化案例分析.docx
- 大数据分析及应用项目教程(Spark SQL)(微课版) 课件 第1章 大数据分析概述.pptx
- 2023年江苏省镇江市润州区中考生物二模试卷+答案解析.pdf
- 2023年江苏省徐州市邳州市运河中学中考生物二模试卷+答案解析.pdf
- 2023年江苏省苏州市吴中区中考冲刺数学模拟预测卷+答案解析.pdf
- 2023年江苏省南通市崇川区田家炳中学中考数学四模试卷+答案解析.pdf
- 2023年江西省吉安市中考物理模拟试卷(一)+答案解析.pdf
- 2023年江苏省泰州市海陵区九年级(下)中考三模数学试卷+答案解析.pdf
- 2023年江苏省苏州市高新二中中考数学二模试卷+答案解析.pdf
- 2023年江苏省南通市九年级数学中考复习模拟卷+答案解析.pdf
- 2023年江苏省南通市海安市九年级数学模拟卷+答案解析.pdf
- 2023年江苏省泰州市靖江外国语学校中考数学一调试卷+答案解析.pdf
文档评论(0)