大数据分析及应用项目教程(Spark SQL)(微课版) 实训单汇总 许慧 实训1--10 Hadoop集群环境搭建--- Zepplin数据可视化案例分析.docx

大数据分析及应用项目教程(Spark SQL)(微课版) 实训单汇总 许慧 实训1--10 Hadoop集群环境搭建--- Zepplin数据可视化案例分析.docx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

实训1Hadoop集群环境搭建

一、实训目的与要求

1、掌握Hadoop集群环境搭建的环境准备工作,包括配置主机名、防火墙设置、免密登录设置、Java环境设置。

2、掌握安装Hadoop的过程、配置文件设置及启动集群的方法。

3、会在Hadoop集群运行经典案例wordcount。

二、操作训练

1、环境准备

主机名

IP地址

角色

xxmaster

192.168.128.130

ResourceManager

SecondaryNameNode

NameNode

DataNode

NodeManager

xxslave01

192.168.128.131

DataNode

NodeManager

xxslave02

192.168.128.132

DataNode

NodeManager

xx为姓名缩写

从BaseNode链接克隆3个虚拟机

(1)配置主机名、IP

配置xxmaster主机名、IP

操作结果截图+签名

配置xxslave01主机名、IP

操作结果截图+签名

配置xxslave02主机名、IP

操作结果截图+签名

(2)关闭防火墙

关闭xxmaster主机防火墙,并设置开机不自启

操作结果截图+签名

关闭xxslave01主机防火墙,并设置开机不自启

操作结果截图+签名

关闭xxslave02主机防火墙,并设置开机不自启

操作结果截图+签名

(3)关闭SElinux

关闭xxmaster主机SElinux

操作结果截图+签名

关闭xxslave01主机SElinux

操作结果截图+签名

关闭xxslave02主机SElinux

操作结果截图+签名

(4)修改/etc/hosts文件

修改xxmaster主机/etc/hosts文件

操作结果截图+签名

修改xxslave01主机/etc/hosts文件

操作结果截图+签名

修改xxslave02主机/etc/hosts文件

操作结果截图+签名

(5)配置免密登录

在xxmaster创建公钥和私钥

操作结果截图+签名

拷贝公钥到xxmaster

操作结果截图+签名

拷贝公钥到xxslave01

操作结果截图+签名

拷贝公钥到xxslave02

操作结果截图+签名

(6)配置Java环境

配置xxmaster主机Java环境

操作结果截图+签名

配置xxslave01主机Java环境

操作结果截图+签名

配置xxslave02主机Java环境

操作结果截图+签名

2、安装hadoop

在xxmaster主机修改hadoop的配置文件

配置hadoop-env.sh

操作结果截图+签名

配置core-site.xml

操作结果截图+签名

配置hdfs-site.xml

操作结果截图+签名

配置mapred-site.xml

操作结果截图+签名

配置yarn-site.xml

操作结果截图+签名

配置workers

操作结果截图+签名

分发hadoop文件

分发hadoop程序给xxslave01

操作结果截图+签名

分发hadoop程序给xxslave02

操作结果截图+签名

格式化HDFS文件系统

操作结果截图+签名

3、启动Hadoop集群

在xxmaster启动Hadoop集群

操作结果截图+签名

在xxmaster确认

操作结果截图+签名

在xxslave01确认

操作结果截图+签名

在xxslave02确认

操作结果截图+签名

4、网页确认

YARN画面

操作结果截图+签名

HDFS画面

操作结果截图+签名

5、运行wordcount例子

运行

操作结果截图+签名

查看结果

操作结果截图+签名

实训2Spark集群部署与使用

一、实训目的与要求

1、掌握Spark集群安装配置方法。

2、会启动关闭Spark集群。

3、能使用Spark-shell进行简单编程测试。

4、会下载、安装配置Scala工具。

5、能启动Scala进行编程测试。

二、操作训练

1、Spark安装部署

(1)使用MobaXterm工具,将软件包上传至master节点的root目录下,然后将其解压到/usr/local目录中,修改名称。

操作结果截图+签名

(2)在.bash_profile文件中修改环境变量,并使其生效。

操作结果截图+签名

(3)修改Spark配置文件。

1)配置spark-env.sh文件

操作结果截图+签名

2)配置workers文件

操作结果截图+签名

(4)复制修改spark启动脚本,避免和hadoop的启动脚本冲突。

操作结果截图+签名

(5)分发Spark文件

1)分发Spark文件到slaver01节点

操作结果截图+签名

2)分发Spark文件到slaver02节点

操作结果截图+签名

(6)启动Spark

操作结果截图+签名

(7)查看各节点服

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档