- 1、本文档共87页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
重庆水利电力职业技术学院
2021~2022学年第一学期
大数据平台搭建与运维
综合实训
指
导
书
学 院: 普天大数据学院
专 业: 大数据技术与应用
班 级: 19级大数据1-3班
指导老师: 吴积嵩
教研室主任(签字):
2019年05月
一、综合实训的目的及意义
《大数据平台搭建与运维综合实训》是一门技术性、应用性很强的专业实训课程,实训教学是它的一个极为重要的环节。在大数据时代主要解决爆炸性的数据存储和数据运算问题,目前主要以Hadoop生态圈等开源技术栈和Spark技术为主,而大数据领域涉及的技术繁多,在构建大数据平台的过程中我们不仅需要精通单个技术组件的知识,还需要拥有横向整合拉通Hadoop体系技术栈的能力。在企业大数据应用中都需要搭建大数据存储、计算和分析平台,涉及的大数据技术、版本、兼容性都比较复杂,在实际应用中通常都会用到大数据平台如CDH、HDP进行平台的搭建和维护。
《大数据平台搭建与运维综合实训》课程的目的在学生掌握Hadoop生态圈及Spark基础上,将分布式、集群基本概念进一步进行理解,将ZooKeeper分布式生态系统、Hive仓库工具、HBase分布式数据库、Sqoop数据转移工具、Flume、Spark等大数据平台技术统一使用Apache下的开源Ambari大数据平台搭建和维护工具完成大数据平台的搭建、管理和监控功能。提供对大数据平台以指引式方式安装、配置;提供集群主要大数据服务启动、停止功能;同时还提供所有组件及服务的健康运行状态和预警功能,从而达到对大数据平台的简易、高效、安全的进行管理和维护。
二、综合实训题目
《基于Ambari大数据平台的搭建》。
项目实现
项目需求
使用Apache的开源产品Ambari Web工具快速完成基于HDP的大数据平台的搭建、维护、监控:
熟练掌握Ambari产品的设计架构和原理;
熟练使用基于Ambari大数据平台的相关环境的常规操作;
掌握使用Ambari和HDP搭建大数据平台的常规一般步骤;
根据业务需求能合理进行集群规划以及节点对应的服务规范;
熟练掌握虚拟机、linux操作系统、SSH/FTP常规工具的使用;
熟练掌握yum源本地仓库的配置和搭建以及常规yum命令的使用;
掌握常规软件如MySQL、JDK、网络配置、防火墙设置等基础环境安装和配置;
根据配置的本地yum源和httpd web服务完成Ambari Web管理工具搭建;
在完成Ambari Web工具的基础上完成基于HDP2.6的Hadoop集群搭建;
熟练使用Ambari管理后台功能完成对集群的操作、管理、监控;
在安装和使用过程中根据系统的监控功能和日志信息完成问题的定位和排查。
设计思路
Ambari介绍
Apache Ambari是一种基于Web的工具,支持Apache Hadoop集群的快速搭建、管理和监控。Ambari已支持大多数Hadoop组件,包括HDFS、MapReduce、Hive、Pig、 Hbase、Zookeeper、Sqoop和Hcatalog等,是顶级Hadoop管理工具之一。详细主要功能如下:
安装Hadoop集群:提供了以向导指引的方式安装一个集群,可以在任意的主机上安装Hadoop服务,提供了对Hadoop服务的配置功能。
管理Hadoop集群:提供了启动、停止等集群管理功能。
监控Hadoop集群:提供了一个用于监控Hadoop集群健康状态的仪表盘,提供了一套健康指标体系来收集监控数据,提供了一套预警框架,可以结合预定的监控指标实现通知预警。
Ambari设计
Ambari使用的Master/Slaves架构(主/从架构,由一个Ambari-Server和多个Agent组成),它通过一个Server主进程来实现集群的管理和操作命令的发送,而具体的管理动作则由安装在每台目标主机上的Agent进程进行执行。例如通过Ambari启动HDFS服务的时候,首先会由Ambari-Server向安装了HDFS服务所在主机的Agent进程发送启动指令,然后再由相关Agent进程执行其所在主机的本地命令脚本来启动HDFS的相应服务。
Ambari架构
集群中的服务器分类为主控、存储与计算、监控与认证、协同管理与其他四类角色:
主控节点
Hadoop生态圈的服务组件秉承分而治之的设计思想,使用分布式的方式将数据的存储分散到多台服务器,将数据的计算分摊到多台服务器,同时通过集群的方式保证服务的高可用和负载均衡。在一个典型的分布式与集群的架构设计中,需要有这样一类服务程序,它们不承担具体的数据存储或计算工作,而是负责全局统筹的任务分配、资源调配或是平衡集群负载这样的工
您可能关注的文档
- 大数据项目开发综合实训指导书.pdf
- Spark综合实训成果书(1).docx
- 基于pyecharts实现智慧工厂能耗管理模块.pdf
- 无人机作业流程与规则.docx
- 2024年国家电网招聘之电工类考试题库(考点精练).pdf
- 2024年江苏省无锡市经开区一模物理卷.pdf
- 2024年国考行测模考大赛(行政执法类).pdf
- 2024年见习期自我鉴定(35篇2024年见习期自我鉴定(35篇).pdf
- 2024年高考语文现代文一轮专题复习小说情节类题目专题训练(含解析).pdf
- 2024年高考押题预测卷—物理(全国新课标卷01)(全解全析).pdf
- 2024年高考语文复习 小说文本阅读(十三)练就审美技能,赏析描写艺术 学案.pdf
- 2024年核安全工程师法规考题.pdf
- 2024年高考语文一轮复习讲练测(新教材新高考)第04讲小说情节类题目(讲义)(原卷版+解析).pdf
- 2024年高考语文一轮复习:文言文45个高频词.pdf
- 2024年河南省会计从业资格考试全真模拟试题法规.pdf
- 2024年高考政治必修2《经济与社会》知识细节归纳100条.pdf
- 2024年高考语文一轮复习:27种经典开头方式及精彩范例.pdf
- 2024年高考政治选必一《 当代国际政治与经济》复习导引.pdf
- 2024年湖南省郴州市中考原创命题化学模拟试卷.pdf
- 2024年公司新员工个人工作总结(35篇).pdf
最近下载
- 人教版数学五年级上册全套练习册(含答案).pdf VIP
- 河南省2023-2024学年高一下学期6月质量检测语文试卷(含答案).docx VIP
- 国开学习网电大计算机应用基础形考任务终结性考试(学士论文)附答案.docx
- 基于ERP系统的电力企业供应商管理.doc VIP
- 农村屋面琉璃瓦工程包工包料承包合同7篇.docx
- 常见急危重症早期识别及处理原则.ppt VIP
- 生物医学研究的统计学方法-方积乾版-课后习题答案.pdf VIP
- 四川省成都市青白江区2025年初三一诊模拟考试(一)数学试题含解析.doc VIP
- 六年级语文上册《习作例文与习作》教学课件.pptx VIP
- 园林绿化养护服务投标方案.docx
文档评论(0)