- 1、本文档共82页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
;2;Spark于2009年诞生于美国加州大学伯克利分校的AMP实验室,它是一个可应用于大规模数据处理的统一分析引擎。Spark不仅计算速度快,而且内置了丰富的API,使得我们能够更加容易编写程序。
Spark在2013年加入Apache孵化器项目,之后获得迅猛的发展,并于2014年正式成为Apache软件基金会的顶级项目。Spark生态系统已经发展成为一个可应用于大规模数据处理的统一分析引擎,它是基于内存计算的大数据并行计算框架,适用于各种各样的分布式平台的系统。;Spark生态圈中包含了SparkSQL、SparkStreaming、GraphX、MLlib等组件。;SparkCore和SparkSQL;SparkStreaming和MLlib;GraphX和调度器;Spark的特点;Spark的应用场景;10;;12;Spark的搭建的环境介绍;Spark的部署方式;Spark集群安装部署;Spark集群安装部署;Spark集群安装部署;Spark集群安装部署;Spark集群安装部署;Spark集群安装部署;Spark集群安装部署;Spark集群安装部署;SparkHA集群部署;Zookeeper集群安装;Zookeeper集群安装;Zookeeper集群安装;Zookeeper集群安装;Zookeeper集群安装;Zookeeper集群安装;Zookeeper服务器的启动和关闭;Zookeeper服务器的启动和关闭;SparkHA集群部署;SparkHA集群部署;SparkHA集群部署;SparkHA集群部署;SparkHA集群部署;SparkHA集群部署;脚本启动Zookeeper集群;39;;41;在学习Spark运行架构与工作原理之前,首先需要了解几个重要的概念和术语;基本概述;Spark集群运行架构;Spark集群运行架构;Spark的运行流程;Spark的运行流程;Spark的运行流程;49;;51;我们可以通过运行Spark官方示例SparkPi,体验Spark集群提交任务的流程。执行下述代码块中的命令,提交SparkPi程序。;提交Spark作业后,观察Spark集群管理界面,其中“RunningApplications”列表表示当前Spark集群正在计算的作业,执行几秒后,刷新界面,在CompletedApplications表单下,可以看到当前应用执行完毕,返回控制台查看输出信息,出现了“Piisroughly3.140691140691141”,说明Pi值已经被计算完毕;54;;56;SparkShell介绍;SparkShell启动;SparkShell启动;下面通过启动Spark-Shell,并且使用Scala语言开发单词计数的Spark程序,现需要有文本文件words.txt(需要在本地创建文件并上传至指定目录)在HDFS中的/spark/test路径下,且文本内容如下:;SparkShell读取HDFS文件;SparkShell读取HDFS文件;SparkShell读取HDFS文件;SparkShell读取HDFS文件;SparkShell读取HDFS文件;66;;68;Spark-Shell通常在测试和验证我们的程序时使用的较多,然而在生产环境中,通常会在IDEA开发工具中编写程序,然后打成Jar包,最后提交到集群中执行。本节我们将利用IDEA工具开发一个WordCount单词计数程序。;WordCount案例;WordCount案例;WordCount案例;WordCount案例;集群模式执行Spark程序;集群模式执行Spark程序;集群模式执行Spark程序;集群模式执行Spark程序;集群模式执行Spark程序;集群模式执行Spark程序;集群模式执行Spark程序;81;
您可能关注的文档
- 《社群营销》课件——项目四 变现.pptx
- 《通信数据分析与实战》课件——第八章 Spark MLlib机器学习算法库.pptx
- 《通信数据分析与实战》课件——第九章 综合案例-Spark 实时交易数据统计.pptx
- 《通信数据分析与实战》课件——第六章 Kafka 分布式发布订阅消息系统.pptx
- 《通信数据分析与实战》课件——第七章 Spark Streaming实时计算框架.pptx
- 《通信数据分析与实战》课件——第三章 Spark RDD.pptx
- 《通信数据分析与实战》课件——第四章 Spark SQL.pptx
- 《通信数据分析与实战》课件——第五章 HBase 分布式数据库.pptx
- 《通信数据分析与实战》课件——第一章 Scala 语言基础.pptx
- 中国国家标准 GB/T 25936.4-2024橡胶塑料粉碎机械 第4部分:团粒机安全要求.pdf
- 《GB/T 25936.4-2024橡胶塑料粉碎机械 第4部分:团粒机安全要求》.pdf
- 中国国家标准 GB/T 18216.11-2024交流1 000 V和直流1 500 V及以下低压配电系统电气安全 防护措施的试验、测量或监控设备 第11部分:TT、TN和IT系统中剩余电流监视器(RCM)的有效性.pdf
- GB/T 21551.1-2024家用和类似用途电器的抗菌、除菌、净化功能 第1部分:通则.pdf
- GB/T 21551.5-2024家用和类似用途电器的抗菌、除菌、净化功能 第5部分:洗衣机的特殊要求.pdf
- 《GB/T 21551.5-2024家用和类似用途电器的抗菌、除菌、净化功能 第5部分:洗衣机的特殊要求》.pdf
- 中国国家标准 GB/T 32151.31-2024温室气体排放核算与报告要求 第31部分:木材加工企业.pdf
- 中国国家标准 GB/T 21551.5-2024家用和类似用途电器的抗菌、除菌、净化功能 第5部分:洗衣机的特殊要求.pdf
- 中国国家标准 GB/T 18978.20-2024人-系统交互工效学 第20部分:无障碍设计的工效学方法.pdf
- 《GB/T 18978.20-2024人-系统交互工效学 第20部分:无障碍设计的工效学方法》.pdf
- GB/T 32151.31-2024温室气体排放核算与报告要求 第31部分:木材加工企业.pdf
文档评论(0)