- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
南开大学2021年9月《大数据开发技术》作业考核试题及答案参考
1.大数据处理的关键技术主要包括:数据采集和预处理、数据存储、数据计算架
构、数据分析和挖掘、数据可视化展示等。()
A.对
B.错
参考答案:A
2.PairRDD中mapValues是针对键值对(Key,Value)类型的数据中的key和Value
进行Map操作。()
A.正确
B.错误
参考答案:B
3.RDD的flatMap操作是将函数应用于RDD之中的每一个元素,将返回的迭代器
(数组、列表等)中的所有元素构成新的RDD。()
A.正确
B.错误
参考答案:A
4.关于Strom中Bolt说法错误的是()。
A.Bolt可以执行过滤、函数操作、Join、操作数据库等任何操作
B.Bolt是一个被动的角色,Spout是一个主动的角色
C.Bolt不仅可以处理Tuple还可以创建新的Tuple
D.Bolt是Streams的状态转换过程的抽象含义
参考答案:C
5.Scala列表方法中将函数应用到列表的所有元素的方法是()
A.filter
B.foreach
C.map
D.mkString
参考答案:B
6.spark-submit配置项中()表示启动的executor数量
A.--num-executorsNUM
B.--executor-memoryMEM
C.--total-executor-coresNUM
D.--executor-couresNUM
参考答案:A
7.Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素。()
T.对
F.错
参考答案:F
8.计算一个算法时间复杂度通常可以计算循环次数、基本操作的频率或计算步。
()
A.错误
B.正确
参考答案:B
9.HDFS中SecondaryNameNode可减少()重启的时间
A.NameNode
B.SecondaryNameNode
C.DataNode
D.Block
参考答案:A
10.SparkGraphX中类Graph的joinVertices方法可以()
A.收集邻居顶点的顶点Id和顶点属性
B.收集邻居顶点的顶点Id
C.向指定顶点发送信息并聚合信息
D.将顶点信息更新到图中
参考答案:D
11.以下哪个函数可以对RDD进行排序()
A.sortBy
B.filter
C.distinct
D.intersection
参考答案:A
12.大型图计算通常是由一个集群完成的,集群环境中执行远程数据读取会有较高
的延迟。()
A.正确
B.错误
参考答案:A
13.()可解决HDFS中名称节点运行期间EditLog不断变大的问题
A.NameNode
B.SecondaryNameNode
C.DataNode
D.Block
参考答案:B
14.SparkStreming中()函数可以对源DStream的每个元素通过函数func返回
一个新的DStream
A.map
B.flatMap
C.filter
D.union
参考答案:A
15.SparkGraphX中类Graph的reverse方法可以()
A.反转图中所有边的方向
B.按照设定条件取出子图
C.取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D.合并边相同的属性
参考答案:A
16.聚类分析(Clusteranalysis)简称聚类(Clustering),是把数据对象划分成子
集(类)的过程,每个子集称为一个簇(Cluster)。()
A.对
B.错
参考答案:A
17.SparkStreming中Dstream是一种抽象的离散流。()
T.对
F.错
参考答案:T
18.RDD的()操作通常用来划
您可能关注的文档
- 华为大数据HCIE-v2.0版本笔试题库 .pdf
- 区2019届九年级下学期中考一诊化学试题--(附答案) .pdf
- 北师大版小学五年级下册数学《分数除法》教案(真题16篇) .pdf
- 水积成川,载澜载清--校长2024年度述职报告.docx
- 高中政治更好发挥政府作用导学案.docx
- 河南省2024-2025学年高一上学期11月期中考试语文试题及参考答案.docx
- 题型05最值问题之费马点.docx
- 2016-2017学年高中生物第一单元生物技术与生物工程第2章第4节干细胞工程教案中图版选修3.doc
- 考点11难溶电解质的沉淀溶解平衡2022-2023学年上海市高二化学考点归纳与测试(沪科版2020选择性必修1).docx
- 真题重组卷01(考试版)2.docx
- 2016-2017学年高中生物第二单元生态工程与生物安全第1章第2节我国的生态工程教案中图版选修3.doc
- 2022-2023学年小升初英语易错点专练06完形填空15篇(广州教科版专版含答案)2.docx
- 期中专项四年级英语下册(含答案)3.docx
- 期末卷(二)(含答案解析)-2022-2023学年高二历史期中期末复习备考必刷题(选择性必修一国家制度与社会治理).docx
- 第4课欧姆定律的应用第一讲欧姆定律实验探究(原卷版).docx
- Unit1限制性定语从句语法讲义人教版高一英语学生版213.docx
- 2023年宁波市初中毕业升学文化考试科学模拟卷(八).docx
- 5.3细胞呼吸的原理和应用课件高一上学期生物人教版必修12.pptx
- 高中政治更好发挥政府作用教学设计.docx
- 体悟民间故事中的幸福--五上《中国民间故事》导读课.docx
文档评论(0)