22春南开大学《大数据开发技术》在线作业二满分答案2.pdfVIP

22春南开大学《大数据开发技术》在线作业二满分答案2.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

22春南开大学《大数据开发技术》在线作业二满分答案

1.以下哪个函数可以对两个RDD进行合并()

A.union

B.substract

C.intersection

D.cartesian

参考答案:A

2.SparkStreming中()函数可以合并两个DStream,生成一个包含两个

DStream中所有元素的新DStream对象

A.map

B.flatMap

C.filter

D.union

参考答案:D

3.UMP系通过()来实现实现集群成员管理、元数据存储、MySQL实例管理、故障

恢复、备份、迁移、扩容等功能

A.Controller服务器

B.Proxy服务器

C.愚公系统

D.Agent服务器

参考答案:A

4.Hbase中Zookeeper文件记录了()的位置

A..META.表

B.-ROOT-表

C.Region

D.Master

参考答案:B

5.RDD的subtract用于用于将前一个RDD中在后一个RDD出现的元素删除。()

T.对

F.错

参考答案:T

6.SparkGraphX中类Graph的joinVertices方法可以()

A.收集邻居顶点的顶点Id和顶点属性

B.收集邻居顶点的顶点Id

C.向指定顶点发送信息并聚合信息

D.将顶点信息更新到图中

参考答案:D

7.用户可以在HadoopYARN上运行Spark。()

T.对

F.错

参考答案:T

8.以下亚马逊的产品中哪个属于存储部分()

A.EC2

B.EBS

C.S3

D.ELB

参考答案:BC

9.我们既要通过政府主导,又要发挥社会的力量,来共同推进医疗大数据的应

用。()

A.对

B.错

参考答案:A

10.分治法的基本思想时将一个规模为n的问题分解为k个规模较小的子问题,这

些子问题互相独立且与原问题相同。递归地解这些子问题,然后将各个子问题的解

合并得到原问题的解。()

A.错误

B.正确

参考答案:B

11.传统的数据处理流程的前提是()。

A.存储的数据是旧的

B.存储的数据是实时的

C.需要用户主动发出查询

D.不需要用户主动发出查询

参考答案:AC

12.以下不可以使用分治法求解的是()。

A.棋盘覆盖问题

B.选择问题

C.归并排序

D.0/1背包问题

参考答案:D

13.RDD的map操作不会改变RDD的分区数目。()

T.对

F.错

参考答案:T

14.MongoDB将数据存储为一个()

A.关系

B.属性

C.字段

D.文档

参考答案:D

15.Scala中()方法返回一个列表,包含除了最后一个元素之外的其他元素

A.head

B.init

C.tail

D.last

参考答案:B

16.亚马逊的云服务提供了多达几十种服务,涵盖了IaaS、PaaS、SaaS这三层。

()

A.正确

B.错误

参考答案:A

17.MapTask和ReduceTask均由()启动。

A.Client

B.JobTracker

C.Task

D.TaskTracker

参考答案:D

18.哪些属于数据可视化的重要作用()

A.分析数据

B.采集数据

C.辅助理解数据

D.观测跟踪数据

参考答案:ACD

19.计算一个算法时间复杂度通常可以计算循环次数、基本操作的频率或计算步。

()

A.错误

B.正确

参考答案:B

20.UMP系统的哪个功能实现了负载均衡()

A.读写分离

B.资源隔离

C.资源调度

D.可扩展

参考答案:A

21.Scala中元组是是一种可迭代的键值对(key/value)结

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档