22春南开大学《大数据开发技术》在线作业一答案参考9.pdfVIP

22春南开大学《大数据开发技术》在线作业一答案参考9.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

22春南开大学《大数据开发技术》在线作业一答案参考

1.关联分析又称为关联规则学习。()

A.对

B.错

参考答案:A

2.Scala使用()关键字来继承一个类

A.extends

B.override

C.extend

D.overrides

参考答案:A

3.一个问题可用动态规划算法或贪心算法求解的关键特征是问题的()。

A.重叠子问题

B.最优子结构性质

C.贪心选择性质

D.定义最优解

参考答案:B

4.RDD中的collect函数是一个行动操作,把RDD所有元素转换成数组并返回到

Driver端,适用于大数据处理后的返回。()

T.对

F.错

参考答案:F

5.Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方

法是()

A.filter

B.flatten

C.grouby

D.flatmap

参考答案:A

6.PairRDD可以通过()获得仅包含键的RDD

A.key

B.keys

C.value

D.values

参考答案:B

7.以下算法中属于监督学习算法的是()

A.KNN算法

B.逻辑回归

C.随机森林

D.Kmeans

参考答案:ABC

8.以下哪个函数可以求两个RDD的笛卡尔积()

A.union

B.substract

C.intersection

D.cartesian

参考答案:D

9.如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()

A.[0,numPartitions]

B.[0,numPartitions-1]

C.[1,numPartitions-1]

D.[1,numPartitions]

参考答案:B

10.可使用(),(),()进行光滑。

A.最大值

B.箱中位数

C.箱边界

D.箱均值

参考答案:BCD

11.用户可以在HadoopYARN上运行Spark。()

T.对

F.错

参考答案:T

12.Mllib中metrics.recallByThreshold表示()指标

A.准确度

B.召回率

C.F值

D.ROC曲线

参考答案:B

13.MapReduce中()会周期性地通过“心跳”将本节点上资源的使用情况和任务

的运行进度汇报给JobTracker,同时接收JobTracker发送过来的命令并执行相应

的操作。

A.Client

B.JobTracker

C.Task

D.TaskTracker

参考答案:D

14.以下算法中属于分类算法的是()

A.KNN算法

B.逻辑回归

C.随机森林

D.Kmeans

参考答案:ABC

15.Scala列表中last返回列表最后一个元素。()

A.正确

B.错误

参考答案:A

16.可视化工具包括()。

A.Excel

B.GoogleChart

C.Gephi

D.ppt

参考答案:ABC

17.RDD的union函数会将两个RDD元素合并成一个并且去处重复元素。()

A.正确

B.错误

参考答案:B

18.大数据时代预测人类移动行为的数据来源有()。

A.志愿者定位数据

B.装有导航设备的出租车轨迹数据

C.手机终端定位于通讯记录

D.社会网络签到数据

参考答案:ABCD

19.HDFS在设计上采取了多种机制保证在硬件出错的环境中实现数据的完整性。

()

A.正确

B.错误

参考答案:A

20.RDD的filter函数返回一个存

文档评论(0)

176****6652 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档