《大数据基础与实务》期末考试题试卷及答案.docxVIP

《大数据基础与实务》期末考试题试卷及答案.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

《大数据基础与实务》期末考试题试卷及答案

一、单选题(每题2分,共60分)

1.下列哪个不属于大数据的特征()

A.大量

B.高速

C.多样

D.高价值

答案:D解析:大数据的特征为大量(Volume)、高速(Velocity)、多样(Variety)、低价值密度(Value)等,所以选D。

2.以下哪种文件格式不是大数据处理中常用的文件格式()

A.CSV

B.XML

C.PDF

D.JSON

答案:C解析:CSV、XML、JSON都是大数据处理中常用的文件格式,PDF通常用于文档展示,并非大数据处理常用格式,选C。

3.Hadoop是一个()

A.分布式计算平台

B.关系型数据库

C.数据挖掘工具

D.编程语言

答案:A解析:Hadoop是一个分布式计算平台,可用于大规模数据的存储和处理,选A。

4.HDFS中的NameNode主要负责()

A.数据存储

B.数据读写

C.管理文件系统的命名空间

D.执行MapReduce任务

答案:C解析:NameNode主要负责管理文件系统的命名空间,数据存储由DataNode负责,数据读写涉及NameNode和DataNode协作,MapReduce任务由JobTracker和TaskTracker执行(旧版),选C。

5.以下关于MapReduce编程模型的描述,错误的是()

A.分为Map阶段和Reduce阶段

B.Map阶段将输入数据解析成键值对

C.Reduce阶段可以没有

D.Map和Reduce函数必须由用户自己实现

答案:D解析:在MapReduce编程模型中,Map和Reduce函数通常由用户根据业务需求实现,但也可以使用默认的实现,所以D错误,选D。

6.Spark是基于()的计算框架。

A.内存

B.磁盘

C.网络

D.数据库

答案:A解析:Spark是基于内存的计算框架,能在内存中高效处理数据,减少磁盘I/O开销,选A。

7.RDD是Spark中的()

A.数据存储结构

B.数据处理操作

C.分布式数据集

D.调度器

答案:C解析:RDD(弹性分布式数据集)是Spark中的分布式数据集,是Spark对数据的抽象,选C。

8.以下哪个不是Spark的组件()

A.SparkCore

B.SparkSQL

C.SparkMLlib

D.HBase

答案:D解析:SparkCore、SparkSQL、SparkMLlib都是Spark的组件,HBase是一个分布式列式数据库,不属于Spark组件,选D。

9.以下关于NoSQL数据库的描述,正确的是()

A.遵循ACID原则

B.适合处理关系型数据

C.可扩展性强

D.数据存储结构单一

答案:C解析:NoSQL数据库不遵循ACID原则,适合处理非关系型数据,数据存储结构多样,具有可扩展性强的特点,选C。

10.以下哪种数据库属于键值型NoSQL数据库()

A.Cassandra

B.MongoDB

C.Redis

D.HBase

答案:C解析:Redis是典型的键值型NoSQL数据库,Cassandra是列式数据库,MongoDB是文档型数据库,HBase是分布式列式数据库,选C。

11.数据仓库的主要特点不包括()

A.面向主题

B.集成性

C.实时性

D.稳定性

答案:C解析:数据仓库具有面向主题、集成性、稳定性、非易失性等特点,不强调实时性,选C。

12.以下哪个工具常用于数据仓库的ETL过程()

A.Hive

B.Sqoop

C.Pig

D.Flume

答案:B解析:Sqoop主要用于在关系型数据库和Hadoop之间进行数据传输,常用于数据仓库的ETL过程;Hive是数据仓库工具,可用于数据查询;Pig是用于数据流处理的脚本语言;Flume用于日志收集,选B。

13.数据挖掘的主要任务不包括()

A.分类

B.聚类

C.回归

D.数据备份

答案:D解析:数据挖掘的主要任务包括分类、聚类、回归等,数据备份不属于数据挖掘任务,选D。

14.以下哪种算法属于分类算法()

A.K-Means

B.Apriori

C.DecisionTree

D.DBSCAN

答案:C解析:DecisionTree(决策树)是分类算法;K-Means和DBSCAN是聚类

文档评论(0)

每一天都很美好 + 关注
实名认证
文档贡献者

加油,继续努力

1亿VIP精品文档

相关文档