- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
《大数据基础与实务》期末考试题试卷及答案
一、单选题(每题2分,共60分)
1.下列哪个不属于大数据的特征()
A.大量
B.高速
C.多样
D.高价值
答案:D解析:大数据的特征为大量(Volume)、高速(Velocity)、多样(Variety)、低价值密度(Value)等,所以选D。
2.以下哪种文件格式不是大数据处理中常用的文件格式()
A.CSV
B.XML
C.PDF
D.JSON
答案:C解析:CSV、XML、JSON都是大数据处理中常用的文件格式,PDF通常用于文档展示,并非大数据处理常用格式,选C。
3.Hadoop是一个()
A.分布式计算平台
B.关系型数据库
C.数据挖掘工具
D.编程语言
答案:A解析:Hadoop是一个分布式计算平台,可用于大规模数据的存储和处理,选A。
4.HDFS中的NameNode主要负责()
A.数据存储
B.数据读写
C.管理文件系统的命名空间
D.执行MapReduce任务
答案:C解析:NameNode主要负责管理文件系统的命名空间,数据存储由DataNode负责,数据读写涉及NameNode和DataNode协作,MapReduce任务由JobTracker和TaskTracker执行(旧版),选C。
5.以下关于MapReduce编程模型的描述,错误的是()
A.分为Map阶段和Reduce阶段
B.Map阶段将输入数据解析成键值对
C.Reduce阶段可以没有
D.Map和Reduce函数必须由用户自己实现
答案:D解析:在MapReduce编程模型中,Map和Reduce函数通常由用户根据业务需求实现,但也可以使用默认的实现,所以D错误,选D。
6.Spark是基于()的计算框架。
A.内存
B.磁盘
C.网络
D.数据库
答案:A解析:Spark是基于内存的计算框架,能在内存中高效处理数据,减少磁盘I/O开销,选A。
7.RDD是Spark中的()
A.数据存储结构
B.数据处理操作
C.分布式数据集
D.调度器
答案:C解析:RDD(弹性分布式数据集)是Spark中的分布式数据集,是Spark对数据的抽象,选C。
8.以下哪个不是Spark的组件()
A.SparkCore
B.SparkSQL
C.SparkMLlib
D.HBase
答案:D解析:SparkCore、SparkSQL、SparkMLlib都是Spark的组件,HBase是一个分布式列式数据库,不属于Spark组件,选D。
9.以下关于NoSQL数据库的描述,正确的是()
A.遵循ACID原则
B.适合处理关系型数据
C.可扩展性强
D.数据存储结构单一
答案:C解析:NoSQL数据库不遵循ACID原则,适合处理非关系型数据,数据存储结构多样,具有可扩展性强的特点,选C。
10.以下哪种数据库属于键值型NoSQL数据库()
A.Cassandra
B.MongoDB
C.Redis
D.HBase
答案:C解析:Redis是典型的键值型NoSQL数据库,Cassandra是列式数据库,MongoDB是文档型数据库,HBase是分布式列式数据库,选C。
11.数据仓库的主要特点不包括()
A.面向主题
B.集成性
C.实时性
D.稳定性
答案:C解析:数据仓库具有面向主题、集成性、稳定性、非易失性等特点,不强调实时性,选C。
12.以下哪个工具常用于数据仓库的ETL过程()
A.Hive
B.Sqoop
C.Pig
D.Flume
答案:B解析:Sqoop主要用于在关系型数据库和Hadoop之间进行数据传输,常用于数据仓库的ETL过程;Hive是数据仓库工具,可用于数据查询;Pig是用于数据流处理的脚本语言;Flume用于日志收集,选B。
13.数据挖掘的主要任务不包括()
A.分类
B.聚类
C.回归
D.数据备份
答案:D解析:数据挖掘的主要任务包括分类、聚类、回归等,数据备份不属于数据挖掘任务,选D。
14.以下哪种算法属于分类算法()
A.K-Means
B.Apriori
C.DecisionTree
D.DBSCAN
答案:C解析:DecisionTree(决策树)是分类算法;K-Means和DBSCAN是聚类
您可能关注的文档
最近下载
- [芜湖]2024年安徽芜湖镜湖区街道编外聘用人员招聘63人笔试历年典型考点(频考版试卷)附带答案详解.docx VIP
- 《英耀篇》的原文以及白话文.docx
- 国家开放大学,期末考试复习资料,《心理学》期末辅导--主要概念和重点提示(2023)(1).pdf
- 2025年人教版三年级下册数学第8单元综合素养测评-“四基”与“四能”.pptx VIP
- 2020年新版砂砾石开挖及回填施工方案.docx
- 2024年保安员证考试题库(含答案).pdf VIP
- 2025版《煤矿安全培训》ppt课件 .pdf VIP
- 监视和测量设备控制程序 (1).doc VIP
- 高中英语:读后续写人与自然动物篇.docx VIP
- 6月5日,第24个世界环境日ppt课件(优质ppt).pptx
文档评论(0)