大数据挖掘与分析技术考核试卷.docx

大数据挖掘与分析技术考核试卷.docx

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数据挖掘与分析技术考核试卷

考生姓名:__________答题日期:__________得分:__________判卷人:__________

一、单项选择题(本题共20小题,每小题1分,共20分,在每小题给出的四个选项中,只有一项是符合题目要求的)

1.下列哪种技术不属于大数据技术?()

A.Hadoop

B.Spark

C.MySQL

D.NoSQL

2.以下哪项不是大数据的五个V特性?()

A.数据体量巨大(Volume)

B.数据类型繁多(Variety)

C.数据处理速度快(Velocity)

D.数据可视化(Visualization)

3.以下哪个不是大数据的常见来源?()

A.社交媒体

B.传感器

C.机器日志

D.数据仓库

4.以下哪个不是大数据处理框架?()

A.MapReduce

B.Spark

C.Storm

D..NET

5.以下哪个不是大数据分析的技术?()

A.数据挖掘

B.数据仓库

C.机器学习

D.网络爬虫

6.以下哪项不是大数据存储的技术?()

A.分布式文件系统

B.列式存储

C.关系型数据库

D.NewSQL

7.在大数据分析中,哪一种模型通常用于预测分析?()

A.决策树

B.聚类分析

C.关联规则

D.主成分分析

8.以下哪项不是数据挖掘的常用技术?()

A.分类

B.聚类

C.预测

D.编程

9.以下哪个不是常用的数据可视化工具?()

A.Tableau

B.PowerBI

C.D3.js

D.Eclipse

10.在大数据处理中,哪种技术通常用于实时数据处理?()

A.Hadoop

B.SparkStreaming

C.Hive

D.Pig

11.以下哪种语言不适合大数据处理?()

A.Python

B.Java

C.R

D.PHP

12.以下哪个不是大数据安全的问题?()

A.数据隐私

B.数据泄露

C.数据压缩

D.数据篡改

13.在大数据中,哪种技术通常用于数据清洗?()

A.SQL

B.Pig

C.SparkSQL

D.数据挖掘

14.以下哪个不是大数据分析的主要任务?()

A.数据预处理

B.数据建模

C.数据可视化

D.数据交易

15.以下哪个不是机器学习中的监督学习?()

A.支持向量机

B.决策树

C.聚类分析

D.线性回归

16.在Hadoop生态系统中,以下哪个组件用于数据存储?()

A.HDFS

B.YARN

C.MapReduce

D.Hive

17.以下哪个不是数据仓库的概念?()

A.星型模式

B.雪花模式

C.数据挖掘

D.ETL

18.在大数据分析中,以下哪种方法通常用于降维?()

A.主成分分析

B.聚类分析

C.关联规则

D.时间序列分析

19.以下哪个不是NoSQL数据库的类型?()

A.列式存储

B.文档型

C.键值对

D.关系型

20.在大数据领域,以下哪个公司不是知名的大数据技术提供商?()

A.Cloudera

B.Hortonworks

C.Databricks

D.Oracle

二、多选题(本题共20小题,每小题1.5分,共30分,在每小题给出的四个选项中,至少有一项是符合题目要求的)

1.大数据的主要来源包括以下哪些?()

A.社交媒体

B.电子商务

C.物联网

D.数据仓库

E.以上都是

2.以下哪些是大数据的五个V特性?()

A.数据体量巨大(Volume)

B.数据处理速度快(Velocity)

C.数据类型繁多(Variety)

D.数据的真实性(Veracity)

E.数据的可变性(Variability)

3.常见的大数据处理框架有哪些?()

A.MapReduce

B.Spark

C.Flink

D.Storm

E.Kafka

4.以下哪些技术属于数据挖掘的范畴?()

A.分类

B.聚类

C.关联规则

D.预测

E.数据仓库

5.大数据分析中,哪些方法可以用于预测分析?()

A.回归分析

B.时间序列分析

C.决策树

D.支持向量机

E.聚类分析

6.以下哪些是常用的NoSQL数据库类型?()

A.键值对存储

B.文档型存储

C.列式存储

D.图形数据库

E.关系型数据库

7.以下哪些技术可以用于大数据的实时处理?()

A.SparkStreaming

B.Flink

C.Storm

D.Kafka

E.Hado

文档评论(0)

doumiwenku + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档