大数据挖掘与分析技巧考核试卷.pdf

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

大数据挖掘与分析技巧考核试卷

考生姓名:__________答题日期:_______得分:_________判卷人:_________

一、单项选择题(本题共20小题,每小题1分,共20分,在每小题给出的四个选项中,只

有一项是符合题目要求的)

1.以下哪项不是大数据的基本特征?()

A.数据量巨大

B.数据类型繁多

C.处理速度快

D.数据准确性高

2.下列哪个工具不是用于大数据处理的?()

A.Hadoop

B.Spark

C.MySQL

D.NoSQL

3.在大数据挖掘过程中,以下哪个环节是数据预处理环节?()

A.数据采集

B.数据清洗

C.数据存储

D.数据分析

4.以下哪个算法不常用于关联规则挖掘?()

A.Apriori算法

B.FP-growth算法

C.K-means算法

D.Eclat算法

5.在大数据分析中,以下哪个方法常用于降维?()

A.主成分分析(PCA)

B.决策树

C.支持向量机(SVM)

D.逻辑回归

6.以下哪个数据库不属于NoSQL数据库?()

A.MongoDB

B.Redis

C.Cassandra

D.Oracle

7.在大数据挖掘中,以下哪个任务属于分类任务?()

A.聚类

B.关联规则挖掘

C.回归分析

D.分类

8.以下哪个算法常用于文本分类?()

A.Bayes算法

B.KNN算法

C.SVM算法

D.以上都对

9.在大数据分析中,以下哪个概念表示数据的稀疏性?()

A.数据冗余

B.数据稀疏

C.数据完整性

D.数据一致性

10.以下哪个工具主要用于流数据处理?()

A.Hadoop

B.Spark

C.Flink

D.Storm

11.在大数据挖掘中,以下哪个算法属于无监督学习?()

A.K-means算法

B.决策树

C.逻辑回归

D.支持向量机(SVM)

12.以下哪个技术常用于数据可视化?()

A.HTML

B.CSS

C.JavaScript

D.D3.js

13.在大数据挖掘中,以下哪个指标用于评估分类模型的性能?()

A.精确度

B.召回率

C.F1值

D.以上都对

14.以下哪个工具主要用于大数据仓库?()

A.Hive

B.Pig

C.HBase

D.Redis

15.在大数据挖掘中,以下哪个算法常用于推荐系统?()

A.协同过滤算法

B.矩阵分解算法

C.内容推荐算法

D.以上都对

16.以下哪个框架主要用于深度学习?()

A.TensorFlow

B.PyTorch

C.Caffe

D.以上都对

17.在大数据挖掘中,以下哪个概念表示数据的冗余性?()

A.数据稀疏

B.数据一致性

C.数据完整性

D.数据冗余

18.以下哪个算法常用于时间序列分析?()

A.ARIMA模型

B.SARIMA模型

C.LSTM模型

D.以上都对

19.在大数据挖掘中,以下哪个方法用于处理不平衡数据集?()

A.过采样

B.欠采样

C.SMOTE算法

D.以上都对

20.以下哪个工具主要用于分布式计算?()

A.MapReduce

B.Spark

C.Flink

D.以上都对

二、多选题(本题共20小题,每小题1.5分,共30分,在每小题给出的四个选项中,至少

有一项是符合题目要求的)

1.大数据技术主要包括以下哪些方面?(

文档评论(0)

***** + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档