- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2016 年四川省专业技术人员继续教育 ——
数据挖掘试题(含答案)
1、(单选, 4 分)
以下哪项不属于知识发现的过程? ( )
、数据清理
B、数据挖掘
C、知识可视化表达
D、数据测试
答案: C
2、(单选, 4 分)
以下哪些不属于数据挖掘的内容?( )
、分类
B、聚类
C、离群点检测
D、递归分析
答案: D
3、(单选, 4 分)
以下哪个不是常见的属性类型? ( )
A 、A .标称属性
B、数值属性
C、高维属性
D、序数属性
答案: C
4、(单选, 4 分)
以下哪个度量属于数据散度的描述?
A 、均值
B、中位数
C、标准差
D、众数
( )
答案: C
5、(单选, 4 分)
以下哪个度量不属于数据中心趋势度描述?(
A 、A .均值
B、中位数
C、众数
D、四分位数
C)
答案: C
6、(单选, 4 分)
对数据进行数据清理、集成、变换、规约是数据挖掘哪个步骤的任务? ( )
、频繁模式挖掘
B、分类和预测
C、数据预处理
D、噪声检测
答案: C
7、(单选, 4 分)
聚类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法? ( )
、K-Means
B、DBSCAN C、SVM
D、EM
答案: C
8、(单选, 4 分)
建立一个模型,通过这个模型根据已知的变量值来预测其他某个变量值属于数据挖掘的哪一类任务? ( )
、根据内容检索
B、建模描述
C、预测建模
D、寻找模式和规则
答案: C
9、(单选, 4 分)
当不知道数据所带标签时 . 可以使用哪种技术促使带同类标签的数据与带其他标签的数据相分离? ( )
、分类
B、聚类
C、关联分析
D、隐马尔可夫链
答案: A
10、 (单选, 4 分 )
在构造决策树时,以下哪种不是选择属性的度量的方法? ( )
、信息增益
B、信息增益率
C、基尼指数
D、距离
答案: D
11、 (单选, 4 分 )
知识发现流程最核心的步骤是什么? ( )
、数据挖掘
B、数据预处理
C、模式评估
D、知识表示
答案: B
12、 (单选, 4 分 )
将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务? ( )
、频繁模式挖掘
B、分类和预测
C、数据预处理
D、数据流挖掘
答案: C
13、 (单选, 4 分 )
以下哪个度量属于数据中心性的描述? ( )
、均值
B、极差
C、众数
D、标准差
答案: A
14、 (单选, 4 分 )
类分析是数据挖掘的一种重要技术,以下哪个算法不属于聚类算法? ( )
、K-Means
B、DBSCAN C、KNN
D、EM
答案: C
15、 (单选, 4 分 )
某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题? ( )
、关联规则发现
B、聚类
C、分类
D、自然语言处理
答案: A
16、 (单选, 4 分 )
以下哪些算法是分类算法? ( )
、DBSCAN B、C4.5 C、K-Mean
D、EM
答案: B
17、 (单选, 4 分 )
K-means 算法的缺点不包括? ( )
A 、K 必须是事先给定的
B、选择初始聚类中心
C、对于 “噪声 ”和孤立点数据是敏感的
D、可伸缩、高效
答案: D
18、 (单选, 4 分 )
机器学习中,下面哪些方法不可以避免分类中的过拟合问题?( )
、增加样本数量
B、增加模型复杂度
C、去除噪声
D、正则化
答案: B
19、 (单选, 4 分 )
下面那个不属于知识发现过程。( )
、数据清理与集成
B、数据统计
C、数据挖掘
D、模式评估和知识表示
答案: B
20、 (单选, 4 分 )
在构造决策树时,以下那个不属于选择属性的度量? ( )
、信息增益
B、信息增益率
C、基尼指数
D、信息熵
答案: C
21、 (单选, 4 分 )
关于频繁模式,下面哪一个陈述是正确的? ( )
A 、K 项集频繁则 K-1 项则必定不频繁
B、K 项集频繁则 K-1 项则必定频繁
C、K 项集不频繁则 K-1 项则必定频繁
D、以上都不正确
答案: B
22、 (单选, 4 分 )
DBSCAN 算法最大的挑战是? ( )
、确定聚类个数
B、确定聚类形状
C、确定半径及 MINPTS
D、确定评估指标
答案: C
23、 (单选, 4 分 )
以下那个不属于分类算法? ( )
A 、KNN
B、朴素贝叶斯
C、K-MEANS
D、SVM
答案: D
24、 (单选, 4 分 )
以下哪些陈述是不正确的? ( )
、聚类可以发现数据内部结构
B、聚类可以作为其他任务的预处理
C、聚类可以作为异常检测
D、聚类是一种监督学习方法
答案: D
25、 (单选, 4 分 )
SVM 通
文档评论(0)