江苏开放大学数据挖掘技术060734第3次形考作业.docx

江苏开放大学数据挖掘技术060734第3次形考作业.docx

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

试题列表

单选题

题型:单选题客观题分值2分难度:简单得分:2

1

以下哪个聚类算法不属于基于网格的聚类算法()。

A

BIRCH

B

MAFIA

C

WaveCluster

D

STING

学生答案:A

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

2

一般,K-NN最近邻方法在()的情况下效果较好。

A

样本较多但典型性不好

B

样本较少但典型性好

C

样本呈链状分布

D

样本呈团状分布

学生答案:B

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

3

以下哪项关于决策树的说法是错误的()。

A

决策树算法对于噪声的干扰非常敏感

B

寻找最佳决策树是NP完全问题

C

冗余属性不会对决策树的准确率造成不利的影响

D

子树可能在决策树中重复多次

学生答案:A

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

4

以下哪种技术对于减少数据集的维度会更好()。

A

删除数据差异较大的列

B

删除缺少值太多的列

C

都不是

D

删除不同数据趋势的列

学生答案:B

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

5

一监狱人脸识别准入系统用来识别对待进入人员的身份,此系统一共包括识别4种不同的人员:狱警,小偷,送餐员,其他。下面哪种学习方法最适合此种应用需求()。

A

层次聚类问题

B

多分类问题

C

K-中心点聚类问题

D

二分类问题

学生答案:B

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

6

下列哪个描述是正确的()。

A

回归是无指导的学习,聚类是有指导的学习

B

回归是有指导的学习,聚类是无指导的学习

C

回归和聚类都是有指导的学习

D

回归和聚类都是无指导的学习

学生答案:B

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

7

以下哪个分类方法可以较好地避免样本的不平衡问题()。

A

KNN

B

SVM

C

神经网络

D

Bayes

学生答案:A

老师点评:

题型:单选题客观题分值2分难度:一般得分:2

8

决策树中不包含以下哪种节点()。

A

叶结点

B

内部节点

C

根节点

D

外部节点

学生答案:D

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

9

以下哪个算法是分类算法()。

A

DBSCAN

B

K-Mean

C

EM

D

C4.5

学生答案:D

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

10

BIRCH是一种()。

A

特征选择算法

B

关联分析算法

C

分类器

D

聚类算法

学生答案:D

老师点评:

题型:单选题客观题分值2分难度:一般得分:2

11

影响基本K-均值算法的主要因素有()。

A

样本的数量

B

聚类准则

C

模式相似性测度

D

样本输入顺序

学生答案:C

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

12

简单地将数据对象集划分成不重叠的子集,使得每个数据对象恰在一个子集中,这种聚类类型称作()。

A

层次聚类

B

划分聚类

C

非互斥聚类

D

模糊聚类

学生答案:B

老师点评:

题型:单选题客观题分值2分难度:中等得分:2

13

下列关于凝聚层次聚类的说法,说法正确的是()。

A

算法的终止条件是仅剩下一个簇

B

具有全局优化目标函数

C

一旦两个簇合并,该操作还能撤销

D

空间复杂度

学生答案:A

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

14

我们想在大数据集上训练决策树,为了使用较少时间,我们可以()。

A

增加学习率

B

减少树的深度

C

减少树的数量

D

增加树的深度

学生答案:B

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

15

以下不属于影响聚类算法结果的主要因素有()。

A

模式相似性测度

B

特征选取

C

已知类别的样本质量

D

分类准则

学生答案:C

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

16

关于欠拟合,下面哪个说法是正确的()。

A

训练误差较大,测试误差较大

B

训练误差不变,测试误差较大

C

训练误差较小,测试误差较大

D

训练误差较大,测试误差较小

学生答案:A

老师点评:

题型:单选题客观题分值2分难度:简单得分:2

17

以下()算法是关联规则挖掘。

A

ID3

B

K-Means

C

Apriori

D

DBSCAN

学生答案:C

老师点评:

题型:单选题客观题分值2分难度:中等得分:2

18

“点击率问题”是这样一个预测问题,99%的人是不会点击的,而1%的人是会点击进去的,所以这是一个非常不平衡的数据集。假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是()。

A

模型预测准确率不高,我们需要做点什么改进模型

B

模型

文档评论(0)

开放大学作业辅导 + 关注
实名认证
服务提供商

江苏开放大学,北京开放大学,西安开放大学,国开,云南开放大学,浙江电大,贵州电大,甘肃电大,兰大网院,四川电大,天津开放大学

1亿VIP精品文档

相关文档