《机器学习-Python实践》试卷2.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

第PAGE1页,共NUMPAGES1页

一、单项选择题(本大题共10小题,每题3分,共30分)试卷(2021

试卷

(2021-2022学年第1学期)

考试科目机器学习-Python实践(A卷)

适用专业班级(年级)得分

命题人:审阅人:

班级学号姓名考试科目

装订线

1、假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是:()

A.模型预测准确率已经很高了,我们不需要做什么了

B.模型预测准确率不高,我们需要做点什么改进模型

C.无法下结论

D.以上都不对

2、我们想在大数据集上训练决策树,为了使用较少时间,我们可以:()

A.增加树的深度

B.增加学习率(learningrate)

C.减少树的深度

D.减少树的数量

3、对于线性回归,我们应该有以下哪些假设?()

1.找到离群点很重要,因为线性回归对利群点很敏感

2.线性回归要求所有变量必须符合正态分布

3.线性回归假设数据没有多重线性相关性

A.1和2

B.2和3

C.1,2和3

D.以上都不是

4、关于正态分布,下列说法错误的是:()

A.正态分布具有集中性和对称性

B.正态分布的均值和方差能够决定正态分布的位置和形态

C.正态分布的偏度为0,峰度为1

D.标准正态分布的均值为0,方差为1

5、决策树的父节点和子节点的熵的大小关系是什么?()

A.决策树的父节点更大

B.子节点的熵更大

C.两者相等

D.根据具体情况而定

6、下列关于极大似然估计(MaximumLikelihoodEstimate,MLE),说法正确的是(多选)?()

A.MLE可能并不存在

B.MLE总是存在

C.如果MLE存在,那么它的解可能不是唯一的

D.如果MLE存在,那么它的解一定是唯一的

7、一般来说,下列哪种方法常用来预测连续独立变量?()

A.线性回归B.逻辑回顾

C.线性回归和逻辑回归都行D.以上说法都不对

8、你使用随机森林生成了几百颗树(T1,T2,...,Tn),然后对这些树的预测结果进行综合,下列说法正确的是:()

1、每棵树是通过所有数据的子集构建而成的

2、每棵树学习的样本数据都是通过随机有放回采样而得的

3、每棵树是通过数据集的子集和特征的子集构建而成的

4、每棵树是通过所有的数据构建而成的

A.1和2

B.2和4

C.1、2和3

D.2和3

9、下面关于随机森林和GBDT的说法正确的是:()

①这两种方法都可以用来解决分类问题

②随机森林解决分类问题,GBDT解决回归问题

③随机森林解决回归问题,GBDT解决分类问题

④这两种方法都可以用来解决回归问题

A.①

B.②

C.③

D.④

E.①和④

10、关于随机森林和GBDT,下列说法错误的是:()

A.随机森林中每个学习器是相互独立的

B.随机森林利用了bagging的思想来构建强学习器

C.GBDT利用了Boosting的思想来构建强学习器

D.GBDT中每个学习器之间没有任何联系

二、判断题(本大题共10小题,每题1分,共10分)

1、SVM是一个凸优化问题,因此局部最优解一定是全局最优解的优点。()

2、错误否定(FalseNegative,FN):预测为假,实际为真。()

3、逻辑回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最常用的就是二分类的逻辑回归。()

4、决策树只能处理数据型属性。()

5、朴素贝叶斯适合高维数据。()

6、随机事件X所包含的信息量与其发生的概率有关。发生的概率越小,其信息量就越小。()

7、决策树短时间内处理大量数据,得到可行且效果较好的结果。()

8、集成学习以boosting、Adaboost等算法为代表的,个体学习器不是串行序列化生成的、具有依赖关系。()

9、Adaboost算法流程给数据中的每一个样本一个权重。()

10、Adaboost算

文档评论(0)

xiaobao + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档