- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第PAGE1页,共NUMPAGES1页
一、单项选择题(本大题共10小题,每题3分,共30分)试卷(
试卷
(学年第1学期)
考试科目机器学习-Python实践(A卷)
适用专业班级(年级)得分
命题人:审阅人:
班级学号姓名考试科目
装订线
1、假设,现在我们已经建了一个模型来分类,而且有了99%的预测准确率,我们可以下的结论是:()
A.模型预测准确率已经很高了,我们不需要做什么了
B.模型预测准确率不高,我们需要做点什么改进模型
C.无法下结论
D.以上都不对
2、我们想在大数据集上训练决策树,为了使用较少时间,我们可以:()
A.增加树的深度
B.增加学习率(learningrate)
C.减少树的深度
D.减少树的数量
3、对于线性回归,我们应该有以下哪些假设?()
1.找到离群点很重要,因为线性回归对利群点很敏感
2.线性回归要求所有变量必须符合正态分布
3.线性回归假设数据没有多重线性相关性
A.1和2
B.2和3
C.1,2和3
D.以上都不是
4、关于正态分布,下列说法错误的是:()
A.正态分布具有集中性和对称性
B.正态分布的均值和方差能够决定正态分布的位置和形态
C.正态分布的偏度为0,峰度为1
D.标准正态分布的均值为0,方差为1
5、决策树的父节点和子节点的熵的大小关系是什么?()
A.决策树的父节点更大
B.子节点的熵更大
C.两者相等
D.根据具体情况而定
6、下列关于极大似然估计(MaximumLikelihoodEstimate,MLE),说法正确的是(多选)?()
A.MLE可能并不存在
B.MLE总是存在
C.如果MLE存在,那么它的解可能不是唯一的
D.如果MLE存在,那么它的解一定是唯一的
7、一般来说,下列哪种方法常用来预测连续独立变量?()
A.线性回归B.逻辑回顾
C.线性回归和逻辑回归都行D.以上说法都不对
8、你使用随机森林生成了几百颗树(T1,T2,...,Tn),然后对这些树的预测结果进行综合,下列说法正确的是:()
1、每棵树是通过所有数据的子集构建而成的
2、每棵树学习的样本数据都是通过随机有放回采样而得的
3、每棵树是通过数据集的子集和特征的子集构建而成的
4、每棵树是通过所有的数据构建而成的
A.1和2
B.2和4
C.1、2和3
D.2和3
9、下面关于随机森林和GBDT的说法正确的是:()
①这两种方法都可以用来解决分类问题
②随机森林解决分类问题,GBDT解决回归问题
③随机森林解决回归问题,GBDT解决分类问题
④这两种方法都可以用来解决回归问题
A.①
B.②
C.③
D.④
E.①和④
10、关于随机森林和GBDT,下列说法错误的是:()
A.随机森林中每个学习器是相互独立的
B.随机森林利用了bagging的思想来构建强学习器
C.GBDT利用了Boosting的思想来构建强学习器
D.GBDT中每个学习器之间没有任何联系
二、判断题(本大题共10小题,每题1分,共10分)
1、SVM是一个凸优化问题,因此局部最优解一定是全局最优解的优点。()
2、错误否定(FalseNegative,FN):预测为假,实际为真。()
3、逻辑回归的因变量可以是二分类的,也可以是多分类的,但是二分类的更为常用,也更加容易解释。所以实际中最常用的就是二分类的逻辑回归。()
4、决策树只能处理数据型属性。()
5、朴素贝叶斯适合高维数据。()
6、随机事件X所包含的信息量与其发生的概率有关。发生的概率越小,其信息量就越小。()
7、决策树短时间内处理大量数据,得到可行且效果较好的结果。()
8、集成学习以boosting、Adaboost等算法为代表的,个体学习器不是串行序列化生成的、具有依赖关系。()
9、Adaboost算法流程给数据中的每一个样本一个权重。()
10、Adaboost算法流程训练数据中的每一
文档评论(0)