- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
PAGE16
PAGE16
PAGE17
PAGE17
课题
使用决策树算法实现分类与回归
课时
2课时(90min)
教学目标
知识技能目标:
(1)掌握决策树算法用于分类任务的基本原理
(2)掌握决策树算法用于回归任务的基本原理
(3)掌握ID3算法、C4.5算法和CART算法的基本原理
(4)掌握决策树算法的Sklearn实现方法
(5)能够使用决策树算法训练分类模型
(6)能够使用决策树算法训练回归模型
(7)能够编写程序,寻找最佳的决策树深度值
素质目标:
(1)关注国家资讯,增强民族意识,培养爱国主义精神。
(2)理解决策树算法的基本原理,培养勇为人先的创新精神
教学重难点
教学重点:决策树算法用于分类任务和回归任务的基本原理;ID3算法、C4.5算法和CART算法的基本原理;决策树算法的Sklearn实现方法
教学难点:使用决策树算法训练分类和回归模型;编写程序,寻找最佳的决策树深度值
教学方法
案例分析法、问答法、讨论法、讲授法
教学用具
电脑、投影仪、多媒体课件、教材
教学过程
主要教学内容及步骤
课前任务
【教师】布置课前任务,和学生负责人取得联系,让其提醒同学通过APP或其他学习软件,完成课前任务,提前了解决策树算法的相关知识
【学生】完成课前任务
考勤
【教师】使用APP进行签到
【学生】班干部报请假人员及原因
问题导入
【教师】要求学生扫码观看“决策树算法的基本原理”视频,提出以下问题:
(1)决策树算法用于分类任务的基本原理是怎样的?
(2)决策树算法用于回归任务的基本原理是怎样的?
(3)常用的构造决策树的算法有哪几种?
【学生】思考、举手回答
传授新知
【教师】通过学生的回答引入要讲的知识,介绍决策树算法的基本原理、决策树算法的Sklearn实现的相关知识
6.1决策树算法的基本原理
决策树(decisiontree)是一种基于树结构的机器学习模型,可以用于分类与回归任务。在机器学习中,决策树分为分类树和回归树,当对样本的所属类别进行预测时使用分类树;当对样本的某个值进行预测时使用回归树。
6.1.1决策树算法的原理分析
1.分类决策树的基本原理
分类任务的目标是通过对数据集的“学习”,总结一种决策规则,预测未知样本的类别。使用决策树算法进行分类的原理是给定一个训练数据集,根据训练集构造决策树,根据决策树写出对应的决策规则,然后使用决策规则对“待分类样本”进行分类。
?【教师】通过多媒体展示“购买计算机的客户数据集”表格,并进行讲解
例如,购买计算机的客户数据集(见表6-2),使用决策树算法训练模型,可构造决策树。
表6-2购买计算机的客户数据集
客户编号
年龄
收入
是否为学生
信用情况
购买计算机情况
1
青年
高
否
一般
没有购买
2
青年
高
否
好
没有购买
3
中年
高
否
一般
已购买
4
老年
中
否
一般
已购买
5
老年
高
是
一般
已购买
6
老年
高
是
好
没有购买
7
中年
中
是
好
已购买
8
青年
中
否
一般
没有购买
9
青年
高
是
一般
已购买
10
老年
中
是
一般
已购买
11
青年
中
是
好
已购买
12
中年
中
否
好
已购买
13
中年
高
是
一般
已购买
14
老年
中
否
好
没有购买
?【教师】通过多媒体展示“分类决策树”图片(详见教材),并进行讲解
从图可以看出,决策树的根节点和内部节点为数据集中的特征属性,叶节点为类别标签,根据特征属性的取值来判断进入哪一个分支。
决策树分类采用自顶向下的递归方式,在决策树内部节点进行属性值的比较,根据不同的属性值判断从该节点向下的分支,在叶节点上得到结论。所以,从决策树的根节点到叶节点的每一条路径都对应一条合取规则。例如,图6-1的决策树对应的决策规则为
使用这些决策规则就可以对新的待测样本的类别进行判定。例如,新样本(老年,收入中等,不是学生,信用一般)的类别判定为已购买计算机。
2.回归决策树的基本原理
回归任务研究的是一组变量与另一组变量之间的关系,其预测结果是连续的数值。回归决策树的基本原理是给定一个数据集,根据数据集构造决策树,根据决策树将特征空间划分为若干单元,每个单元有一个特定的输出(如训练集对应样本的平均值)。对于新的待测样本,只要按照特征值将其归到某个单元,即可得到相应的输出值。
?【教师】通过多媒体展示“回归决策树”图片和“回归决策树测试数据集”表格(详见教材),并进行讲解
例如,回归决策树测试数据集(见表6-3),使用决策树算法训练模型,可构造如图所示的决策树(使用决策树算法对表6-3中的数据集进行回归预测的程序见例6-5)。
表6-3回归决策树测试数据集
x
y
x
y
1
4
2
8
3
9
5
10
7
19
回归
您可能关注的文档
- 《HBase数据库应用案例教程》教案 项目5 HBase原理实现.docx
- 《HBase数据库应用案例教程》教案 项目6 HBase性能优化.docx
- 《HBase数据库应用案例教程》教案 项目7 HBase与MapReduce的集成.docx
- 《Excel数据处理与分析案例教程》教案 项目二 数据统计计算.docx
- 《Excel数据处理与分析案例教程》教案 项目六 使用宏与VBA实现高效数据分析.docx
- 《Excel数据处理与分析案例教程》教案 项目七 线上水果交易数据处理与分析.docx
- 《Excel数据处理与分析案例教程》教案 项目三 数据整理.docx
- 《Excel数据处理与分析案例教程》教案 项目四 数据分析.docx
- 《Excel数据处理与分析案例教程》教案 项目一 数据处理与分析基础.docx
- 《Excel数据处理与分析案例教程》教案 项目五 数据可视化.docx
文档评论(0)