分类树与随机森林模型讲座.分类树与随机森林模型讲座.pptx

分类树与随机森林模型讲座.分类树与随机森林模型讲座.pptx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

机器学习分类树与随机森林

分类学习模型

如今许多分类技术或分类模型已经被开发出来用于预测定性变量,其有logistic回归、线性判别,以及决策树、随机森林、提升法以及支持向量机等。

中级方法高级方法

√分类树

提升算法与随机森林

支持向量机

□logistic回归分析

□线性判别分析

□K-nearestneighbor

机器学习之分类树模型

cheap

white

喜欢

价格

big

分类树基本原理

ID

年龄

有工

有自己的房子

信贷情况

是否公务员

类别(是否同

意贷款)

1

青年

一般

2

青年

3

青年

4

青年

一般

5

青年

一般

6

中年

一般

7

中年

8

中年

9

中年

非常好

10

中年

非常好

11

老年

非常好

12

老年

一般

13

青年

一般

14

老年

非常好

15

老年

一般

基本原理:概念

决策树(DECISION)可以用于分类与回归,分别称为分类树与回归树,由于回归树的效果一般不如线性回归,所以本次讲座主要讲授分类树的应用。首先通过一个例子来说明决策树的概念:

质上决策树是一组if-then规则的组合:

(1)如果申请者有自己的房子,则同意贷款;

(2)如果申请者没有自己的房子,但有工作,则同意贷款;

(3)如果申请者既没有自己的房子,也没有工作,则不同意贷款。

基本原理:

我们需要的是一个与训练数据不相矛盾(或矛盾较少),同时具有很好的泛化能力的决策树,即对未知个例有很好的预测。比如下面的分类树模型:

有工作

不同意贷款

有自己的房子

是否

同意贷款

同意贷款

ID

有自己的房子

有工作

年龄

信贷情况

是否公

务员

类别(是否同意贷款)

结果

4

青年

一般

同意

8

中年

9

中年

非常好

10

中年

非常好

11

青年

非常好

12

老年

一般

3

青年

同意

13

青年

一般

14

青年

非常好

1

青年

一般

不同意

2

青年

5

青年

一般

6

中年

一般

7

中年

15

老年

一般

基本原理:概念

决策树分类效果有自己的房子

同意贷款不同意贷款

分类树模型在处理

高纬度数据时有先天优势。

同意贷款

有工作

基本原理:概念

决策树(Decision)是一种分类与回归方法。在分类问题中,

决策树模型基于特征变量对分析实例进行分类,这些分类规则

呈树状结构。其主要的优点是模型有较好的可读性,分类速度

快。决策树有结点(node)和有向边(directededge)组成。结点有两种:内部结点(internal)和叶结点(leafnode)。内部结点表示特征或属性,叶结点表示分类。

有自己的房子

有工作

不同意贷款

同意贷款

同意贷款

同意贷款不同意贷款

Leaf23:这两个子集分类效果不错!可以停止分类,预测类别定为该子类最常见的类别。

基本原理:运算过程

Step2:这一子集分类效果不好,需要继续分割,比如选择“有工作”变量继续往下分割

Leaf1:该子集分类效果很好!可以停止继续分割。预测类别定为该子类最

常见的类别。

Stepl.选择“有自己的房子”变量对样本进行分割

同意贷款

有工作

有自己的房子

基本原理:运算过程

有工作

不同意贷款

每个节点的分类效果怎么衡量?

同意贷款

同意贷款

有自己的房子

ID

有自己的房子

有工作

年龄

信贷情况

是否公务员

类别(是否同意贷款)

结果

4

青年

一般

同意

8

中年

9

中年

非常好

10

中年

非常好

11

青年

非常好

12

老年

一般

3

青年

同意

13

青年

一般

14

青年

文档评论(0)

178****8896 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档