基于规则的分类.pptx

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于规则的分类重点讲义

计算机应用技术;目录;基于规则的分类法是使用一组“IF…THEN…”规则来对记录进行分类的技术。 一个IF-THEN规则是一个如下形式的表达式:IF 条件 THEN 结论。规则R1是一个例子 R1:IF age=youth AND student=yes THEN buys_computer=yes 规则的“IF”部分(或左部)称为规则前件或前提。“THEN”部分(或右部)是规则的结论或后件。规则前件,它是属性测试的合取: IF 其中(Aj,Vj)是属性-值对,op是比较运算符,取自集合 (例如,age=youth 和 student=yes)。规则的结论包含一个类预测(在这个例子中,预测顾客是否购买计算机)。R1也可以写作 ;基本概念;规则覆盖率和准确率举例;规则覆盖率和准确率举例(续);基于规则的分类器的特征;研究背景和意义;研究背景和意义;国内外研究现状;国内外研究现状(续);构造分类规则的主要算法及流程;构造分类规则的主要算法及流程;顺序覆盖算法流程 基本顺序覆盖算法 ; 构造分类规则的主要算法及流程;示例 规则空间从一般到特殊的有哪些信誉好的足球投注网站;示例说明 为了学习“accept”类的规则,从一般的规则开始,即从规则前件条件为空的规则开始,然后考虑每个可以添加到该规则中的可能属性测试。 Learn_One_Rule采用一种贪心的深度优先策略。每当面临添加一个新的属性测试到当前规则时,它根据训练样本选择最能提高规则质量属性的测试。 而什么样的度量能被选择为规则质量?;Learn_One_Rule需要度量规则的质量。每当考虑一个属性测试时,乍一看准确率似乎是一个显然的选择,但我们先看一下下面的例子: 首先给出两个概念: 正元组(pos):学习规则的类的元组 负元组(neg):除去学习规则的类的元组,其余的元组。 ;虽然R2只覆盖两个元组,但是R2的准确率为100%,大于R1,在顺序覆盖算法中,将会选择R2而不是R1,这显然是不合理的。为了解决这个问题,我们采用另一种度量-信息增益,这种度量在一阶归纳学习器(First Order Inductive Learner,FOIL)中提出。用Foil_Gain作为规则质量标准: 其中?pos ,neg为新增规则R所覆盖的正元组和负元组,pos,neg是R覆盖之前的R所覆盖的正元组和负元组 FOIL_Gain越大越好。; 上面介绍的规则质量评估使用原训练数据的原则,这种评估是乐观的,因为规则可能过分拟合这些数据。也就是说,规则可能在训练数据上性能很好,但是在以后的数据上就不那么好。为了补偿这一点,可以对规则剪枝。下面给出一个剪枝方法:给定规则R FOIL_Prune(R)=(pos-neg)/(pos+neg) 其中,pos和neg分别为规则R覆盖的正元组和负元组。这个值将随着R在剪枝集上的准确率的增加而增加。因此,如果R剪枝后版本的FOIL_Prune值较高,则对R剪枝;FOIL算法举例;FOIL算法举例(续);FOIL算法举例(续);FOIL算法举例(续);FOIL算法举例(续);FOIL算法举例(续);FOIL算法举例(续);FOIL算法举例(续);FOIL算法举例(续);FOIL算法举例(续);FOIL算法举例(续);由决策树提取分类规则举例;谢谢!

您可能关注的文档

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档