章学习规则集合.ppt

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
章学习规则集合

2003.12.18 机器学习-学习规则集合 作者:Mitchell 译者:曾华军等 讲者:陶晓鹏 机器学习 第10章 学习规则集合 概述 对学习到的假设,最具有表征力的和最能为人类所理解的表示方法之一是if-then规则的集合 本章探索若干能学习这样的规则集合的算法 其中,最重要的是学习包含变量的规则集合,或称一阶Horn子句集合 由于一阶Horn子句集合可被解释为逻辑编程语言Prolog中的程序,学习的过程常被称为归纳逻辑编程 本章考察了多种学习规则集合的途径,其中一种是基于机器定理证明器中演绎算子的逆转 简介 在许多情况下,有必要学习一个由若干if-then规则共同定义的目标函数,比如 决策树 遗传算法 本章我们讨论一组不同的算法,它们直接学习规则集合,与前面算法有两点关键的不同 可学习包含变量的一阶规则集合(一阶子句的表达能力比命题规则要强得多) 使用序列覆盖算法,一次学习一个规则,以递增的方式形成最终的规则集合 简介(2) 一阶规则集合的例子 if Parent(x,y) then Ancestor(x,y) if Parent(x,z) ? Ancestor(z,y) then Ancestor(x,y) 这个规则集合很紧凑地描述了一个递归函数,它很难用决策树或其他命题的方法来表示 Prolog程序就是一阶规则的集合,因此一个可以学习这种规则集合的通用算法,可被看作是从样例中自动推导出Prolog程序的算法 一阶表示的学习系统在实践中的应用 在质谱仪中学习哪一个化学药品能粘合碎片 学习哪一个化学亚结构会产生诱导有机体突变的放射性物质 学习有限单元网以分析物理结构中的应力 内容安排 先介绍能够学习命题规则集的算法(命题规则可看作不含变量的一阶规则),算法搜寻假设空间学习析取规则集合 将上面算法扩展到一阶规则 讨论归纳逻辑的两种通用途径以及归纳和演绎推理的基本关系 序列覆盖算法 序列覆盖算法 学习一个规则,移去它覆盖的数据,再重复这一过程 假定已有一个子程序Learn-One-Rule,它的输入是一组正例和反例,输出是单个规则,它能够覆盖许多正例而覆盖很少的反例 我们要求输出的规则有较高的精确度,但不必有较高的覆盖度 序列覆盖算法(2) 序列覆盖算法的过程 在所有可用训练样例上执行Learn-One-Rule 再移去由其学到的规则覆盖的正例 重复上面的过程,直到规则集覆盖正例达到希望的程度 序列覆盖算法按次序学习到一组规则,它们共同覆盖了全部正例 规则集中的规则可排序,分类新实例时可先应用精度最高的规则 表10-1 学习析取规则集的序列覆盖算法(CN2) Sequential-Covering(Target_attribute, Attributes, Examples, Threshold) Learned_rules?{} Rule?Learn-One-Rule(Target_attribute, Attributes, Examples) 当Performance(Rule, Examples)Threshold Learned_rules?Learned_rules+Rule Examples?Examples-{被Rule正确分类的样例} Rule?Learn-One-Rule(Target_attribute, Attributes, Examples) Learned_rules?按照在Examples上的Performance排序的Learned_rules 返回Learned_rules 序列覆盖算法(3) 序列覆盖算法将问题化简为一系列简单的问题,执行的是一种贪婪有哪些信誉好的足球投注网站,它不能保证找到能覆盖样例的最小或最佳规则集 下面重点讨论Learn-One-Rule的设计,我们希望算法能够得到较高精度的规则集,但不必覆盖所有的正例 一般到特殊的柱状有哪些信誉好的足球投注网站 一种方法是,将假设空间有哪些信誉好的足球投注网站过程设计为与ID3算法中相似的方式,但在每一步只沿着最有希望的分支进行,即产生最佳性能的属性-值对,而不是用增长子树的办法覆盖所选属性的所有可能值 与ID3类似,可定义最佳分支,它覆盖的样例有最低的熵 与其他贪婪算法一样,上面算法的缺陷是,它的每一步都可能做出次优的选择 用柱状有哪些信誉好的足球投注网站来减小风险,即每一步保留k个最佳候选分支,每一步对k个候选分支进行处理,然后再将结果集削减至k个最可能成员 表10-2 Learn-One-Rule的一种实现:一般到特殊柱状有哪些信誉好的足球投注网站 Learn-One-Rule(Target_attribute, Attributes, Examples, k) 初始化Best_hypothesis为最一般的假设? 初始化Candidate_hypotheses为集合{Best_hypothesis} 当Candidate_hyp

文档评论(0)

woaitiantian + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档