- 1、本文档共94页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
朴素贝叶斯分类举例数据样本用属性age,income,student和credit_rating描述。类标号属性buys_computer具有两个不同值(即{yes,no})。设C1对应于类buys_computer=”yes”,而C2对应于类buys_computer=”no”。我们希望分类的未知样本为:X=(age=”=30”,income=”medium”,student=”yes”,credit_rating=”fair”)。第69页,共94页,星期六,2024年,5月朴素贝叶斯分类举例(1)我们需要最大化P(X|Ci)*P(Ci),i=1,2。每个类的先验概率P(Ci)可以根据训练样本计算: P(buys_computer=”yes”)=9/14=0.643, P(buys_computer=”no”)=5/14=0.357。(2)为计算P(X|Ci),i=1,2,我们计算下面的条件概率: P(age=30|buys_computer=”yes”)=2/9=0.222, P(age=30”|buys_computer=”no”)=3/5=0.600, P(income=”medium”|buys_computer=”yes”)=4/9=0.444, P(income=”medium”|buys_computer=”no”)=2/5=0.400, P(student=”yes”|buys_computer=”yes”)=6/9=0.677, P(student=”yes”|buys_computer=”no”)=1/5=0.200, P(credit_rating=”fair”|buys_computer=”yes”)=6/9=0.667, P(credit_rating=”fair”|buys_computer=”no”)=2/5=0.400。(3)假设条件独立性,使用以上概率,我们得到: P(X|buys_computer=”yes”)=0.222*0.444*0.667*0.667=0.044,P(X|buys_computer=”no”)=0.600*0.400*0.200*0.400=0.019,P(X|buys_computer=”yes”)*P(buys_computer=”yes”)=0.044*0.643=0.028P(X|buys_computer=”no”)*P(buys_computer=”no”)=0.019*0.357=0.007。因此,对于样本X,朴素贝叶斯分类预测buys_computer=”yes”。第70页,共94页,星期六,2024年,5月第三章分类方法
内容提要分类的基本概念与步骤基于距离的分类算法决策树分类方法贝叶斯分类规则归纳与分类有关的问题第71页,共94页,星期六,2024年,5月规则归纳常见的采用规则表示的分类器构造方法有:利用规则归纳技术直接生成规则利用决策树方法先生成决策树,然后再把决策树转换为规则;使用粗糙集方法生成规则;使用遗传算法中的分类器技术生成规则等。本节将只讨论规则归纳方法。我们这里讨论的规则归纳算法,可以直接学习规则集合,这一点与决策树方法、遗传算法有两点关键的不同。它们可学习包含变量的一阶规则集合:这一点很重要,因为一阶子句的表达能力比命题规则要强得多。这里讨论的算法使用序列覆盖算法:一次学习一个规则,以递增的方式形成最终的规则集合。第72页,共94页,星期六,2024年,5月规则归纳(续)规则归纳有四种策略:减法、加法,先加后减、先减后加策略。减法策略:以具体例子为出发点,对例子进行推广或泛化,推广即减除条件(属性值)或减除合取项(为了方便,我们不考虑增加析取项的推广),使推广后的例子或规则不覆盖任何反例。加法策略:起始假设规则的条件部分为空(永真规则),如果该规则覆盖了反例,则不停地向规则增加条件或合取项,直到该规则不再覆盖反例。先加后减策略:由于属性间存在相关性,因此可能某个条件的加入会导致前面加入的条件没什么作用,因此需要减除前面的条件。先减
您可能关注的文档
最近下载
- 融资管理的问题及优化策略—以万科为例.docx VIP
- 2024年湖南体育职业学院单招职业技能测试题库及答案解析.docx VIP
- 齐桓晋文之事.pptx VIP
- 永茂STT139塔吊安装说明书.pdf VIP
- 经济法律法规:会计与审计法律制度PPT教学课件.pptx
- 【高中物理】2025版 基础精练热点100练答案.pdf
- 2024年湖南艺术职业学院单招职业技能测试题库及答案解析.docx VIP
- 菲亚特博悦_汽车使用手册用户操作图示图解详解驾驶指南车主车辆说明书电子版.pdf
- 2024年天津市南开区中考一模数学试卷含详解.docx VIP
- 2024年常德职业技术学院单招职业适应性测试题库.pdf VIP
文档评论(0)