- 1、本文档共29页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
贝叶斯分类分类算法贝叶斯分分类算法贝叶斯分类分类算法贝叶斯分类分类算法
实验3:贝叶斯分类分类算法 实验3:贝叶斯分类分类算法 实验目的: 1.掌握贝叶斯分类算法 2.熟悉C++编程 3.数据集见下图: 背景知识 朴素贝叶斯分类 朴素贝叶斯分类的工作过程如下: (1)? 每个数据样本用一个n维特征向量X= {x1,x2,……,xn}表示,分别描述对n个属性A1,A2,……,An样本的n个度量。 (2) 假定有m个类C1,C2,…,Cm,给定一个未知的数据样本X(即没有类标号),分类器将预测X属于具有最高后验概率(条件X下)的类。也就是说,朴素贝叶斯分类将未知的样本分配给类Ci(1≤i≤m)当且仅当P(Ci|X) P(Cj|X),对任意的j=1,2,…,m,j≠i。这样,最大化P(Ci|X)。其P(Ci|X)最大的类Ci称为最大后验假定。根据贝叶斯定理 * 朴素贝叶斯分类(续) (3)?由于P(X)对于所有类为常数,只需要P(X|Ci)*P(Ci)最大即可。如果Ci类的先验概率未知,则通常假定这些类是等概率的,即P(C1)=P(C2)=…=P(Cm),因此问题就转换为对P(X|Ci)的最大化(P(X|Ci)常被称为给定Ci时数据X的似然度,而使P(X|Ci)最大的假设Ci称为最大似然假设)。 否则,需要最大化P(X|Ci)*P(Ci)。注意,类的先验概率可以用P(Ci)=si/s计算,其中si是类Ci中的训练样本数,而s是训练样本总数。 * 朴素贝叶斯分类(续) (4)?给定具有许多属性的数据集,计算P(X|Ci)的开销可能非常大。为降低计算P(X|Ci)的开销,可以做类条件独立的朴素假定。 给定样本的类标号,假定属性值相互条件独立,即在属性间,不存在依赖关系。这样 联合概率分布 * DMKD Sides By MAO * 朴素贝叶斯分类(续) (5)?对未知样本X分类,也就是对每个类Ci,计算P(X|Ci)*P(Ci)。 样本X被指派到类Ci,当且仅当P(Ci|X) P(Cj|X),1≤j≤m,j≠i,换言之,X被指派到其P(X|Ci)*P(Ci)最大的类。 * 贝叶斯分类 Bayesian Classifiers Approach: compute the posterior probability P(C | A1, A2, …, An) for all values of C using the Bayes theorem Choose value of C that maximizes P(C | A1, A2, …, An) Equivalent to choosing value of C that maximizes P(A1, A2, …, An|C) P(C) How to estimate P(A1, A2, …, An | C )? Na?ve Bayes Classifier Assume independence among attributes Ai when class is given: P(A1, A2, …, An |C) = P(A1| Cj) P(A2| Cj)… P(An| Cj) 0 Can estimate P(Ai| Cj) for all Ai and Cj. New point is classified to Cj if P(Cj) ? P(Ai| Cj) is maximal. 对比决策树分类 整棵决策树就对应着一组析取表达式规则。 知识回顾 贝叶斯知识 1. 样本空间的划分 二、全概率公式 2. 全概率公式 全概率公式 图示 证明 化整为零 各个击破 说明 全概率公式的主要用途在于它可以将一个复杂事件的概率计算问题,分解为若干个简单事件的概率计算问题,最后应用概率的可加性求出最终结果. 例1 有一批同一型号的产品,已知其中由一厂生产的占 30% , 二厂生产的占 50% , 三厂生产的占 20%, 又知这三个厂的产品次品率分别为2% , 1%, 1%,问从这批产品中任取一件是次品的概率是多少? 设事件 A 为“任取一件为次品”, 解 由全概率公式得 30% 20% 50% 2% 1% 1% A B1 B2 B3 称此为贝叶斯公式. 3. 贝叶斯公式 Bayes公式的意义 Bayes公式,其意义是:假设导致事件A发生的“原因”有Bi(i=1,2,…,n)个。它们互不相容。 现已知事件A确已经发生了,若要估计它是由“原因”Bi所导致的概率,则可用Bayes公式求出.即可从结果分析原因. 证明 条件概率的概念 乘法定理: 例2 贝叶斯公式的应用 解 (1) 由全概率公式得 (2) 由贝叶斯公式得 由以往的数据分析得到的概率, 叫做先验概率. 而在得到信息之后再重
您可能关注的文档
- 北师大版八年级语文上学期期达标测试及答案北师大版八年级语文上学期期末达标测试及答案北师大版八年级语文上学期期末达标测试及答案北师大版八年级语文上学期期末达标测试及答案.doc
- 北林农村与区域发展研究生 管理学的研究对象和研究方法北林农村与区域发展研究生 管理学的研究对象和研究方法北林农村与区域发展研究生 管理学的研究对象和研究方法北林农村与区域发展研究生 管理学的研究对象和研究方法.ppt
- 北师大版_一年级数学下册第单元《观察物体》单元复习练习课件北师大版_一年级数学下册第二单元《观察物体》单元复习练习课件北师大版_一年级数学下册第二单元《观察物体》单元复习练习课件北师大版_一年级数学下册第二单元《观察物体》单元复习练习课件.ppt
- 北京猫王家具战略规划报告北猫王家具战略规划报告北京猫王家具战略规划报告北京猫王家具战略规划报告.doc
- 北京中庆高清全自动课程录播案北京中庆高清全自动课程录播方案北京中庆高清全自动课程录播方案北京中庆高清全自动课程录播方案.doc
- 北京园林植物调研分析北京园植物调研分析北京园林植物调研分析北京园林植物调研分析.ppt
- 北师大版六年级数学上册《比应用 2》ppt课件北师大版六年级数学上册《比的应用 2》ppt课件北师大版六年级数学上册《比的应用 2》ppt课件北师大版六年级数学上册《比的应用 2》ppt课件.ppt
- 北师大版六年级语文毕业考试北师大版六年级语文毕业考试题北师大版六年级语文毕业考试题北师大版六年级语文毕业考试题.doc
- 北师大版高中数学选修2-2三章《导数应用》导数在实际问题中的应用(二) 课件北师大版高中数学选修2-2第三章《导数应用》导数在实际问题中的应用(二) 课件北师大版高中数学选修2-2第三章《导数应用》导数在实际问题中的应用(二) 课件北师大版高中数学选修2-2第三章《导数应用》导数在实际问题中的应用(二) 课件.ppt
- 北师大版七年级下册数学期末卷2北师大版七年级下册数学期末试卷2北师大版七年级下册数学期末试卷2北师大版七年级下册数学期末试卷2.ppt
文档评论(0)