- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
朴素贝叶斯分类 软件工程学院 郑皎凌 大纲 贝叶斯理论 贝叶斯分类器 Ω={A1×A2×...×Am},是由所有未知类别的可能样本组成的集合; Ωc={A1×A2×...×Am×C}是由所有已知类别的样本组成的集合。D Ωc是训练样例集合。 Ω中的元素x表示为x = a1,a2 ,…,am。 Ωc中的元素x表示为x = a1,a2 ,…,am,cj。其中ai表示第i个属性的某个取值。 描述用到的符号 我们用Ai表示第i个属性,C表示决策属性;aik表示第i个属性的第k个取值,cj表示第j类;加上绝对值则表示相应的个数,如|Ai|表示第i个属性的取值个数,|cj|表示第j类样例个数。 贝叶斯定理 设x∈Ω是一个类别未知的数据样本,cj为某个类别,若数据样本x属于一个特定的类别cj,那么分类问题就是决定P(cj|x),即在获得数据样本x时,确定x的最佳分类。所谓最佳分类,一种办法是把它定义为在给定数据集D中不同类别cj先验概率的条件下最可能(most probable)分类。贝叶斯理论提供了计算这种可能性的一种直接方法 更精确地讲,贝叶斯法则基于假设的先验概率、给定假设下观察到不同数据的概率,提供了一种计算假设概率的方法 举例说明 目标概念PlayTennis的训练样例 Day Outlook Temperature Humidity Wind PlayTennis D1 Sunny Hot High Weak No D2 Sunny Hot High Strong No D3 Overcast Hot High Weak Yes D4 Rain Mild High Weak Yes D5 Rain Cool Normal Weak Yes D6 Rain Cool Normal Strong No D7 Overcast Cool Normal Strong Yes D8 Sunny Mild High Weak No D9 Sunny Cool Normal Weak Yes D10 Rain Mild Normal Weak Yes D11 Sunny Mild Normal Strong Yes D12 Overcast Mild High Strong Yes D13 Overcast Hot Normal Weak Yes D14 Rain Mild High Strong No 现在假设有一个样例x x = {Sunny,Hot,High,Weak} 贝叶斯公式 先验概率P(cj) P( cj|x) = P(x|cj)P(cj) P(x) 联合概率P(x|cj) 后验概率P(cj|x) 如果没有这一先验知识,那么可以简单地将每一候选类别赋予相同的先验概率。不过通常我们可以用样例中属于cj的样例数|cj|比上总样例数|D|来 近似,即 先验概率P(cj) P(cj)代表还没有训练数据前,cj拥有的初始概率。P(cj)常被称为cj的先验概率(prior probability) ,它反映了我们所拥有的关于cj是正确分类机会的背景知识,它应该是独立于样本的。 联合概率是指当已知类别为cj的条件下,看到样本x出现的概率。 联合概率P(x|cj) 若设x = a1,a2…am 则P(x|cj)= P(a1,a2…am| cj) 后验概率P(cj |x) 即给定数据样本x时cj成立的概率,而这正是我们所感兴趣的 P(cj|x )被称为C的后验概率(posterior probability),因为它反映了在看到数据样本x后cj成立的置信度 贝叶斯分类 我们现在计算 P(cMAP|x) = max P(cj|x) j∈(1,|C|) 则P(cMAP|x)称为最大后验概率 然后我们就把x分到cMAP类中 朴素贝叶斯分类器一 设x = a1,a2…am,为一个有m个属性的样例 = max P(a1,a2…am|cj)P(cj) P(a1,a2…am) = max P(a1,a2…am|cj)P(cj) (1) P(cMAP|x)= max P(cj|x) j∈(1,|C|) = max P(cj|a1,a2…am) 朴素贝叶斯分类器基于一个简单的假定:在给定目标值时属性值之间相互条件独立。换言之,该假定说明给定实例的目标值情况下,观察到联合的a1,a2…am的概率正好是对每个单独属性的概率乘积
您可能关注的文档
- 第三章1生物碱研究报告.ppt
- 第三章1遗传学基础研究报告.ppt
- 苏州白塘生态植物园调研试题.doc
- 第一章原核微生物形态与结构研究报告.ppt
- 苏州大学自然科学类核心期刊目录试题.doc
- 苏州工业园区档案分类方案--样本试题.doc
- 苏州科技学院大学英语教学管理办法(试行)试题.doc
- 第三章1种群与群落研究报告.ppt
- 第三章-2二烯(D)研究报告.ppt
- 第一章原始居民点的形成研究报告.ppt
- 2025至2030年中国超音波防盗锁数据监测研究报告.docx
- 2025至2030年色织素库缎面料项目投资价值分析报告.docx
- 2025至2030年中国计米控制器数据监测研究报告.docx
- 2025年小功率齿轮减速机项目投资可行性研究分析报告.docx
- 2025至2030年中国豪华商用大缸数据监测研究报告.docx
- 2025至2030年中国车库门驱动装置数据监测研究报告.docx
- 2025至2030年芒垫项目投资价值分析报告.docx
- 2025至2030年中国跑步机装饰条数据监测研究报告.docx
- 2025至2030年中国超高温管式灭菌机数据监测研究报告.docx
- 2025至2030年中国蛙板支架数据监测研究报告.docx
文档评论(0)