- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模式识别 ——贝叶斯决策理论马勤勇2021/7/11一 最简单的贝叶斯分类算法 还使用前面的例子:鲈鱼(sea bass)和鲑鱼(salmon)。2021/7/112021/7/11使用一个特征亮度对这两种鱼进行表示。新来了一条鱼特征是x(亮度),怎么根据特征x确定它到底是鲈鱼ω1还是鲑鱼ω2?已知数据:鲈鱼类标号ω1,鲑鱼类标号ω2。鲈鱼总数量占所有鱼总数量的比率为P(ω1),鲑鱼总数量占所有鱼总数量的比率为P(ω2)。由鲈鱼的分布得知这条鱼的亮度x在分类为鲈鱼时出现的概率为p(x|ω1),由鲑鱼的分布得知这条鱼的亮度x在分类为鲑鱼时出现的概率为p(x|ω2)。2021/7/11如何求解?可以求出x属于鲈鱼ω1的概率P(ω1|x)和x属于鲑鱼ω2的概率P(ω2|x)。如果P(ω1|x)P(ω2|x),就认为x是鲈鱼。现在的问题是如何求P(ω1|x)和P(ω2|x)。2021/7/11有一个概率公式: 从而推出: 换一种写法: 2021/7/11这就是著名的贝叶斯公式。其中P(ωj)叫做先验概率,就是类别出现的可能性;p(x|ωj)叫条件概率,就是在ωj时x出现的可能性;p(ωj|x)叫后验概率;p(x)是该样例出现的可能性。 因此: 对于上面的问题: 2021/7/11如果p(ω1|x)p(ω2|x),那么就认为x属于ω1,即这条鱼是鲈鱼。同理于: 这几个基本数据都已经给出了,因此可以计算出不等式的结果。如果p(ω1|x)p(ω2|x),那么就认为x属于ω2,即这条鱼是鲑鱼。同理于: 2021/7/11二 贝叶斯决策算法上面的分类有几个主要限制:特征向量中只包含一个特征:亮度。只有两个类别:鲈鱼和鲑鱼。仅仅允许分类,而不是根据分类采取行动。同时,没有加入损失控制:例如鲈鱼比鲑鱼贵。如果鲈鱼的罐头里装入了鲑鱼,那么客户会很生气;如果鲑鱼的罐头里装入了鲈鱼,那么客户很难感到有损失。那么这个时候分类后采取的行动就要偏向于便宜的鲑鱼。下面就看突破这几个限制的比较通用的贝叶斯分类器是什么样的。2021/7/11为了解决第一个显示,使用向量x代替原来的单变量x。x就叫做特征向量。比如鲈鱼鲑鱼分类的例子中,可以设计这样一个特征向量(x1,x2),其中x1表示亮度,x2表示长度。 2021/7/11定义类别总共有c个:{ω1,ω2…,ωc},第j个分类为ωj。此时,x属于类别ωj的概率依然用这个公式计算:2021/7/11但是,并不是简单地将x归于具有最大p(ωj|x)值的那个类别ωj。因为要考虑损失:定义进行第i个行动(比如将样例归于第i个类别)这种行为表示为:αi。在一个样例的真正类别为ωj时,进行第i个行动造成的损失是:λ(αi|ωj)。那么进行第i个行动的总损失:这里将每个类别为真正类别时采取第i个行动造成的损失都加起来,作为采取第i个行动的总损失。那么每个行动的总损失都可以求出来,采取其中总损失最小的行动。比如行动k最小,对应的行动是将样例归于第k个类别,那么就如此进行分类。 2021/7/11举例:贝叶斯决策算法在两类问题中的决策。定义 ,是在一个样例的真正类别为ωj时,进行第i个行动造成的损失。采取第1个行动时的总损失: 采取第2个行动时的总损失:2021/7/11时,采取第1个行动。即: 那么当 比如对于上面的例子λ11=λ22=0。鲈鱼ω1比鲑鱼ω2贵。如果鲈鱼ω1的罐头里装入了鲑鱼ω2,那么客户会很生气;如果鲑鱼ω2的罐头里装入了鲈鱼ω1,那么客户很难感到有损失。那么这个时候分类后采取的行动就要偏向于便宜的鲑鱼。因此设当真正类别是鲑鱼ω2的时候,将x归类为鲈鱼ω1(造成鲈鱼ω1的罐头里装入了鲑鱼ω2)的损失λ12=2,设当真正类别是鲈鱼ω1的时候,将x归类为鲑鱼ω2(造成鲑鱼ω2的罐头里装入了鲈鱼ω1)的损失λ21=0.2。可以看到,上面的公式变成了:2021/7/11三 判别函数在模式识别里,经常用gi(x)来表示x属于第i个类别的可能性。如果对于所有的j!=i都有:gi(x)gj(x),那么认为x属于第i个类别ωi。比如令gi(x)=-R(αi|x)。上面是一个不等式关系,如果不等式两边都乘以相同的正数,或加上相同的树,或取自然对数。那么不等式的关系是不变的。因此不考虑损失时的贝叶斯判别函数: 可以写成:2021/7/11四 正态分布贝叶斯公式中的p(x|ωj)是条件概率,代表在类别为ωj时,x的概率。比如在ωj为鲈鱼时,一个特定亮度x的概率。条件概率分布中常见的一个分布是高斯分布(正态分布)。正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss(Carl Friedrich Gauss,1777—1855)率先将其应用于天文学家研究
您可能关注的文档
最近下载
- ISO22320:2011《公共安全-应急管理-事故响应要求》国际标准解读 Interpretation of ISO22320:2011: Societal Security Emergency Management Requirements for Incident Response.pdf
- 邵阳学院本科教学审核评估知识手册(学生版).pdf
- 人教部编版道法七上 6.1《友谊的真谛》课件.pptx VIP
- 2020学年第一学期“1530”安全警示教育记录.docx
- 2024年度学校大队委员少先队知识竞赛应知应会题库及答案 .pdf VIP
- 雅马哈PSR-S970&PSR-S770中文说明书.pdf VIP
- 数字化校园资源库建设方案.doc
- 滴滴司机签署承诺书.docx
- 监理单位对施工单位安全技术交底记录.pdf
- 中国彩塑精华珍赏丛书 长治观音堂(明).pdf
文档评论(0)