02贝叶斯决策理论.pptx

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
模式识别 ——贝叶斯决策理论马勤勇mqy_mail@163.com一 最简单的贝叶斯分类算法 还使用前面的例子:鲈鱼(sea bass)和鲑鱼(salmon)。使用一个特征亮度对这两种鱼进行表示。新来了一条鱼特征是x(亮度),怎么根据特征x确定它到底是鲈鱼ω1还是鲑鱼ω2?已知数据:鲈鱼类标号ω1,鲑鱼类标号ω2。鲈鱼总数量占所有鱼总数量的比率为P(ω1),鲑鱼总数量占所有鱼总数量的比率为P(ω2)。由鲈鱼的分布得知这条鱼的亮度x在分类为鲈鱼时出现的概率为p(x|ω1),由鲑鱼的分布得知这条鱼的亮度x在分类为鲑鱼时出现的概率为p(x|ω2)。如何求解?可以求出x属于鲈鱼ω1的概率P(ω1|x)和x属于鲑鱼ω2的概率P(ω2|x)。如果P(ω1|x)P(ω2|x),就认为x是鲈鱼。现在的问题是如何求P(ω1|x)和P(ω2|x)。有一个概率公式: 从而推出: 换一种写法: 这就是著名的贝叶斯公式。其中P(ωj)叫做先验概率,就是类别出现的可能性;p(x|ωj)叫条件概率,就是在ωj时x出现的可能性;p(ωj|x)叫后验概率;p(x)是该样例出现的可能性。 因此: 对于上面的问题: 如果p(ω1|x)p(ω2|x),那么就认为x属于ω1,即这条鱼是鲈鱼。同理于: 这几个基本数据都已经给出了,因此可以计算出不等式的结果。如果p(ω1|x)p(ω2|x),那么就认为x属于ω2,即这条鱼是鲑鱼。同理于: 二 贝叶斯决策算法上面的分类有几个主要限制:特征向量中只包含一个特征:亮度。只有两个类别:鲈鱼和鲑鱼。仅仅允许分类,而不是根据分类采取行动。同时,没有加入损失控制:例如鲈鱼比鲑鱼贵。如果鲈鱼的罐头里装入了鲑鱼,那么客户会很生气;如果鲑鱼的罐头里装入了鲈鱼,那么客户很难感到有损失。那么这个时候分类后采取的行动就要偏向于便宜的鲑鱼。下面就看突破这几个限制的比较通用的贝叶斯分类器是什么样的。为了解决第一个显示,使用向量x代替原来的单变量x。x就叫做特征向量。比如鲈鱼鲑鱼分类的例子中,可以设计这样一个特征向量(x1,x2),其中x1表示亮度,x2表示长度。 定义类别总共有c个:{ω1,ω2…,ωc},第j个分类为ωj。此时,x属于类别ωj的概率依然用这个公式计算:但是,并不是简单地将x归于具有最大p(ωj|x)值的那个类别ωj。因为要考虑损失:定义进行第i个行动(比如将样例归于第i个类别)这种行为表示为:αi。在一个样例的真正类别为ωj时,进行第i个行动造成的损失是:λ(αi|ωj)。那么进行第i个行动的总损失:这里将每个类别为真正类别时采取第i个行动造成的损失都加起来,作为采取第i个行动的总损失。那么每个行动的总损失都可以求出来,采取其中总损失最小的行动。比如行动k最小,对应的行动是将样例归于第k个类别,那么就如此进行分类。 举例:贝叶斯决策算法在两类问题中的决策。定义 ,是在一个样例的真正类别为ωj时,进行第i个行动造成的损失。采取第1个行动时的总损失: 采取第2个行动时的总损失:时,采取第1个行动。即: 那么当 比如对于上面的例子λ11=λ22=0。鲈鱼ω1比鲑鱼ω2贵。如果鲈鱼ω1的罐头里装入了鲑鱼ω2,那么客户会很生气;如果鲑鱼ω2的罐头里装入了鲈鱼ω1,那么客户很难感到有损失。那么这个时候分类后采取的行动就要偏向于便宜的鲑鱼。因此设当真正类别是鲑鱼ω2的时候,将x归类为鲈鱼ω1(造成鲈鱼ω1的罐头里装入了鲑鱼ω2)的损失λ12=2,设当真正类别是鲈鱼ω1的时候,将x归类为鲑鱼ω2(造成鲑鱼ω2的罐头里装入了鲈鱼ω1)的损失λ21=0.2。可以看到,上面的公式变成了:三 判别函数在模式识别里,经常用gi(x)来表示x属于第i个类别的可能性。如果对于所有的j!=i都有:gi(x)gj(x),那么认为x属于第i个类别ωi。比如令gi(x)=-R(αi|x)。上面是一个不等式关系,如果不等式两边都乘以相同的正数,或加上相同的树,或取自然对数。那么不等式的关系是不变的。因此不考虑损失时的贝叶斯判别函数: 可以写成:四 正态分布贝叶斯公式中的p(x|ωj)是条件概率,代表在类别为ωj时,x的概率。比如在ωj为鲈鱼时,一个特定亮度x的概率。条件概率分布中常见的一个分布是高斯分布(正态分布)。正态分布是最重要的一种概率分布。正态分布概念是由德国的数学家和天文学家Moivre于1733年首次提出的,但由于德国数学家Gauss(Carl Friedrich Gauss,1777—1855)率先将其应用于天文学家研究,故正态分布又叫高斯分布。 高斯分布的形状是钟形曲线。 很多随机变量的概率分布都可以近似地用正态分布来描述。例如:同一种生物体的身长、体重等指标;百度高个吧投票的身高分布:在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同

文档评论(0)

文单招、专升本试卷定制 + 关注
官方认证
服务提供商

专注于研究生产单招、专升本试卷,可定制

版权声明书
用户编号:8005017062000015
认证主体莲池区远卓互联网技术工作室
IP属地河北
统一社会信用代码/组织机构代码
92130606MA0G1JGM00

1亿VIP精品文档

相关文档