- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Bayes分类器设计概要
实验二 Bayes分类器设计一、实验目的通过实验,加深对统计判决与概率密度估计基本思想、方法的认识,了解影响Bayes分类器性能的因素,掌握基于Bayes决策理论的随机模式分类的原理和方法。二、实验内容设计Bayes决策理论的随机模式分类器。假定某个局部区域细胞识别中正常(a1)和非正常(a2)两类先验概率分别为 正常状态:P(a1)=0.9; 异常状态:P(a2)=0.1。三、方法手段Bayes分类器的基本思想是依据类的概率、概密,按照某种准则使分类结果从统计上讲是最佳的。换言之,根据类的概率、概密将模式空间划分成若干个子空间,在此基础上形成模式分类的判决规则。准则函数不同,所导出的判决规则就不同,分类结果也不同。使用哪种准则或方法应根据具体问题来确定。四、Bayes算法1.实验原理多元正太分布的概率密度函数由下式定义由最小错误概率判决规则,可得采用如下的函数作为判别函数这里,为类别发生的先验概率,为类别的类条件概率密度函数,而N为类别数。设类别,i=1,2,……,N的类条件概率密度函数,i=1,2,……,N服从正态分布,即有~,那么上式就可以写为由于对数函数为单调变化的函数,用上式右端取对数后得到的新的判别函数替代原来的判别函数不会改变相应分类器的性能。因此,可取显然,上式中的第二项与样本所属类别无关,将其从判别函数中消去,不会改变分类结果。这样,判别函数可简化为以下形式2.实验步骤1、求出两类样本的均值2、求每一类样本的协方差矩阵式中,l代表样本在类中的序号,其中代表类的第l个样本,第j个特征值;代表类的个样品第j个特征的平均值代表类的第l个样品,第k个特征值;代表类的个样品第k个特征的平均值。类的协方差矩阵为3、计算出每一类的协方差矩阵的逆矩阵以及协方差矩阵的行列式4、求出每一类的先验概率5、将各个数值代入判别函数判别边界为 五、Bayes分类器实验结果已知(图1)数据a=[0.3760 0.0240 0.2440 -0.1740 0.0460 -0.3940 0.3760 0.7720 0.2660 0.5080 -0.4380 -0.0640 0.8160 0.5960 0.1120 0.3540 0.8380 -0.7680 0.4200 -0.7900];其满足正态分布(图2)。1. 最小错误率贝叶斯决策图1 样本数据 图2 样本的类条件概率根据最小错误率准侧,计算其后验条件概率(图3),通过程序运行出结果细胞分类结果为:1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0,其中,0为判成正常细胞,1为判成异常细胞。图3 后验条件概率2. 最小风险贝叶斯决策根据最小风险判别准侧,其损失函数赋值为r=[0 1000 0;200 0 0],则计算其条件风险概率(图4)通过程序运行出结果细胞分类结果为:1 1 1 1 1 1 1 0 1 1 1 1 0 1 1 1 0 1 1 1,其中,0为判成正常细胞,1为判成异常细胞。图4 条件风险概率3.两类分类器结果不同原因分析由最小错误率的贝叶斯判决和基于最小风险的贝叶斯判决得出图形中的分类结果可以看出,样本0.0240,0.2440等在前者中被分为“正常细胞”,在后者被分为“异常细胞”,分类结果不同。因为在给予最小风险贝叶斯判决中,影响决策结果的因素多了损失r这一项,所以当结合最小风险贝叶斯决策表进行计算时,‘损失’起了主导作用,导致出现两者结果的不一致。六、Bayes分类器程序代码function y=my_bayes(n,a)%%%%%%%%%%%%%最小错误率贝叶斯决策% 构造实验数据a=[0.3760 0.0240 0.2440 -0.1740 0.0460 -0.3940 0.3760 0.7720 0.2660 0.5080 -0.4380 -0.0640 0.8160 0.5960 0.1120 0.3540 0.8380 -0.7680 0.4200 -0.7900];n=20; % 样本数a=(round(100*rand(n,1))/100)*2.2-0.9;% 样本数为n,特征数为1,数据在-0.9与1.3之间figureplot(1:n,a,rx)xlabel(样本数);ylabel(生化化验值);title(样本数据:生化化验值);pause;% 先验概率P=[0.9 0.1];% 作类条件概率密度曲线p(x|wi)x=-0.9:0.01:1.3;px(1,:)=(1/(sqrt(2*pi)*0.3))*exp(-0
文档评论(0)