- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
《数据分析》实验报告三--第1页
精品
课程名称数据分析方法课程编号
实验地点系统建模与仿真实验室SL110实验时间
校外指导教师无校内指导教师
实验名称实验3距离判别与贝叶斯判别分析
评阅人签字成绩
实验数据与内容
我国山区某大型化工厂,在厂区及邻近地区挑选有代表性的15个大气取样点,每日4次同时抽取
大气样品,测定其中含有的6种气体的浓度,前后共4天,每个取样点每种气体实测16次,计算
每个取样点每种气体的平均浓度,数据见表4-8。气体数据对应的污染地区分类见表4-8中最后一列。
现有两个取自该地区的4个气体样本,气体指标见表4-8中后4行,试解决以下问题:
1.判别两类总体的协方差矩阵是否相等,然后用马氏距离差别这4个未知气体样本的污染类别,并
计算回代误判率与交叉误判率;若两类总体服从正态分布,第一类与第二类的先验概率分别为7/15、
8/15,利用贝叶斯判别样本的污染分类。
2.先验概率为多少时,距离判别与贝时斯判别相同?调整先验概率对判别结果的影响是什么?
3.对第一类与第二类的先验概率分别为7/15、8/15,计算误判概率。
感谢下载载
《数据分析》实验报告三--第1页
《数据分析》实验报告三--第2页
精品
一、实验目的
1.熟练掌握MATLAB软件进行距离判别与贝叶斯判别的方法与步骤。
2.掌握判别分析的回代误判率与交叉误判率的编程。
3.掌握贝叶斯判别的误判率的计算。
二、实验原理
1)在MATLAB中,进行数据的判别分析命令为classify,其调用格式为:
class=classify(sample,training,group’type’)
将sample数据的每一行指定到训练集training的一个类中。Sample和training
必须具有相同的列数。group向量包含从1到组数的正整数,它指明训练营集中的每一
行属于哪一类。group和training必须具有相同的行数。’type’是可选项,
选’linear’表示总体为多元正态总体,选’quadratic’与’mahalanobis’。该函数
返回class,它是一个与sample具有相同行数的向量。Class的每一个元素指定sample
中对应元素的分类。通过计算sample和training中每一行的马氏距离,classify函数
决定sample中的每一行属于哪一个分类。
2)贝叶斯判别方法步骤
第1步,验证两个总体服从二元正态分布;第2步,检验两个总体的协方差矩阵相
等;估计两个总体的先验概p1率、p2;利用MATLAB软件计算。
3)回代误判率
设G1,G2为两个总体,x1,x2…和y1,y2…是分别来自G1,G2的训练样本,以全体
训练样本作为m+n个新样品,逐个代入已建立的判别准则中判别其归属,这个过程称为
回判。回判结果中若属于G1的样品被误判为属于G2的个数为N1个,属于G2的样品被
误判为属于G1的个数为N2个,则误判估计为:
P^=(N1+N2)/(m+n)
误判率的回代估计易于计算。但是,p^是由建立判别函数的数据反过来用作评估准
则的数据而得到的。所以有偏,往往比真实误判率小。当训练样本容量较大时,p^可以
作为真实误判率的一种估计。
4)交叉误判率估计是每次剔除一个
文档评论(0)