- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
模式识别报告bayes分类
西安交通大学《模式识别》实验一——IRIS正态分布假设下的贝叶斯分类吴娟梅 硕20813112313030实验原理对于具有多个特征参数的样本(如本实验的iris数据样本有个参数),其正态分布的概率密度函数可定义为式中,是维行向量,是维行向量,是维协方差矩阵,是的逆矩阵,是的行列式。本实验我们采用最小错误率的贝叶斯决策,使用如下的函数作为判别函数(3个类别)其中为类别发生的先验概率,为类别的类条件概率密度函数。由其判决规则,如果使对一切成立,则将归为类。我们根据假设:类别,i=1,2,……,N的类条件概率密度函数,i=1,2,……,N服从正态分布,即有~,那么上式就可以写为对上式右端取对数,可得上式中的第二项与样本所属类别无关,将其从判别函数中消去,不会改变分类结果。则判别函数可简化为以下形式实验过程1.用部分数据来估计均值、协方差首先读入数据clear allclc% 原始数据导入,原数据以文本的形式存储,iris是一个L*12的矩阵,L为数据长度iris = load(C:\Documents and Settings\Administrator\IRIS_Data.txt);%求出数据长度Ldisplay(数据长度为)L=length(iris)%iris是一个L*12的矩阵,12列共分为三类数据,每类占4列%将数据分类存储于三个数组w1=iris(1:L,1:4);w2=iris(1:L,5:8);w3=iris(1:L,9:12);然后选取训练样本估计均值、协方差。训练样本的选取有很多种方法,我们采用两种较为常见的方法进行选取。方法一是顺序选取。分别试取[1:10]、 [11:50]两组数据进行训练,用于对比训练数据多寡对于分类效果的影响。%顺序选取,参数可调,待输入选取的训练样本的起始点和截止点display(请输入每类训练样本在顺序选取时的);N0 = input(数据起始点(大于0小于L的整数)N0=);Nj = input(数据截止点(大于N0小于L的整数)Nj=);display(则训练样本长度为)N=Nj-N0+1%提取样本的统计特征值,均值和协方差display(用上述部分数据估计的三类样本均值、协方差依次为);mean1=mean(w1(N0:Nj,:))mean2=mean(w2(N0:Nj,:))mean3=mean(w3(N0:Nj,:))cov1=cov(w1(N0:Nj,:))cov2=cov(w2(N0:Nj,:))cov3=cov(w3(N0:Nj,:)) 方法二是随机选取N个数据。试随机取N=10、N=40两组数据进行训练。同样也是用于比对训练数据的多寡对分类器的性能有何影响。clear allclc% 原始数据导入,原数据以文本的形式存储,iris是一个L*12的矩阵,L为数据长度iris = load(C:\Documents and Settings\Administrator\IRIS_Data.txt);%求出数据长度Ldisplay(数据长度为)L=length(iris)%iris是一个L*12的矩阵,12列共分为三类数据,每类占4列%将数据分类存储于三个数组w1=iris(1:L,1:4);w2=iris(1:L,5:8);w3=iris(1:L,9:12);%随机选取,参数可调,待输入选取的训练样本的个数NN=input(请输入每类训练样本在随机选取时的样本长度为N=);%随机选取N个训练样本,即产生N个不大于数据长度L的不重复的整数作为其样本序号Numberranddata=randperm(L);Number1=randdata(1:N);Number=sort(Number1);%提取样本的统计特征值,均值和协方差display(用上述部分数据估计的三类样本均值、协方差依次为);mean1=mean(w1(Number,:))mean2=mean(w2(Number,:))mean3=mean(w3(Number,:))cov1=cov(w1(Number,:))cov2=cov(w2(Number,:))cov3=cov(w3(Number,:))2. 用后验概率去判断数据的类型首先选取测试分类数据。令先验概率可变,即选取不同的测试数据组数进行实验。试取测试数据组数为10、10、10,正常取值,来考查前述训练样本数对分类结果的影响。再试取数据组数为试取数据组数为4、40、50;45、4、3进行分类。研究当先验概率很小时对分类效果的影响。%选取w1[N10:N1j],w2[N20:N2j],w3[N30:N3j]用作每类测试的分类样本,可变先验概率%顺序选取,参数可调,待输入选取的测试分类样本的起始点和截止点%1类测试分类数据display(请输入1类测试分类样本
您可能关注的文档
- 必威体育精装版频率补偿电路.doc
- 必威体育精装版百年经济学答案(吐血整理).docx
- 最长公共子序列详解论文.doc
- 月考三试卷.doc
- 必威体育精装版黑木耳栽培技术20140626.doc
- 有关DNA是主要遗传物质及DNA分子结构练习题.doc
- 有关“单独两孩”政策热点问题解读.doc
- 有关快餐店论文.doc
- 有关海尔集团如何参与到全球供应链的研究.doc
- 有关建筑物裂缝.doc
- 2025年入党积极分子入学资格考试试题库及答案.docx
- 药品经营和使用质量监督管理办法试题及答案(药品批发).docx
- 2025年国家公务员政治理论应知应会知识试题库及答案.docx
- 2025年必威体育官网网址在线上教育培训题库(带答案).docx
- 2025《药品网络销售监督管理办法》考核题(含答案).docx
- 幼儿园幼儿交接接送制度(文档).docx
- 医院医疗十四项核心制度.docx
- 2024年上海理工大学电视播音主持期末考试检测卷及完整答案详解(名师系列).docx
- 2025年刑法期末考试综合提升测试卷带答案详解(典型题).docx
- 福建船政交通职业学院《形势与政策》期末考试全真模拟模拟题带答案详解(培优A卷).docx
最近下载
- 2017年全国二卷高考语文试题及答案.docx VIP
- 2025人教版初中八年级上册英语单词表汇总(含音标) .pdf VIP
- 2025年三支一扶考试时事政治试卷带解析附必背答案.docx VIP
- 2023广州市花都区事业单位考试历年真题.docx VIP
- 2023全国职业院校技能大赛(中职组)服装设计与工艺赛项备考试题库-上(单选题).docx VIP
- 《×××典当有限公司章程(范本)》.docx VIP
- 自考公安管理学笔记串讲预测-预测小抄.doc VIP
- 《面积单位间的进率》(教学设计)2023-2024学年三年级下册数学人教版.docx VIP
- 2016年高考全国2卷语文试题及答案.pdf VIP
- 强制性条文执行计划(完整版) .doc VIP
文档评论(0)