西电模式识别大作业.docxVIP

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

题目:模式识别

学院:电子工程学院

专业:智能科学与技术

学生姓名:****

学号:02115***

模式识别大作业

问题描述

分别用近邻法和Fisher线性判别准那么对Wdbc和sonar数据进行分类并计算识别率。

二、算法介绍

近邻法

假定有c个类别W1,W2,…,Wc的模式识别问题,每类有标明类别的样本Ni个〔i=1,2,…,c〕,我们规定Wi类的判别函数为

g

假设g

那么决策x∈Wj

Fisher线性判别

假设有一集合包含N个d维样本,其中N1个属于类的样本记为子集X1,N2个属于类的样本记为X2。假设对Xn的分量做线性组合可得标量

y

这样便得到N个一维样本yn组成的集合,并可分为两个子集Y1和Y2。

定义各类样本均值向量mi:

m

样本类内离散度矩阵Si和总类内离散度矩阵Sw:

S

S

样本类间离散度矩阵Sb:

S

我们希望投影后,在低维空间里个样本尽可能的分开些,即希望两类均值(m1-m2)越大越好,同时希望各类样本内部尽量密集,即Si越小越好。因此,我们定义Fisher准那么函数为:

J

J

采用Lagrange乘子法求解它的极大值

我们很容易得到

w

忽略比例因子R/λ,得

w

这就是我们Fisher准那么函数取极大值时的解。

三、实验数据

表1实验数据

类别数

特征维数

样本个数

Wdbc

2

30

M:212

B:357

sonar

2

60

W1:98

W2:110

表2实验结果〔准确率%〕

不降维(最近邻法)

降维(Fisher判别)

Wdbc

78%

96%

sonar

73%

69%

四、实验结果

Wabc

由结果可知,在特征向量维数较低时,用Fisher判别准那么的正确率较高且比拟稳定。最近邻法的正确率比Fisher低,且正确率依赖于随机抽取的训练样本,波动较大。

Sonar

由结果可知,在特征向量维数较高时,用最近邻法那么的正确率较高,但其正确率依赖于随机抽取的训练样本,波动较大。Fisher判别准那么的正确率比Fisher低,但较稳定。

代码为:

Wdbc:

clc;

totalsum1=0;

totalsum2=0;

truerate=zeros(2,10);

forii=1:10

data=load(wdbc.txt);

data1=data(1:212,2:32);%任取w1类数据中的106组

rbow1=randperm(212);

trainsample1=data1(rbow1(:,1:106),1:31);

rbow1(:,107:212)=sort(rbow1(:,107:212));%剩余的106组按行下标大小顺序排列

testsample1=data1(rbow1(:,107:212),1:31);

data2=data(213:569,2:32);%任取w2类数据中的178组

rbow2=randperm(357);

trainsample2=data2(rbow2(:,1:178),1:31);

rbow2(:,179:357)=sort(rbow2(:,179:357));

testsample2=data2(rbow2(:,179:357),1:31);

trainsample=cat(1,trainsample1,trainsample2);%包含284组数据的样本集

testsample=cat(1,testsample1,testsample2);%包含285组数据的测试集

newchar=zeros(1,285);sum=0;

[i,j]=size(trainsample);%i=284,j=31

[u,v]=size(testsample);%u=285,v=31

result=0;

min=1000000000;

true1=0;

error1=0;

forx=1:u%最近邻法

fory=1:i

forz=2:31

result=result+((testsample(x,z)-trainsample(y,z))^2);%欧氏距离

end;

文档评论(0)

199****8042 + 关注
实名认证
文档贡献者

相信自己,相信明天

1亿VIP精品文档

相关文档