- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
题目:模式识别
学院:电子工程学院
专业:智能科学与技术
学生姓名:****
学号:02115***
模式识别大作业
问题描述
分别用近邻法和Fisher线性判别准那么对Wdbc和sonar数据进行分类并计算识别率。
二、算法介绍
近邻法
假定有c个类别W1,W2,…,Wc的模式识别问题,每类有标明类别的样本Ni个〔i=1,2,…,c〕,我们规定Wi类的判别函数为
g
假设g
那么决策x∈Wj
Fisher线性判别
假设有一集合包含N个d维样本,其中N1个属于类的样本记为子集X1,N2个属于类的样本记为X2。假设对Xn的分量做线性组合可得标量
y
这样便得到N个一维样本yn组成的集合,并可分为两个子集Y1和Y2。
定义各类样本均值向量mi:
m
样本类内离散度矩阵Si和总类内离散度矩阵Sw:
S
S
样本类间离散度矩阵Sb:
S
我们希望投影后,在低维空间里个样本尽可能的分开些,即希望两类均值(m1-m2)越大越好,同时希望各类样本内部尽量密集,即Si越小越好。因此,我们定义Fisher准那么函数为:
J
J
采用Lagrange乘子法求解它的极大值
我们很容易得到
w
忽略比例因子R/λ,得
w
这就是我们Fisher准那么函数取极大值时的解。
三、实验数据
表1实验数据
类别数
特征维数
样本个数
Wdbc
2
30
M:212
B:357
sonar
2
60
W1:98
W2:110
表2实验结果〔准确率%〕
不降维(最近邻法)
降维(Fisher判别)
Wdbc
78%
96%
sonar
73%
69%
四、实验结果
Wabc
由结果可知,在特征向量维数较低时,用Fisher判别准那么的正确率较高且比拟稳定。最近邻法的正确率比Fisher低,且正确率依赖于随机抽取的训练样本,波动较大。
Sonar
由结果可知,在特征向量维数较高时,用最近邻法那么的正确率较高,但其正确率依赖于随机抽取的训练样本,波动较大。Fisher判别准那么的正确率比Fisher低,但较稳定。
代码为:
Wdbc:
clc;
totalsum1=0;
totalsum2=0;
truerate=zeros(2,10);
forii=1:10
data=load(wdbc.txt);
data1=data(1:212,2:32);%任取w1类数据中的106组
rbow1=randperm(212);
trainsample1=data1(rbow1(:,1:106),1:31);
rbow1(:,107:212)=sort(rbow1(:,107:212));%剩余的106组按行下标大小顺序排列
testsample1=data1(rbow1(:,107:212),1:31);
data2=data(213:569,2:32);%任取w2类数据中的178组
rbow2=randperm(357);
trainsample2=data2(rbow2(:,1:178),1:31);
rbow2(:,179:357)=sort(rbow2(:,179:357));
testsample2=data2(rbow2(:,179:357),1:31);
trainsample=cat(1,trainsample1,trainsample2);%包含284组数据的样本集
testsample=cat(1,testsample1,testsample2);%包含285组数据的测试集
newchar=zeros(1,285);sum=0;
[i,j]=size(trainsample);%i=284,j=31
[u,v]=size(testsample);%u=285,v=31
result=0;
min=1000000000;
true1=0;
error1=0;
forx=1:u%最近邻法
fory=1:i
forz=2:31
result=result+((testsample(x,z)-trainsample(y,z))^2);%欧氏距离
end;
文档评论(0)