- 1、本文档共18页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用身高体重数据进行性别分类的实验
)用s作为训练祥不,用们
试样本,采用身高和体重数据为特征,在正态分布假
设下估计概率密度(只用训练样本),建立最小错误
率贝叶斯分类器,写出所用的密度估计方法和得到的
决策规则,将该分类器分别应用到训练集和测试集,
考察训练错误率和测试错误率。将分类器应用到
dataset3上,考察测试错误率的情况。(在分类器设
计时可以尝试采用不同先验概率,考查对决策和错误
率的影响。)
2)自行给出一个决策表,采用最小风险贝叶斯决策重
复上面的实验。
题目分析
题目一中要估计正态分布下的概率密度函数,假设身高随机变量为X,体重随机变量为
Y,二维随机变量(X,Y)的联合概率密度函数是:
省y
其中-∞x,y+∞;-0馬,凸+可,20-1sp≤1。并其,2分别是X与Y
的均值,1,C2分别是X与Y的方差,p是X与Y的相关系数。运用最大似然估计求取
概率密度函数,设样本集中包含N介样本,即y={,2,…,},其中是列向星。根
据教村《楼式识第三版)55公式(34)和343)令/=()则=
协方差矩阵∑
P01
pG,ca, c2 I
那么E=∑(-A(x
采用最小错误率贝叶斯分类器,设一个身高体重二维向量为,女生类为m,男生类
为,决策规则如下:x∈
当P(a1|x)P(a21x)
概率P可以通过贝叶斯公式求解,
当P(a1x)P(a|x
采用不同的先验概率,其结果也会有相应不同。然后逐一对样本数据进行检验,就可以分
别得到各个训练集和测试集的错误率。
采用最小风险贝叶斯决策,首先在前面最小错误率贝叶斯分类器的基础上计算出
P(Q|x),然后自己设定一个主观的决策表,接着根据教材“模式识别(第二版)”15页
最上面的公式计算条件风险值,然后逐一比较风险值,找出条件风险最小的决策(怛就是
分为哪一类)。4
matlab?程序实现
用最大似然估计求取概率密度函数
第一步、获取样本数据,存储为矩阵A
第二步、对矩阵的每一行求和,并除以样本总数N,
得到平均值向量
第三步、应用公式(3-43)
∑(x-n)(x-A)
采用矩阵运算和循环控制语句( Matlab中很方便)
求得协方差矩阵
第四步、通过协方差矩阵求得方差和相关系数,从而
得到概率
函数。
matlab程序实现
第一步、获取样本数据,存储为矩阵A
这里给定的样本数据以记事本(txt)形式存储
a dat aset1-记事本
8057855M57
Matlab程序文件名 readdata m
Files\ IAILAB\R2006 a\work\模式识别弟一次作业 readdat a夏
l edit test Go
电电口f,自图看国stms
唱唱-10+÷1:x游然0
1-6ta=1oad( datasets,txt’);%读当前目录下的文件dat:a11,txt,注意记事本中不能有任何数字外的字符
B[data(: I) data(:, 2)]
averageO,c0-1 g8lihood(A3;%根据女生样本集计算的均值和协方差
iata=1oad( dataset.txt);%读当前目录下的文件data1t,注意记事本中不能有任何数字外的字符
7-[ average l,cw1]-1 ikelihood(A2;,%据女生拌本集计算的均值和协方差
极大似然法求取均值和方差( Matlab
函数名称为 likelihood n)
unction [average, cov]=likelihood( a) for i =1: M
%程序:最大似然估计
average (i, 1=sum(i, 1/N
%功能:求取身高、体重二维向量end
的正态分布参数
coV=zeros
M, M)
AT=A
temp=zeros(M, 1)
[M, N=Size(AT)
average=zeros(M, 1)
for j=1: M
sum=zeros(M, 1)
temp(j, 1)=AT(, i
or j=1: M
end
sum(,1)=0;
coV=coV+(temp
for j=1: N
average)((temp-average)
sum(,1)=sum(,1)+AT(,
end
end
COV=COV/
d
运行程序 readdata m
TLAB
File Edit Debug Desktop Window Help
8电昌
西目?
hortcuts F How to Add a Whats New
[average1
28.314022.6489
20.9101
51.4n3RR.3nmn2.77n
实验结果分析和讨论
在 dataset1tx文件中,女生有78名,程序求解有其身高体重平均值分别是162.3205
20.9101.8
文档评论(0)