用身高体重数据进行性别分类实验.ppt

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
用身高体重数据进行性别分类的实验 )用s作为训练祥不,用们 试样本,采用身高和体重数据为特征,在正态分布假 设下估计概率密度(只用训练样本),建立最小错误 率贝叶斯分类器,写出所用的密度估计方法和得到的 决策规则,将该分类器分别应用到训练集和测试集, 考察训练错误率和测试错误率。将分类器应用到 dataset3上,考察测试错误率的情况。(在分类器设 计时可以尝试采用不同先验概率,考查对决策和错误 率的影响。) 2)自行给出一个决策表,采用最小风险贝叶斯决策重 复上面的实验。 题目分析 题目一中要估计正态分布下的概率密度函数,假设身高随机变量为X,体重随机变量为 Y,二维随机变量(X,Y)的联合概率密度函数是: 省y 其中-∞x,y+∞;-0馬,凸+可,20-1sp≤1。并其,2分别是X与Y 的均值,1,C2分别是X与Y的方差,p是X与Y的相关系数。运用最大似然估计求取 概率密度函数,设样本集中包含N介样本,即y={,2,…,},其中是列向星。根 据教村《楼式识第三版)55公式(34)和343)令/=()则= 协方差矩阵∑ P01 pG,ca, c2 I 那么E=∑(-A(x 采用最小错误率贝叶斯分类器,设一个身高体重二维向量为,女生类为m,男生类 为,决策规则如下:x∈ 当P(a1|x)P(a21x) 概率P可以通过贝叶斯公式求解, 当P(a1x)P(a|x 采用不同的先验概率,其结果也会有相应不同。然后逐一对样本数据进行检验,就可以分 别得到各个训练集和测试集的错误率。 采用最小风险贝叶斯决策,首先在前面最小错误率贝叶斯分类器的基础上计算出 P(Q|x),然后自己设定一个主观的决策表,接着根据教材“模式识别(第二版)”15页 最上面的公式计算条件风险值,然后逐一比较风险值,找出条件风险最小的决策(怛就是 分为哪一类)。4 matlab?程序实现 用最大似然估计求取概率密度函数 第一步、获取样本数据,存储为矩阵A 第二步、对矩阵的每一行求和,并除以样本总数N, 得到平均值向量 第三步、应用公式(3-43) ∑(x-n)(x-A) 采用矩阵运算和循环控制语句( Matlab中很方便) 求得协方差矩阵 第四步、通过协方差矩阵求得方差和相关系数,从而 得到概率 函数。 matlab程序实现 第一步、获取样本数据,存储为矩阵A 这里给定的样本数据以记事本(txt)形式存储 a dat aset1-记事本 8057855M57 Matlab程序文件名 readdata m Files\ IAILAB\R2006 a\work\模式识别弟一次作业 readdat a夏 l edit test Go 电电口f,自图看国stms 唱唱-10+÷1:x游然0 1-6ta=1oad( datasets,txt’);%读当前目录下的文件dat:a11,txt,注意记事本中不能有任何数字外的字符 B[data(: I) data(:, 2)] averageO,c0-1 g8lihood(A3;%根据女生样本集计算的均值和协方差 iata=1oad( dataset.txt);%读当前目录下的文件data1t,注意记事本中不能有任何数字外的字符 7-[ average l,cw1]-1 ikelihood(A2;,%据女生拌本集计算的均值和协方差 极大似然法求取均值和方差( Matlab 函数名称为 likelihood n) unction [average, cov]=likelihood( a) for i =1: M %程序:最大似然估计 average (i, 1=sum(i, 1/N %功能:求取身高、体重二维向量end 的正态分布参数 coV=zeros M, M) AT=A temp=zeros(M, 1) [M, N=Size(AT) average=zeros(M, 1) for j=1: M sum=zeros(M, 1) temp(j, 1)=AT(, i or j=1: M end sum(,1)=0; coV=coV+(temp for j=1: N average)((temp-average) sum(,1)=sum(,1)+AT(, end end COV=COV/ d 运行程序 readdata m TLAB File Edit Debug Desktop Window Help 8电昌 西目? hortcuts F How to Add a Whats New [average1 28.314022.6489 20.9101 51.4n3RR.3nmn2.77n 实验结果分析和讨论 在 dataset1tx文件中,女生有78名,程序求解有其身高体重平均值分别是162.3205 20.9101.8

文档评论(0)

317960162 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档