- 1、本文档共55页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数理统计方法的Matlab实现(6.5版)
2.Bayes判别(假设正态分布,可计算后验概率) [class,err,p]=classify(sample,training,group,type) 其中sample为待判样本,training为训练样本,group为训练样本的类别.前两个参数必须相同的列数,后两个参数必须相同的行数.type参数默认值为’linear’,即各组协方差阵相同;还可取值为’quadratic’,即各组用不同的协方差阵. 输出中class为待判样本的判别结果,err为的错判率,p为待判样本属于各总体的概率. 特别,总体服从正态分布的情形 相关知识点: A=load(D:\\胃癌的鉴别.txt) [n,p]=size(A); sample=A(:,1:p-1); group=A(:,p); [class,err,p]=classify(sample,sample,group,quadratic) 3.fisher判别(程序编写见fisher_Classify.m函数) [class,e,lam]=fisher_Classify(sample,train,group,cov_equal) 其中sample为待判样本,train为训练样本,group为训练样本的类别.前两个参数必须相同的列数,后两个参数必须相同的行数. cov_equal各组协方差阵相同时取1,否则取0. 输出中class为待判样本的判别结果, e为正特征值对应的特征向量,lam为全体特征值. 两类Fisher判别示意图 Y X L=b1X+b2Y G1 G2 原则是使两组间的组间离差尽量大,而每个组的组内离差尽量小。 组间离差平方和 合并组内离差平方和 A=load(D:\\胃癌的鉴别.txt) [n,p]=size(A); sample=A(:,1:p-1); train=sample; group=A(:,p); [class,e,lam]=fisher_Classify(sample,train,group,0) 五、聚类分析 系统聚类基本思想: 初始每个样本自成一类,并规定样品间的距离和类与类间的距离;然后距离最近的两类合并成为新类,并计算新类与其它类间的距离;接下去再将最近小类聚成一类,如此反复,直到所有样本聚成一类为止。 X=load(D:\\2002年全国消费性支出.txt); newX=zscore(X) %标准化数据 D=pdist(newX) %计算距离矩阵 squareform(D) %以矩阵形式显示 Z=linkage(D,average) %按类平均法进行系统聚类 dendrogram(Z) %画谱系图 系统聚类方法 single‘ Shortest distance (default) complete‘ Furthest distance average‘ Unweighted average distance (UPGMA) weighted‘ Weighted average distance (WPGMA) centroid‘ Centroid distance (UPGMC) median‘ Weighted center of mass distance (WPGMC) ward‘ Inner squared distance (minimum variance algorithm) 六、主成分分析 [COEFF, SCORE, latent] = princomp(zscore(X)) 其中X为样本数据矩阵. 输出中COEFF为各特征值对应的特征向量, latent为全体特征值. 主成分定义 考虑线性变换 X=load(D:\\2010亚洲20国经济数据.txt); [COEFF, SCORE, latent] = princomp(zscore(X)) 例:针对2010亚洲20国经济数据进行主成分分析。 七、典型相关分析 [a1,b1,r,u1,v1,stats] = canoncorr(x,y) 其中x、y为原始样本数据矩阵. 输出项中a1,b1返回的是典型变量的系数,r返回的是典型相关系数,u1,v1返回的是典型变量的值,stats返回的是检验典型变量显著性的结果. x=load(D:\\城市基础设施指标.txt); y=load(D:\\城市竞
文档评论(0)