- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实验1主元素分析.doc
实验1 主元素分析(Principle Component Analysis, PCA)
PCA 是Hotelling于1933年首先提出,是把原来多个变量划为少数几个综合指标的一种统计分析方法, 从数学角度来看,这是一种降维处理技术。
PCA的基本计算步骤为
1 对具有p维的n个样本二维数据集,
计算其协方差矩阵COV(X1, X2,。。。Xn)
求出与此协方差矩阵对应的特征向量与特征值并使特征值按从大到小的顺序排列
计算主成分贡献率及累计贡献率
一般取累计贡献率达85—95%的特征值所对应的第一、第二、…、第m(m≤p)个主成分
计算主成分载荷
对主成分进行分析
例1设有一组古生物腕足动物贝壳标本的两个变量:长度和宽度.所测量的数据列如下:
X1 X2 X1 X2 3 2 12 10 4 10 12 11 6 5 13 6 6 8 13 14 6 10 13 15 7 2 13 17 7 13 14 7 8 9 15 13 9 5 17 13 9 8 17 17 9 14 18 19 10 7 20 20 11 12 ? ? 1 计算协方差矩阵
在MATLAB中调用函数 COV
x1=[3,4,6,6,6,7,7,8,9,9,9,10,11,12,12,13,13,13,13,14,15,17,17,18,20];
x2=[2,10,5,8,10,2,13,9,5,8,14,7,12,10,11,6,14,15,17,7,13,13,17,19,20]
A = cov(x1, x2);
可计算出 协方差矩阵A=
2 计算对应的协方差矩阵对应的特征向量与特征值
[ x, D ] = eig(A)
lamda0 =diag( D );
其中 A为协方差矩阵, X为对应的特征向量,lamda0 为 对应的特征值
重新排序,以获得从大到小排列的特征值与特征向量
[lamda,IX] = sort( lamda0, descend);
v1= x(:, IX(1));
v2= x(:, IX(2));
lamda =[ 37.8677,6.4690]
v1=[0.6631,0.7485]
v2=[ -0.7485,0.6631]
即
它说明第一主成分Z1的方差为37.9,第二主成分Z2的方差为6.5。两者之和恰为X1和X2的总方差44.4。可见,两个主成分Z1、Z2所代表的信息分别为86%和14%。如果用Z1代表原来的数据,则仅损失信息14%。但若用X1和X2来代表原来的数据,则将损失信息46%或54%。
主成分的计算为
Z1 Z2 Z1 Z2 3.48 0.93 15.42 2.4 10.14 -3.6 16.17 1.74 7.71 1.2 13.08 5.79 9.96 -0.78 19.08 0.51 11.46 -2.1 19.83 -0.15 6.12 3.93 21.33 -1.47 14.37 -3.33 14.49 5.88 12.03 0.06 19.65 2.67 9.69 3.45 20.97 4.17 11.94 1.47 23.97 1.53 16.44 -2.49 26.13 0.96 11.85 2.88 28.2 1.8 16.26 0.33 ? ?
需要说明的是
MTALAB 提供了直接计算的函数
x0=[3,4,6,6,6,7,7,8,9,9,9,10,11,12,12,13,13,13,13,14,15,17,17,18,20 ;
2,10,5,8,10,2,13,9,5,8,14,7,12,10,11,6,14,15,17,7,13,13,17,19,20 ];
A = cov(x0);
[PC,SCORE,latent] = princomp(x0);
[pc,latent,explained] = pcacov(A);
实验要求
1给定某农业生态经济系统各区域单元的有关数据如下,试用MATLAB 两种方式完成下列数据的PCA分析和解释。
2
重庆市2010年40区县经济发展水平聚类分析的评价指标 经济总量 GDP(万元、人均GDP、工业产值(万元)、人均工业、固定资产投资(万元)、人均固投、进出口总额(万美元)、人均进出口(美元/人)、财政收入(万元)、人均财收、消费总额(万元)、人均消费 经济潜力 GDP增长率、工业产值增长率、固定资产投资增长率、进出口总额增长率、财政收入增长率、消费总额增长率 经济产业结构 第一产业增长率、第二产业增长率、第三产业增长率 2 给定2010年重庆40区县经济发展水评价指标如下:
试用PCA 方法进行分析。
您可能关注的文档
- 实用心理学给HR的职场十大告诫.doc
- 实用旅游经济学教学课件作者第二版谭为跃教学课件第七章旅游经济效益与评价课件.ppt
- 实用经济数学教学课件作者盛光进电子教案0实用经济数学概述课件.ppt
- 实用经济数学教学课件作者盛光进电子教案10博弈论课件.ppt
- 实用经济数学教学课件作者盛光进电子教案11MATLAB软件使用简介课件.ppt
- 实用经济数学教学课件作者盛光进电子教案1函数课件.ppt
- 实用经济数学教学课件作者盛光进电子教案2导数与微分课件.ppt
- 实用经济数学教学课件作者盛光进电子教案3导数的应用课件.ppt
- 实用经济数学教学课件作者盛光进电子教案4积分及其应用课件.ppt
- 实用经济数学教学课件作者盛光进电子教案6线性代数及其应用课件.ppt
文档评论(0)