- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
巧用Matlab进行主成分降维
巧用Matlab进行主成分降维
PAGE
巧用Matlab进行主成分降维
巧用Matlab实现主成分分析
1.概述
Matlab语言是当今国际上科学界 (尤其是自动控制领域) 最具影响力、也是最有活力的软件。它起源于矩阵运算,并已经发展成一种高度集成的计算机语言。它提供了强大的科学运算、灵活的程序设计流程、高质量的图形可视化与界面设计、与其他程序和语言的便捷接口的功能。Matlab 语言在各国高校与研究单位起着重大的作用。主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。
主成分分析计算步骤PCA
= 1 \* GB3 ① 计算相关系数矩阵
(1)
在()式中,rij(i,j=1,2,…,p)为原变量的xi与xj之间的相关系数,其计算公式为
(2)
因为R是实对称矩阵(即rij=rji),所以只需计算上三角元素或下三角元素即可。
= 2 \* GB3 ② 计算特征值与特征向量
首先解特征方程,通常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列,即;然后分别求出对应于特征值的特征向量。这里要求=1,即,其中表示向量的第j个分量。
= 3 \* GB3 ③ 计算主成分贡献率及累计贡献率
主成分的贡献率为
累计贡献率为
一般取累计贡献率达85—95%的特征值所对应的第一、第二,…,第m(m≤p)个主成分。
= 4 \* GB3 ④ 计算主成分载荷
其计算公式为
(3)
得到各主成分的载荷以后,还可以按照()式进一步计算,得到各主成分的得分
(4)
2.程序结构及函数作用
在软件Matlab中实现主成分分析可以采取两种方式实现:一是通过编程来实现;二是直接调用Matlab种自带程序实现。下面主要主要介绍利用Matlab的矩阵计算功能编程实现主成分分析。
程序结构
主函数
子函数
函数作用
——用总和标准化法标准化矩阵
——计算相关系数矩阵;计算特征值和特征向量;对主成分进行排序;计算各特征值贡献率;挑选主成分(累计贡献率大于85%),输出主成分个数;计算主成分载荷
——计算各主成分得分、综合得分并排序
——读入数据文件;调用以上三个函数并输出结果
读者注意,在做主成分分析时一定要看清原理,两个重点,一个是选取85%,一个是matalab严格区分大小写。这是编者读完网上代码后改写的正确代码。
3.源程序
%,用总和标准化法标准化矩阵
function std=cwstd(vector)
cwsum=sum(vector,1); %对列求和
[a,b]=size(vector); %矩阵大小,a为行数,b为列数
for i=1:a
for j=1:b
std(i,j)= vector(i,j)/cwsum(j);
end
end
%
function result=cwfac(vector);
fprintf(相关系数矩阵:\n)
std=corrcoef(vector) %计算相关系数矩阵序测试
原始数据
中国大陆35个大城市某年的10项社会经济统计指标数据见下表。
城 市
名 称
年底
总人口
(万人)
非农业
人口比(%)
农 业
总产值
(万元)
工业
总产值
(万元)
客运总量
(万人)
货运总量
(万吨)
地方财政
预算内收入(万元)
城乡居民年底储蓄余额
(万元)
在岗职工人数(万人)
在岗职工工资总额
(万元)
北 京
1
8
1 843 427
19 999 706
20 323
45 562
2 790 863
26 806 646
5 773 301
天 津
9
1 501 136
22 645 502
3 259
26 317
1 128 073
11 301 931
2 254 343
石 家 庄
2
2 918 680
6 885 768
2 929
1 911
352 348
7 095 875
758 877
太 原
3
236 038
2 737 750
1 937
11 895
203 277
3 943 100
654 023
呼和浩特
2
365 343
816 45
文档评论(0)