- 1、本文档共105页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
化学计量学-主成分分析-倪力军教学教材.ppt
主成分分析及其在回归分析中的应用 ;主成分分析的直观譬喻;什么是主成分分析?;什么是主成分分析?;为什么要进行主成分分析?;一个例子;亮氨酸、异亮氨酸溶液在适当条件下可与茚三酮反应,生成有色络合物。以试剂空白作参比,采用口径为1cm的比色皿、在530nm到590nm间每隔4nm可测得亮氨酸和异亮氨酸溶液的紫外光谱如下图所示。;步骤1—构造建模样品、采集其光谱;步骤3—模型的检验;;为什么根据Lamber-beer定律建立的多元线性回归模型误差很大;本例说明,当原始数据矩阵中的信息存在较高的相关性时,不对其进行信息压缩和抽提、不消除原始信息间的相关性就直接用其建模和预测会造成分析结果的荒谬与不可信。 ;为什么要根据方差确定主成分?;对主成分的要求;主成分与原始变量间的关系;主成分轴(载荷向量)与主成分得分;对三个变量构成的n个样本进行主成分分析示意图;
主成分变换将三维空间的样本压缩到二维空间表示;基本概念;基本概念; 协方差矩阵Z与相关矩阵R; 主成分的求解步骤: i)对原始数据矩阵进行标准化处理 相当于对原始变量进行坐标平移与尺度伸缩:; ii)求协方差矩阵Z
iii)特征分解
相当于将原来的坐标轴进行旋转得到新的坐标
轴U:
—Z的特征值组成的对角阵
U—Z的特征向量按列组成的正交阵,它构成
了新的矢量空间,作为新变量(主成分)的坐
标轴,又称为载荷轴。 ; iv) 确定主成分个数
(1)根据累积贡献率
当 大于某个阈值时,可认为主成分数目为m。
(2)根据其它准则
* 特征值大于1.0的因子数定为主成分数。
* 利用特征值与因子数目的曲线,到某一因子数后,特征值减小幅度变化不大,此转折点的因子数即为主成分数m。
* 保留那些与一个以上变量有重大关系的因子。;;主成分分析原理概括;PCA中的重要概念;例6-2:有3个变量X1, X2与X3(m=3),其16次(n=16)观测值见下表: ; 相关矩阵为:
相关阵R的特征值分别为2.077,0.919,0.004,
这说明第三个主成分所起作用非
常小,可以只要两个主成分 。
本例在MATLAB下的详细主成分分析过程及
结果演示、分析见教材6-2例。;例6-3:8个样品中苯和二甲苯的含量见下表:
;原始数据矩阵中含有8(n=8)个样品、
两个变量, 其协方差矩阵为:
;根据PC1求得的苯与二甲苯含量及其实际值;主成分得分的平方和、特征值与方差;主成分的特点与优点;PC1;;新、旧变量间的连接纽带-载荷轴(特征矢量、主成分轴);例6-2;;;(3)求协方差矩阵:
在MATLAB下键入如下命令:
Zxx=xx*xx/(16-1); %求经过预处理后的
数据矩阵xx的协方差矩阵并保持在Zxx中
Rx=corrcoef(X);%计算原始数据的
相关系数矩阵并保存在Rx中
会得到如下结果:; 在MATLAB下键入如下命令:
dx=(x-repmat(mean(X),size(X,1),1));
%将X中每个变量减去其均值并赋给dx
Zx=dx’dx/(16-1); %求原始数据矩阵X的
协方差矩阵并存放在Zx中
Rxx=corrcoef(XX); %求自标度化预处理
后数据矩阵XX的相关矩阵并存放在Rxx中;(4)进行主成分分析:
在MATLAB下键入如下命令: [pc,score,latent]=princomp(xx);
%采用MATLAB中princomp函数对矩阵xx进行主成分分析;(5)求主成分均值、方差和相关系数:
在MATLAB下键入命令:
mx=mean(score);
% 求每个主成分的平均值并赋给mx
var_score=var(score); % 求每个主成分的方差并赋给var_score
Rpc=corrcoef(score); % 求主成分
的相关矩阵并赋给Rpc ;根据本例分析结果可以得出;例6-2自标度化与中心化预处理后PCA结果比较;例6-3自标度化与中心化预处理后PCA结果比较;结论;思考题;课堂练习题;填空题;填空题;填空题;填空题;主成分分析在上市公司财务报表分析中的应用 ;;部分上市公司的综合排名;主成分回归(Principal Component Regression,PCR);例6-1的原理(K矩阵法);P矩阵法;问题的
文档评论(0)