《多元统计分析——基于R(第3版)》课件 第9章-主成分分析.pptx

《多元统计分析——基于R(第3版)》课件 第9章-主成分分析.pptx

  1. 1、本文档共48页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

主编:费宇

中国人民大学出版社;第9章主成分分析;2023/11/17;第9章主要内容;9.1主成分分析的基本思想;9.2总体主成分

9.2.1主成分的含义;二维情形主成分的解释;二维情形主成分的解释(续);利用R程序来模拟这一过程(先下载安装mvtnorm);2023/11/17;2023/11/17;一般,设总体的p个主成分为:

第i个主成分yi的方差为

y1是X的一切线性组合中方差最大者;

y2是与y1不相关是X的一切线性组合中方差最大者;

······;9.2.2主成分的计算;9.2.3主成分的主要性质;载荷与载荷矩阵:;9.2.4主成分个数的确定;9.2.5变量的标准化及意义;9.3样本主成分;9.3.1样本主成分的性质和计算;9.3.2主成分分析的步骤;主成分分析特别说明:;9.3.2(续)主成分相关的R函数;2023/11/17;表6-017个地质勘探点样品的标准化数据;2023/11/17;2023/11/17;第一主成分和第二主成分分别为:

参见教材分析,可将将它们分别理解为“课程差异主成分”和“课程均衡主成分”.;2023/11/17;2023/11/17;2023/11/17;2023/11/17;2023/11/17;表6-017个地质勘探点样品的标准化数据;2023/11/17;2023/11/17;前两个主成分的累积贡献率为0.592+0.228=0.82,已经超过80%,所以只需取两个主成分.第一主成分和第二主成分各为(为简明起见,样本主成分表达式中的所有“*”省略,以下同):;2023/11/17;2023/11/17;2023/11/17;2023/11/17;11号样本点综合排名最高,为17分;7号和9号排名次之,分别为16分和15分;之后样本点得分排名从高到低依次为4、12、3、8和17号.

利用函数biplot来绘制它们在z1和z2构成的坐标面z1Oz2上的散点图,并且加入六个变量在同一坐标面z1Oz2上的载荷散点图,得到所谓的“双坐标”散点图(见图9-9).

借助该图可以对17个勘测样本点进行大致分类:11号样本点独居右上,它在“生油”主成分z1和“储油”主成分z2上得分均高,应该首先重点关注.7、9号样本点相邻且最靠右,且在z1得分很高,可合为一类,次重点考虑;此外,在z1和z2上至少有一个得分较高的3、4、8、12和17号样本点也应该重点考察.这与上面的综合得分和排名一致.;2023/11/17;9.4案例:主成分回归分析;2023/11/17;解(1)先做线性回归分析,R程序及结果如下:

setwd(C:/data)#设定工作路径

c9.1-read.csv(case9.1.csv,header=T)#将数据读入到c9.1中

options(digits=3)#取三位有效数字

lmc9.1-lm(y~1+x1+x2+x3+x4,data=c9.1)

summary(lmc9.1)

从输出结果(见教材)可以看出,回归方程是非常显著的,R2为0.923,模型拟合效果很好,但x1、x2和x3的回归系数没有通过显著性检验(在0.05的显著性水平下).回归方程为:

然后作逐步回归,R程序及结果如下:

summary(step(lmc9.1))

回归方程和回归系数均显著,R2为0.921,逐步回归方程为:;(2)再作主成分回归分析,先求样本相关系数阵:

R=round(cor(c9.1[,2:6]),3);R#求样本相关系数矩阵

发现x4与y高度相关,x1,x2,x3相关性较强,可用主成分降维

c9.1pr-princomp(~x1+x2+x3+x4,data=c9.1,cor=T)#使用公式法

summary(c9.1pr,loadings=T)

前两个主成分累积贡献率已达88%,故选择前两个主成分

pre-predict(c9.1pr)#计算主成分得分

c9.1$z1-pre[,1];c9.1$z2-pre[,2]

lmpr-lm(y~z1+z2,data=c9.1)#做y关于主成分z1和z2的回归

summary(lmpr)

输出结果显示:y关于两个主成分z1和z2的回归方程和三个回归系数均是非常显著

您可能关注的文档

文档评论(0)

lai + 关注
实名认证
内容提供者

精品资料

版权声明书
用户编号:7040145050000060

1亿VIP精品文档

相关文档