- 1、本文档共37页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
;主要内容;主成分分析法(Principal Components Analysis,PCA) ;一、主成分分析概述;假定你是一个公司的财务经理,掌握了公司的所有数据,这包括众多的变量,比如固定资产、流动资金、每一笔借贷的数额和期限、各种税费、工资支出、原料消耗、产值、利润、折旧、职工人数、职工的分工和教育程度等等。
如果让你向上级或有关方面介绍公司状况,你能够把这些指标和数字都原封不动地摆出去吗?
;当然不能。汇报什么?
发现在如此多的变量之中,有很多是相关的。人们希望能够找出它们的少数“代表”来对它们进行描述。
需要把这种有很多变量的数据进行高度概括,用少数几个指标简单明了地把情况说清楚。
;主成分分析法( Principal Components Analysis )和因子分析法(Factor Analysis)就是把变量维数降低以便于描述、理解和分析的方法。
主成分分析也称为主分量分析,是一种通过降维来简化数据结构的方法:如何把多个变量化为少数几个综合变量(综合指标) ,而这几个综合变量可以反映原来多个变量的大部分信息,所含的信息又互不重叠,即它们之间要相互独立,互不相关。
这些综合变量就叫因子或主成分,它是不可观测的,即它不是具体的变量,只是几个指标的综合。
在引入主成分分析之前,先看下面的例子。;成绩数据;从本例可能提出的问题;事实上,以上问题在平时的研究中,也会经常遇到。它所涉及的问题可以推广到对企业、对学校、对区域进行分析、评价、排序和分类等。
比如对n个样本进行综合评价,可选的描述样本特征的指标很多,而这些指标往往存在一定的相关性(既不完全独立,又不完全相关),这就给研究带来很大不便。若选指标太多,会增加分析问题的难度与复杂性,选指标太少,有可能会漏掉对样本影响较大的指标,影响结果的可靠性。;这就需要我们在相关分析的基础上,采用主成分分析法找到几个新的相互独立的综合指标,达到既减少指标数量、又能区分样本间差异的目的。
; 二、主成分分析的基本原理;;(一)主成分分析的几何解释;因为在实际应用中,往往存在指标的量纲不同,所以在计算之前须先消除量纲的影响,而将原始数据标准化。为了实现样本数据的标准化,应求样本数据的平均和方差。对数据矩阵Y作标准化处理,即对每一个指标分量作标准化变换,变换公式为:
;其中,
样本均值:
样本标准差:
;原始变量 经规格化后变为新变量 ,其均值为零,方差为1。
对二维空间来讲n个标准化后的样本在二维空间的分布大体为一椭圆形,该椭圆有一个长轴和一个短轴。在短轴方向上数据变化很少,极端的情况下,短轴如退化成一点,长轴的方向可以完全解释这些点的变化,由二维到一维的降维就自然完成了。;;如果将坐标轴 X1 和 X2 旋转45o ,那么点在新坐标系中的坐标(Y1,Y2)与原坐标(X1,X2)有如下的关系: ;;在上面的例子中 Y1 和 Y2 就是原变量 X1和 X2的第一主成分和第二主成分。实际上第一主成分 Y1 就基本上反映了 X1 和X2 的主要信息,因为图中的各点在新坐标系中的 Y1 坐标基本上就代表了这些点的分布情况,因此可以选 Y1 为一个新的综合变量。当然如果再选 Y2也作为综合变量,那么 Y1 和 Y2 则反映了 X1 和 X2的全部信息。 ;*;*;*;三、主成分分析的计算步骤;;(一)计算相关系数矩阵
rij(i,j=1,2,…,p)为原变量xi与xj标准化后的相关系数, rij=rji,其计算公式为
;(二)计算特征值与特征向量
1、解特征方程 ,求出特征值,并使其按大小顺序排列 ;*; (四)计算主成分载荷
在主成分之间不相关时,主成分载荷就是主成 分zi与变量xj之间的相关系数
;因子分析法(Factor Analysis,FA);(一)因子分析法概述;(二)因子分析法的模型;因子模型的表达式为:; 其矩阵形式为:
其中 为因子载荷。数学上可以证明,因子载荷 就是第i变量与第j因子的相关系数,反映了第i变量在第j因子上的重要性。
F称为X的公共因子或潜因子,矩阵A称为因子载荷矩阵,e称为X的特殊因子。
;附、主成分分析与因子分析的区别;
您可能关注的文档
- 2015-2016学年高中历史第三单元第二次世界大战8世界反法西斯战争胜利的影响研究.ppt
- 2015-2016学年高中历史第三单元近代中国经济结构的变动与资本主义的曲折发展单元总结新人教版必修2研究.ppt
- 中国地理练习研究.ppt
- 2015-2016学年高中历史第四单元中国社会主义建设发展道路的探索第19课经济体制改革研究.ppt
- 2015-2016学年高中历史第一单元从“朕即国家”到“主权在民”第1课欧洲的君主专制研究.ppt
- 中原油田开发测井常用方法及应用(简)研究.ppt
- 中国地理三--中国的天气和气候研究.ppt
- 中国地理上课整理2015.11.18研究.ppt
- 2015-2016学年高中历史第一单元第一次世界大战3同盟国集团的瓦解研究.ppt
- 九型人格人物全版研究.ppt
- 云南省曲靖市中小学生科技素养课程 第1课.《车型1》说课稿.docx
- 第7课《散文诗二首》说课稿-2024-2025学年七年级语文上册同步优质讲堂(统编版2024).docx
- 硕士答辩实战指南PPT模板.pptx
- 生物科技研发实验室项目合作与风险共担协议.doc
- 硕士管理学答辩报告PPT模板.pptx
- 医疗行业患者知情权告知及免责协议书.doc
- Unit 4What's the best movie theaterSeationB(3c~SelfCheck)写作课说课稿-2024-2025学年人教版英语八年级上册.docx
- 第10讲 生物的变异和进化(讲义)-2025年高考生物二轮复习(新高考通用) (原卷版).docx
- 双十一营销策略PPT模板.pptx
- 人工智能研发合作协议书.doc
文档评论(0)