网站大量收购闲置独家精品文档,联系QQ:2885784924

研《主成分分析与因子分析》.pptVIP

  1. 1、本文档共67页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
主成分分析与因子分析 著名的因子分析研究 英国统计学家Moser Scott 1961年在对英国157个城镇发展水平进行调查时,原始测量的变量有57个,而通过因子分析发现,只需要用5个新的综合变量(它们是原始变量的线性组合),就可以解释95%的原始信息。对问题的研究从57维度降低到5个维度,因此可以进行更容易的分析。 美国统计学家Stone在1947年关于国民经济的研究,它根据美国1927年到1938年的数据,得到17个反映国民收入与支出的变量要素,经过因子分析,得到了3个新的变量,可以解释17个原始变量97.4%的信息。根据这3个因子变量和17个原始变量的关系,Stone将这3个变量命名为: Z1——总收入。 Z2——总收入率。 Z3——经济发展或衰退的趋势(时间t的线性部分)。 根据这3个变量的命名含义,可以看出这3个新的变量是可以测量的。Stone把实际测量3个变量的值(C1,实际测量总收入;C2,实际测量总收入率;C3,时间因素)和因子分析得到的3个变量值进行相关性分析,得到的结果如下表所示。 在社会、政治、经济和医学等领域的研究中往往需要对反映事物的多个变最进行人量的观察,收集大量的数据以便进行分析,寻找规律。在大多数情况下,许多变量之间存在一定的相关关系。因此,有可能用较少的综合指标分析存在于各变量中的各类信息,这些被抽象出来的综合指标之间彼此不相关,且能反映原来众多变量的主要信息,称之为因子。 因子分析就是用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子反映原资料的大部分信息的统计学方法。即是一种通过显在变量来测评潜在变量,通过具体指标测评抽象因子的统计分析方法。 因子分析的特点 因子变量的数量远少于原有的指标变量的数量,对因子变量的分析能够减少分析中的计算工作量。 因子变量不是对原有变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 因子变量之间不存在线性相关关系,对变量的分析比较方便。 因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 因子分析的数学模型 因子分析的出发点是用较少的相互独立的因子变量来代替原来变量的大部分信息,可以通过下面的数学模型来表示: 因子分析中的几个概念 因子载荷:在各个因子变量不相关情况下,因子载荷 aij 就是第 i 个原有变量和第 j 个因子变量的相关系数,即 xi 在第 j 个公共因子变量上的相对重要性。因此,aij 绝对值越大,则公共因子 Fj 和原有变量 xi 关系越强。 变量共同度:也称公共方差,反映全部公共因子变量对原有变量 xi 的总方差解释说明的比例。原有变量 xi 的共同度是因子载荷矩阵A中第i行元素第平方和,即: 公共因子Fj的方差贡献:为因子载荷矩阵A中第j列各元素的平方和,即: 因子分析的个基本步骤 确定待分析的原有若干变量是否适合于因子分析 构造因子变量 利用旋转使得因子变量更具有可解释性 计算因子变量的得分 确定待分析的原有若干变量是否适合于因子分析 因子分析的潜在要求是原有变量之间要具有比较强的相关性。如果原有变量之间不存在较强的相关关系,那么就无法从中综合出能反映某些变量共同特性的少数公共因子变量来。 对原有变量作相关分析的方法是计算变量之间的相关系数矩阵。如果相关系数矩阵在进行统计检验中,大部分相关系数都小于0.3且未通过统计检验,那么这些变量就不适合进行因子分析。 SPSS在因子分析过程中提供了如下几种检验方法来判断变量是否适作因子分析。 1、巴特利特球形检验(Bartlett Test of Sphericity) 巴特利特球形检验是以变量的相关系数矩阵为出发点的。 零假设相关系数矩阵是一个单位阵。 巴特利特球形检验的统计量是根据相关系数矩阵的行列式得到的。如果该值较大,且其对应的相伴概率值小于用户心中的显著性水平,那么应该拒绝零假设,认为相关系数据不可能是单位阵,也即原始变量之间存在相关性,适合作因子分析;相反,不宜于作因子分析。 3.KMO(Kaiser-Meyer-Olkin)检验 KMO统计量用于比较变量间简单相关和偏相关系数,计算公式如下: Kaiser给出了一个KMO的标准: 0.9KMO:非常适合; 0.8KMO0.9:适合; 0.7KMO0.8:一般; 0.6KMO0.7:不太适合; KMO0.5:极不适合。 构造因子变量 主成分分析的步骤 数据的标准化处理 因子变量的命名解释 经过主成分分析得到的u1,u2,…,um,是对原变量的综合,原变量都是有物理含义的变量。对它们进行线性变换后,得

文档评论(0)

smashing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档