网站大量收购闲置独家精品文档,联系QQ:2885784924

主成分分析与因子分析的比较研究与实例分析课案.doc

主成分分析与因子分析的比较研究与实例分析课案.doc

  1. 1、本文档共9页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析与因子分析的比较研究与实例分析课案

主成分分析与因子分析的比较研究与实例分析 摘 要: 比较研究了主成分分析和因子分析理论及其联系与区别,实例分析了两种方法在实际应用中的差异性,得出结论:应用中应正确选择多元统计分析方法,并且联系实际问题和专业具体分析。 关键词: 主成分分析;因子分析;实例 Comparative research and case analysis of principal component analysis and factor analysis Abstract: the theory of principal component analysis and factor analysis as well as their relations and distinctions are compared and studied, the differences of two methods in practical application have been analyzed, concluded that the method should be choosed rightly and contacted with the actual problem and professional to do specific analysis. Key words: principal component analysis;factor analysis;actual example 0 引言 研究实际问题时常涉及多个指标变量,且彼此间存在一定的相关性,使得数据存在着一定的信息重叠。 单独研究单个变量会损失大量信息,选取几个综合变量又能充分反映原来变量的信息,且彼此之间不相关对实际研究带来了便利。主成分分析与因子分析是将多个指标化为少数几个综合指标实现降维的统计方法。近年来这两种方法应用范围越来越多广泛,既存在着去多共同之处,也有其各自的差异性[1]。 1 主成分分析与因子分析法理论 1.1 主成分分析法 设研究对象有P 个指标变量,分别为X1,X2,...,Xp表示,从而有均值为μ,协方差矩阵为Σ的p 维随机向量X=(X1,X2,...,Xp)。通过主成分分析对X进行线性变换得到新的变量Y 。即: 线性变换后: 为了变量Y能够充分反映原来X变量的信息,Yi 的方差应尽可能大且Yi 之间不相关,于是有: ,(i=1,2,...,p)。主成分Yi 可由协方差矩阵或相关矩阵求出。一般选取累计贡献率达到85%以上的前几个主成分作为研究指标。 1.2 因子分析法 因子分析有R 型和Q 型因子分析,实例中应用了R 型因子分析。式中X 为原始变量及标准化后的变量,标准化后的公共因子为F1,F2,…,Fm(mp)。因子模型为: ,(i=1,2,...,p;mp;为特殊因子)。cov (Xi,Fj)=aij。共同度 ,(i=1,2,...,p),是Xi 对公共因子的依赖程度。公共因子Fj 对X 所提供的方差贡献 ,(i=1,2,...,m),通过该值的大小可以提炼出最有影响的公共因子。 2 主成分分析与因子分析的联系 因子分析是主成分分析的推广和发展,两种方法都是从变量的相关系数矩阵入手, 在损失较少信息的前提下, 把多个具有相关性变量综合成少数几个综合变量来研究总体信息,且这少数几个综合变量所代表的信息不能重叠,即新变量无相关性,是多元分析中实现降维的重要方法[2~4]。 3 主成分分析与因子分析的区别 3.1 理论思想不同 主成分分析是设法将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标。 因子分析是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量(不可观测,通常称为因子[5])去描述多个变量之间的相关关系。然后根据相关性大小将变量分组,使得同组内的变量之间相关性较高,但不同组内相关性较低。 3.2 数学模型不同 主成分分析的数学模型实质上是一种变换, 通过变量变换把注意力集中在具有较大变差的那些主成分上, 而舍弃那些变差小的主成分; 因子分析是把注意力集中在少数不可观测的潜在变量上,而舍弃特殊因子。 主成分分析是将主成分表示为原观测变量的线性组合。线性变换不改变原始数据的结构[6];因子分析是描述X协方差阵结构的一种模型,对原观测变量分解成公共因子和特殊因子两部分。 主成分的各系数aij是唯一确定的、正交的,不可以对系数矩阵进行任何的旋转, 且系数大小并不代表原变量与主成分的相关程度[7];因子模型的系数矩阵是不唯一的,且该矩阵表明了原变量和公共因子的相关程度。 3.3 计算方法不同 主成分分析一般依据第一主成分的得分排名,若第一主成分不能完全代替原始变量,

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档