- 1、本文档共30页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 1 - * 1 - * 第九章 SPSS的因子分析和对应分析 因子分析的基本思想 为尽可能完整描述一个事物,往往要收集它的许多指标(如企业评价、投资环境评价) 多指标产生的问题: 计算处理麻烦 信息重叠 从众多的指标中剔除一些指标又会造成信息丢失 因子分析的基本思想 因子分析的基本出发点 将原始指标综合成较少的指标,这些指标能够反映原始指标的绝大部分信息(方差) 这些综合指标之间没有相关性 因子变量的特点 这些综合指标称为因子变量,是原变量的重新构造 个数远远少于原变量个数,但可反映原变量的绝大部分方差 不相关性 可命名解释性 因子分析的核心问题 如何构造因子变量 如何使因子变量具有命名解释性 因子分析的基本步骤 确认待分析的原始变量是否适合作因子分析 构造因子变量 利用旋转方法使因子变量具有可解释性 计算每个样本的因子变量得分 因子分析的数学模型 数学模型(xi为标准化的原始变量;Fi为因子变量;mp) x1=a11F1+a12F2+…+a1mFm+a1ε1 x2=a21F1+a22F2+…+a2mFm+a2ε2 …… xp=ap1F1+ap2F2+…+apmFm+apεp 也可以矩阵的形式表示为: X=AF+aε F:因子变量 A:因子载荷阵 aij: 因子载荷 ε: 特殊因子 因子分析的基本概念 因子载荷 在因子变量不相关的条件下,aij就是第i个原始变量与第j个因子变量的相关系数。aij绝对值越大,则Xi与Fi的关系越强。 ——反映因子和各变量间的密切程度 因子分析的基本概念 变量的共同度(Communality)(公因子方差比)——衡量因子分析效果 Xi的变量共同度为因子载荷矩阵A中第i行元素的平方和 在原始变量标准化的条件下:h2i+ε2i=1 可见:Xi的共同度反应了全部因子变量 对Xi总方差的解释能力 ——表示提取公因子后,各变量中信息分别被提取出的比例,或者是原变量的信息量(方差)中由公因子决定的比例(类似于决定系数) 因子分析的基本概念 因子变量Fj的方差贡献——衡量因子的重要程度 因子变量Fj的方差贡献为因子载荷矩阵A中第j列各元素的平方和 可见:因子变量Fj的方差贡献体现了同一因子Fj对原始所有变量总方差的解释能力。Sj/p表示了第j个因子解释原所有变量总方差的比例 原有变量是否适合作因子分析 计算原有变量的相关系数矩阵 一般小于0.3且未通过统计检验就不适合作因子分析 巴特利特球度检验(Bartlett test of sphericity) H0:相关系数矩阵与单位阵无显著差异 以变量的相关系数矩阵出发计算巴特利特统计量。统计量较大且概率小于显著性水平,应拒绝H0 ,表示适合作因子分析 原有变量是否适合作因子分析 反映象相关矩阵(Anti-image correlation matrix)检验 以变量的偏相关系数矩阵为出发点,将偏相关系数矩阵的每个元素取反,得到反映象相关阵。 如果反映象相关矩阵中的很多元素的绝对值比较大,则说明这些变量可能不适合作因子分析 KMO检验 KMO=所有变量间相关系数平方和/(所有变量间相关系数平方和+所有变量间偏相关系数平方和) 一般0.7以上就可以作因子分析 确定因子变量个数--主成分分析 主成分分析法:利用坐标变换 y1=u11x1+u21x2+…+up1xp y2=u12x1+u22x2+…+up2xp …… yP=u1Px1+u2Px2+…+uppxp 该方程组要求: u1k2+ u2k2+ u3k2+…+ upk2=1 (k=1,2,3,…p) 将原有的P个相关变量Xi作 线性变换后转成另一组不 相关的变量Yi x2 x1 y1 y2 X1与x2相关,y1与y2不相关 确定因子变量个数--主成分分析 系数uij依照两个原则来确定 yi与yj (i≠j,i,j=1,2,3,…p)互不相关; y1是x1,x2,x3,…,xp的一切线性组合(系数满足上述方程组)中方差最大的;y2是与y1不相关的x1,x2,x3,…,xp的一切线性组合中方差次大的;yP是与y1, y2, y3,…yp都不相关的x1,x2,x3,…,xp的一切线性组合中方差最小的; 确定因子变量个数--主成分分析 主成分分析的基本步骤: 将原始数据标准化 计算变量间简单相关系数矩阵R 求R的特征值λ1≥λ2≥λ3≥…λp≥0及对应的单位特征向量μ1, μ2, μ3,…μp 得到:yi=u1ix1+u2ix2+…+upixp 特征根(Eigenvalue)可以看成主成分影响力度的指标,代表引入该因子(主成分)后可以解释平均多少原始变量的信息 确定因子变量个数--主成分分析 确定m个主成份 根据特征值λi确定:取特征值大于1的主成分; 二是,根据累计贡献率,一般累计贡
文档评论(0)