SAS学习系列34.-因子分析.docxVIP

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
SAS学习系列34.-因子分析

34.因子分析 (一)基本原理 一、概述 因子分析,是用少数起根本作用、相互独立、易于解释通常又是不可观察的因子来概括和描述数据,表达一组相互关联的变量。通常情况下,这些相关因素并不能直观观测。 因子分析是从研究相关系数矩阵内部的依赖关系出发,把一些具有错综复杂关系的变量归结为少数几个综合因子的一种多变量统计分析方法。简言之,即用少数不可观测的隐变量来解释原始变量之间的相关性或协方差关系。 因子分析的作用是减少变量个数,根据原始变量的信息进行重组,能反映原有变量大部分的信息;原始部分变量之间多存在较显著的相关关系,重组变量(因子变量)之间相互独立;因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 主成分分析是因子分析的特例。主成份分析的目标是降维,而因子分析的目标是找出公共因素及特有因素,即公共因子与特殊因子。 因子分析模型在形式上与线性回归模型相似,但两者有着本质的区别:回归模型中的自变量是可观测到的,而因子模型中的各公因子是不可观测的隐变量,而且两个模型的参数意义也不相同。 二、原理 假设样品检测p个指标(变量)X1, …, Xp,得到观测矩阵X,这p个指标变量可能受m(mp)个共同因素f1,…fm的影响,再加上其它影响因素。表示为: 用矩阵表示为 其中,共同影响因素f1,…fm是均值为0方差为1的随机变量,称为公共因子;Ap×m称为因子载荷矩阵,aji是第j变量在第i公共因子上的负荷,即Xj在坐标轴fi上的投影;ei是变量Xi所特有的因子,均值为0方差为σi2,称为特殊因子。各特殊因子之间及特殊因子与公共因子之间都是相互独立的,即COV(ei, ej)=0, COV(e, f)=0. 因子分析就是用f1,…fm代替X1, …, Xp, 达到降维的目的。 主成份分析中,残差通常是彼此相关的。因子分析中,特殊因子起到残差的作用,但被定义为彼此不相关且和公因子也不相关。而且每个公因子假定至少对两个变量有贡献,否则它将是一个特殊因子。 在开始提取公共因子时,已假定它们彼此不相关且具有单位方差。故向量X的协方差矩阵Σ可以表为 Σ=D(X)=D(Af+e)=AAT+D 其中,D=diag(σ12, …, σp2). 若假定X已标准化,即每个Xi都均值为0方差为1. 则 记称为变量共同度,则有. hi2反映了公共因子f对Xi的影响(贡献),即Xi对共同因素f的依赖程度;σi2为剩余方差,若hi2接近1,σi2很小,则表明因子分析的效果好。 公共因子fj对Xi的影响,可由A中第j列元素来描述, 称为公共因子fj对X的贡献,是衡量公共因子重要性的尺度。 aij为第i个变量与第j个公共因子的相关系数,反映了它们的相关程度: 三、求因子载荷矩阵 若X的协方差矩阵∑和D已知,则根据∑-D=AAT求出A 其中,λ1≥λ2≥…λmλm+1=…=λp=0为∑*=∑-D的特征值,ξi为相应的特征向量。 但在实际问题中,并不知道∑和D,就需要从n个样品,p个指标的np个样本数据,估计因子载荷aij和特殊因子方差σi2. 常用的参数估计法有:主成分法、主因子解法、极大似然法。 (1)主成分法 记样本数据的协方差矩阵为,其特征值λ1≥λ2≥…≥λp≥0, 相应的特征向量为ξi. 当最后p-m个特征值较小时,对做谱分解: 先取,看是否接近对角矩阵,若是,说明只取一个公共因子就行了,所有指标主要受到这一个公共因子的影响;若否,再取,看是否接近对角矩阵……象主成分分析一样,直接取前q个特征值和特征向量,使得它们的特征值之和占全部特征值之和的85%以上即可。此时,特殊因子方差为 (2)主因子解法 主因子解法是对主成分法的修正,记样品数据的相关矩阵为R,设R= AAT + D,则R* = R–D = AAT称为约相关矩阵。若已知特殊因子方差的初始估计,则,故 计算R*的特征值λ1*≥λ2*≥…≥λp*0,相应的特征向量为ui*, 则有近似分解式:R* = AAT, 其中 令 则A和D为因子模型的一个解,称为主因子解。 在实际中特殊因子方差是未知的,以上得到的解是近似解。为了得到近似程度更好的解,常常采用迭代主因子法。即利用上面得到的 作为特殊因子方差的初始估计,重复上述步骤,直到解稳定为止。 变量共同度hi2常用的初始估计有以下三种方法: ① 取第i个变量与其他所有变量的多重相关系数的平方; ② 取第i个变量与其他变量相关系数绝对值的最大值; ③ 取1(等价于主成分解)。 (3)极大似然法 假定公共因子f和特殊因子e服从正态分布,则可得到因子载荷阵和特殊因子方差的极大似然估计。设p维观测向量X(1),...,X(n)为来自正态总体Np(μ,∑)的随机样品,则样品似然函数为μ,∑的函数L(μ,∑).

文档评论(0)

pengyou2017 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档