因子分析专题.docxVIP

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE PAGE 21 因子分析专题 §8.1 引言 因子分析是主成分分析的推广,它也是一种把多个变量化为少数几个综合变量的多元分析方法,其目的是用有限个不可观测的隐变量来解释原始变量之间的相关关系。 例8.1.1 Linden对二次大战以来奥林匹克十项全能比赛的得分做了分析研究,他收集了160组数据,这十个全能项目依次为:100米跑、跳远、铅球、跳高、400米跑、110米跨栏、铁饼、撑竿跳高、标枪、1500米跑。但是总的来说基本上可归结为他们的短跑速度、爆发性臂力、爆发性腿力和耐力这四个方面,每一个方面都称为一个因子。用分别表示十个项目的得分,它们可以表示为含有上述四个因子的线性模型: , 其中表示4个因子,称为公因子,称为第个变量在第个因子上的载荷。 是总平均,是第项得分不能被四个公因子解释的部分,称之为特殊因子。这个模型形式上与线性回归模型几乎一样,但是它们有着本质的区别:回归模型中自变量是可以被观测得到的,而上述因子模型中的是不可观测的隐变量,这使得该模型理解起来较为困难;再者,两个模型的参数意义也很不相同。 例8.1.2 为了评价高中学生将来进大学时的学习能力,抽了200名高中生进行问卷调查,共50个问题。所有这些问题可简单地归结为阅读理解、数学水平和艺术修养这三个方面。这也是一个因子分析模型,每一方面就是一个因子。 例8.1.3 公司老板对48名申请工作的人进行面试,并给出申请人在15个方面所得的分数,这15个方面是:(1)申请信的形式;(2)外貌;(3)专业能力;(4)讨人喜欢的能力;(5)自信心;(6)洞察力;(7)诚实;(8)推销能力;(9)经验;(10)驾驶汽车本领;(11)抱负;(12)理解能力;(13)潜力;(14)对工作要求强烈程度(15)适应性。这些问题可以归结为如下的几个方面:申请者外露的能力,讨人喜欢的程度,申请者的经验,专业能力。每一方面都是因子模型中的一个因子。 §8.2 因子模型 一、数学模型 设维可观测的随机向量的均值为,协方差矩阵为,因子分析的一般模型为 (8.2.1) 其中为公因子,为特殊因子,它们都是不可观测的随机变量。公因子出现在每一个原始变量的表达式中,可理解为原始变量共同具有的公共因素;每个公因子至少对两个原始变量有作用,否则它将归入特殊因子。每个特殊因子仅仅出现在与之相应的第个原始变量的表示式中,它只对这个原始变量有作用。(8.2.1)式可用矩阵表示为 (8.2.2) 式中为公因子向量,为特殊因子向量, 称为因子载荷矩阵,并假设的秩为。通常假定 (8.2.3) 同理易知,注意两个协方差矩阵阶数不一样。 由上述假定可以看出,公因子彼此不相关且具有单位方差,特殊因子彼此不相关且和公因子也不相关。 因子分析与主成分分析是多元分析中两种重要的降维方法,但两者有很大的不同。主成分分析不能作为一个模型来描述,它只能作为一般的变量变换,主成分是可观测的原始变量的线性组合;而因子分析需要构造一个因子模型,公因子一般不能表示为原始变量的线性组合。 二、因子模型的性质 1.的协方差矩阵的分解 由(8.2.2)式知 即 (8.2.4) 这就是的一个分解。如果为标准化了的随机向量,则就是相关矩阵,即有 (8.2.5) 2.模型不受单位的影响 将的单位作变化,就是作一变换,这里,, ,于是,令,,,,则有 (仍然为因子分析模型) 这个模型能满足完全类似于(8.2.3)式的假定,即 其中 即,,。 3.因子载荷是不唯一的 设为任意正交矩阵,令,,则模型(8.2.2)式能表示为 (8.2.6) 因为 所以仍满足条件(8.2.3)式。从(8.2.4)式可以看出,也可分解为 (8.2.7) 因此,因子载荷矩阵不是唯一的,在实际应用中常常利用这一点,通过因子的变换,使得新的因子有更好的实际意义。 三、因子载荷矩阵的统计意义 1.的元素——原始变量与公因子之间的协方差函数 (8.2.1)式可以表示为 , (8.2.8) 故 (8.2.9) 即是与之间的协方差函数。若为标准化了的随机向量,即,则与之间的相关系数 (8.2.10) 此时表示与的相关系数。 2.的行元素平方和——原始变量对公因子依赖的程度 对(8.2.8)式两边取方差 (8.2.11) 令,,于是 , (8.2.12) 反映了公因子对的影响,可以看成是公因子对的方差贡献,称为共性方差;而是特殊因子对的方差贡献,称为个性方差。当为标准化了的随机向量时,,此时有 , (8.2.13) 3.的列元素平方和——公因子对的贡献 由(8.2.11)式

文档评论(0)

smashing + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档