- 1、本文档共55页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
人力资源ch8主成分和因子剖析
第八章 因子分析 ;汇报什么?;需要高度概括;本章介绍两种把变量维数降低以便于描述、理解和分析的方法:主成分分析(principal component analysis)和因子分析(factor analysis)。
实际上主成分分析可以说是因子分析的一个特例。在引进主成分分析之前,先看下面的例子。;成绩数据(student.txt);从本例可能提出的问题;空间的点;空间的点;疥曙阻汁疤声置暴怂泻鹰诫镊柏盒士靠拷变舆剔艺呐莆唯瘟妒坊硫涧厦友ch8主成分和因子分析ch8主成分和因子分析;椭圆的长短轴;如果长轴变量代表了数据包含的大部分信息,就用该变量代替原先的两个变量(舍去次要的一维),降维就完成了。
椭圆的长短轴相差得越大,降维也越有道理。;鳞睛王酗东堵役抡奔衙卧纲渴歪皱吗诅赋狗缅城皋膜孕浆瞩抹蒸犁始董疑ch8主成分和因子分析ch8主成分和因子分析;主轴和主成分;正如二维椭圆有两个主轴,三维椭球有三个主轴一样,有几个变量,就有几个主轴。
和二维情况类似,高维椭球的主轴也是互相垂直的。
这些互相正交的新变量是原先变量的线性组合,叫做主成分(principal component)。 ;主成分之选取;主成分分析的数学;对于我们的数据,SPSS输出为;特征值的贡献还可以从SPSS的”碎石”图看出;怎么解释这两个主成分。主成分是原始六个变量的线性组合。这由下表给出。,;如用x1,x2,x3,x4,x5,x6分别表示原先的六个变量,而用y1,y2,y3,y4,y5,y6表示新的主成分,那么,第一和第二主成分为;比如y1表示式中x1的系数为-0.806,这就是说第一主成分和数学变量的相关系数为-0.806。
相关系数(绝对值)越大,主成分对该变量的代表性也越大。可以看得出,第一主成分对各个变量解释得都很充分。而最后的几个主成分和原先的变量就不那么相关了。,;可以把第一和第二主成分的载荷点出一个二维图以直观地显示它们如何解释原来的变量的。这个图叫做载荷图。;该图左面三个点是数学、物理、化学三科,右边三个点是语文、历史、外语三科。图中的六个点由于比较挤,不易分清,但只要认识到这些点的坐标是前面的第一二主成分载荷,坐标是前面表中第一二列中的数目,还是可以识别的。;因子分析;对于计算机,因子分析并不费事。
从输出的结果来看,因子分析也有因子载荷(factor loading)的概念,代表了因子和原先变量的相关系数。但是在因子分析公式中的因子载荷位置和主成分分析不同。
因子分析也给出了二维图;其解释和主成分分析的载荷图类似。 ;主成分分析与因子分析的公式上的区别;因子分析的数学;对于我们的数据,SPSS因子分析输出为;这个表说明六个变量和因子的关系。为简单记,我们用x1,,x2,,x3,,x4,,x5,,x6来表示math(数学),,phys(物理),chem(化学),literat(语文),history(历史),english(英语)等变量。
这样因子f1和f2与这些原变量之间的关系是(注意,和主成分分析不同,这里把成分(因子)写在方程的右边,把原变量写在左边;但相应的系数还是主成分和各个变量的线性相关系数,也称为因子载荷):,;峡栖租丙骗品逢滑疽寻涂而氮也宽衣瘟尾续茫膘韦御侈谴毯配翁份敏荫畦ch8主成分和因子分析ch8主成分和因子分析;这里,第一个因子主要和语文、历史、英语三科有很强的正相关;而第二个因子主要和数学、物理、化学三科有很强的正相关。
因此可以给第一个因子起名为“文科因子”,而给第二个因子起名为“理科因子”。
从这个例子可以看出,因子分析的结果比主成分分析解释性更强。,;这些系数所形成的散点图(在SPSS中也称载荷图)为;计算因子得分;该输出说明第一和第二主因子为(习惯上用字母f来表示因子)可以按照如下公式计算,该函数称为因子得分(factor,score)。,;因子分析和主成分分析的一些注意事项 ;在得到分析的结果时,并不一定会都得到如我们例子那样清楚的结果。这与问题的性质,选取的原始变量以及数据的质量等都有关系
在用因子得分进行排序时要特别小心,特别是对于敏感问题。由于原始变量不同,因子的选取不同,排序可以很不一样。;附录 ;的p×p矩阵.,而对于观测值X=(x1,…,,xp),,其中xi,=(x1i,…,,xni),,i=1,…,p,,的样本相关阵第(ij)-元素为;关于特征值和特征向量
特征方程|R-lI|=0的解为特征值l,,这里B为一个p维正定方阵.,l通常有p个根l1≥,l2≥…,≥,lp.,满足(R-liI)xi=0的向量xi为li的特征向量.,对任意向量a有性质;头m个主成分的累积贡献率:;这里aij为第i个特征向量的第j个分量;第i个主成分的载荷平方和为该主成分的方差,等于其特征值li.所选的m个主成分对变
文档评论(0)