- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
多元数据处理——-因子分析法.doc
多元数据处理
---因子分析方法
多元数据处理主要包括多元随机变量,协方差分析,趋势面分析,聚类分析,判别分析,主成分分析,因子分析,典型相关分析,回归分析以及各个分析方法的相互结合等等。本文主要针对其中的因子分析方法展开了论述,并举了一个因子分析法在我国房地产市场绩效评价中的应用实例。
第一章 因子分析方法概述
1.1因子分析的涵义
为了更全面和准确的测量和评估对象的特征,在实际的应用中,我们往往尽可能多的选用特征指标进行系统评估,选取的指标越多,就越能全面、客观的反映评价对象的特征。选取众多指标的同时也带来了统计分析的困难:一、不同的指标,不同重要程度需要赋予不同的权重,而靠主观的评价避免不了一些失误与错误。二、收集到的指标之间可能存在较大的相关性,大量收集指标带来了人力、物力和财力的浪费。而因子分析方法则较好的解决了上述问题。
因子分析[1]是一种多元统计方法,该方法起源于20世纪初 Karl Pearson 和 Charles Spearman 等人关于心理测试的统计分析,它的核心是用最少的相互独立的因子反映原有变量的绝大部分信息。[2]通过分析事物内部的因果关系来找出其主要矛盾,找出事物内在的基本规律。
因子分析的基本思想是通过变量的相关系数矩阵内部结构的研究,找出能控制所有变量的少数几个随机变量去描述多个变量之间的相关关系,但是,这少数几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,使得同组内的变量之间相关性较高,使不同组内的变量相关性较低[3]。对于所研究的问题就可试图用最少个数的所谓因子的线性函数与特殊因子之和来描述原来观测的每一变量[4]。因子变量的特点:第一,因子变量的数量远小于原指标的数量,对因子变量的分析能够减少分析的工作量;第二,因子变量不是原有变量的简单取舍,而是对原有变量的重新组构,他们能够反映原有变量的绝大部分信息,不会产生丢失;第三,因子变量之间线性相关性较低;第四,因子变量具有命名解释性[5]。因子分析可以消除指标间的信息重叠,抽象出事物的本质属性,不仅可以综合评价,还可以综合分析对其产生影响的主要因素。
1.2因子分析统计模型
设p个可以观测的指标为,m个不可观测的因子为 ,则因子分析模型描述如下:[6] [7]
其中:mp
是不可测的向量,我们把F称为X的公共因子,其均值向量 E(F)=0,协方差矩阵Cov(F)=1,即向量的各分量是相互独立的是特殊因子,与F相互独立,且E(e)=0。
,为因子载荷,数学上可以证明,因子载荷就是第 i 指标与第 j因子的相关系数,载荷越大,说明第j个指标与第i个因子的关系越密切;反之载荷越小,关系越疏远[8]。
1.3因子分析步骤
(1)原始数据的标准化
原始数据的标准化包括指标正向化合和无量纲化处理两方面。在多指标的评价中,有些指标数值越大,评价越好;有些指标数值越小,评价越好,这种指标称为逆向指标;还有些指标数值越靠近某个具体数值越好,这种指标称为适度指标。根据不同类型的指标需要将逆向指标、适度指标转化为正向指标,此过程称为指标的正向化。指标正向化过程既可以在无量纲化前处理也可以在无量纲化时处理。逆向指标可以选用公式。其中,、分别为指标的最大与最小值。适度指标方面,叶宗裕[9]认为正向化可以采用指标值减去适度值的绝对值的相反数。公式为。其中为正向后数据,为原始数据,M为适度值。指标的无量纲化则是通过标准化处理,将不同的指标通过数学变换转化为统一的相对值,消除各个指标不同量纲的影响。常用的无量纲化包括:标准化法、均值法和极差正规化法。本文采用最常见的标准化法进行无量纲化处理,公式处理如下:(是X的期望值,是 X 的标准差)
(2)计算相关矩阵 R 的特征值和特征向量
根据特征方程,计算相关相关矩阵的特征值及对应的特征向量A,的大小描述了各个因子在解释对象所起的作用的大小。
计算因子贡献率及累积贡献率,确定公共因子个数
因子贡献率表示每个因子的变异程度占所有因子变异程度的比率,公式为:
,表示方差贡献率。当累积贡献率达到85%以上或者特征根不小于1,即确定了公因子的个数。
(4)求解初始因子载荷矩阵
X=AF,因子载荷矩阵A并不唯一,软件则是运用不同的参数估计方法求出相应的估计矩阵,参数估计方法主要包括:最小平方法、极大似然法、主成分法、主因子法、多元回归法。
(5)因子载荷矩阵的旋转
若因子载荷较为平均,初始的因子载荷矩阵描述的经济含义不太明显,难以判断与各个因子的关系时,就需要进行因子旋转。通过因子旋转,使使旋转后公共因子的贡献更加分散,并对主因子进行命名,确定经济含义[10]。因子旋转主要有正交旋转
文档评论(0)