网站大量收购闲置独家精品文档,联系QQ:2885784924

几种分析法的优缺点.pdfVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

几种分析法的优缺点--第1页

几种分析法的优缺点

主成分分析就是将多项指标转化为少数几项综合指标,用综合指标

来解释

多变量的方差-协方差结构。综合指标即为主成分。所得出的少数

几个主成分,要尽可能多地保留原始变量的信息,且彼此不相关。

因子分析是研究如何以最少的信息丢失,将众多原始变量浓缩成

少数几个因子变量,以及如何使因子变量具有较强的可解释性的一种

多元统计分析方法。

聚类分析是依据实验数据本身所具有的定性或定量的特征来对大

量的数据迚行分组归类以了解数据集的内在结构,并且对每一个数据

集迚行描述的过程。其主要依据是聚到同一个数据集中的样本应该彼

此相似,而属于不同组的样本应该足够不相似。

三种分析方法既有区别也有联系,本文力图将三者的异同迚行比

较,并举例说明三者在实际应用中的联系,以期为更好地利用这些高级

统计方法为

研究所用有所裨益。

二、基本思想的异同

(一)共同点

主成分分析法和因子分析法都是用少数的几个变量(因子)来综合

反映原始变量(因子)的主要信息,变量虽然较原始变量少,但所包含

的信息量却占原始信息的85%以上,所以即使用少数的几个新变量,

可信度也很高,也可以有效地解释问题。并且新的变量彼此间互不相

关,消除了多重共线性。这两种分析法得出的新变量,并不是原始变

量筛选后剩余的变量。在主成分分析中,最终确定的新变量是原始变

量的线性组合,如原始变量为x1,x2,...,x3,经过坐标变换,将

原有的p个相关变量xi作线性变换,每个主成分都是由原有p个变量

线性组合得到。在诸多主成分Zi中,Z1在方差中占的比重最大,说明

它综合原有变量的能力最强,越往后主成分在方差中的比重也小,综

合原信息的能力越弱。因子分析是要利用少数几个公共因子去解释较

几种分析法的优缺点--第1页

几种分析法的优缺点--第2页

多个要观测变量中存在的复杂关系,它不是对原始变量的重新组合,

而是对原始变量迚行分解,分解为公共因子与特殊因子两部分。公共

因子是由所有变量共同具有的少数几个因子;特殊因子是每个原始变

量独自具有的因子。对新产生的主成分变量及因子变量计算其得分,

就可以将主成分得分或因子得分代替原始变量迚行迚一步的分析,

因为主成分变量及因子变量比原始变量少了许多,所以起到了降维的

作用,为我们处理数据降低了难度。

聚类分析的基本思想是:采用多变量的统计值,定量地确定相互之

间的亲疏关系,考虑对象多因素的联系和主导作用,按它们亲疏差异

程度,归入不同的分类中一元,使分类更具客观实际并能反映事物的

内在必然联系。也就是说,聚类分析是把研究对象视作多维空间中的

许多点,并合理地分成若干类,因此它是一种根据变量域之间的相似

性而逐步归群成类的方法,它能客观地反映这些变量或区域之间的内

在组合关系[3]。

,分析的结果为群集。对向量聚类后,我们对数据的处理难度也

自然降低,所以从某种意义上说,聚类分析也起到了降维的作用。

(二)不同之处

主成分分析是研究如何通过少数几个主成分来解释多变量的方差

一协方差结构的分析方法,也就是求出少数几个主成分(变量),使它

们尽可能多地保留原始变量的信息,且彼此不相关。它是一种数学变

换方法,即把给定的一组变量通过线性变换,转换为一组不相关的变

量(两两相关系数为0,或样本向量彼此相互垂直的随

文档评论(0)

188****9823 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档