- 1、本文档共94页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
第11章主成分分析11.1概述11.2主成分分析模型11.3主成分分析的一般步骤11.4主成分分析的应用11.5SPSS操作实例1
2引入案例——男子十项全能男子十项全能在1912年第5届瑞典斯德哥尔摩奥运会被列为正式比赛项目,是田径运动中全能运动项目的一种。男子十项全能比赛是由100米跑、跳远、铅球、跳高、400米跑、110米跨栏、铁饼、撑竿跳高、标枪、1500米跑10个项目组成的综合性男子比赛项目。十项全能选手的得分基于他们在每一项比赛中的表现,最后总成绩最高的人获胜。因此运动员只有每项比赛都有上佳表现而不是偏重一项才能最终获得冠军。为了分析十项全能主要考察哪些方面的能力,以便有针对性地进行训练,研究者收集了134个顶级运动员的十项全能成绩单,部分数据见图11-1。
3引入案例——男子十项全能
4引入案例——男子十项全能在此过程中,研究者利用数个指标便代替了十余个指标,极大简化了问题,而代价仅为丢失了小部分可接受的准确度,这就是本章将要介绍的主成分分析方法,即在保证数据丢失最少的情况下将互相关联的多变量的数据进行综合简化处理,也可以理解为对高维空间进行了降维处理。进一步介绍及讨论对基于相关系数矩阵或协方差矩阵做主成分分析、保留主成分的个数是多少以及主成分中蕴含的经济学意义等问题。本例的问题将在11.5节SPSS操作实例中得到解决。
第1节概述11.1.1基本思想11.1.2数据适用范围5
6本案例中要对此复杂的问题进行分析需要研究的要素多达十余个,分析起来十分困难。但通过观察可以发现这些要素之间有相互关联的成分,比如,对于100米跑与400米跑应该保持正相关关系,而铁饼和铅球成绩也具有密切关系。那么,考虑实际问题时是否可以像引入案例一样,在尽可能保全原信息的基础上分析其中某几个具有代表性的要素代替分析所有要素呢?此时需要使用主成分分析的方法。定义11.1主成分分析(principalcomponentsanalysis):是通过线性组合把各变量之间相互关联的复杂关系简化为少数几个主成分的一种方法,也称为主轴分析、主变量分析。
11.1.1基本思想7主成分分析是一种古老的多元统计方法,它的起源最早可以追溯到1846年布雷卡斯提出的旋转多元正态椭圆球到“坐标轴”上而使得新变量之间可以相互独立。1901年皮尔逊利用高维数学的矩阵工具发明了主成分分析方法,用于分析数据及建立数理模型。到1933年,霍特林对主成分分析方法进行演进并命名,他所推导出的数学模型标志着主成分分析方法的成熟。主成分分析方法发展至今已经被广泛应用于对经济学、科学、医学、生物学进行分析以及图像处理、模式识别等多方面。
11.1.1基本思想8主成分分析是把各变量之间互相关联的复杂关系进行简化分析的方法。在社会经济的研究中,为了全面系统地分析和研究问题,必须考虑许多经济指标,这些指标能从不同的侧面反映我们所研究的对象的特征,但在某种程度上存在信息的重叠,具有一定的相关性。在用统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性。人们希望在进行定量分析的过程中涉及的变量较少、得到的信息量较多。主成分分析正是适应这一要求产生的解决这类问题的理想工具。
11.1.1基本思想9主成分分析试图在力保数据信息丢失最少的原则下,对这种多变量的截面数据表进行最佳综合简化,也就是说,对高维变量空间进行降维处理。很显然,辨识系统在一个低维空间要比在一个高维空间容易得多。在力求数据信息丢失最少的原则下,对高维的变量空间降维,即研究指标体系的少数几个线性组合,并且这几个线性组合所构成的综合指标将尽可能多地保留原来指标变异方面的信息。这些综合指标就称为主成分。
11.1.1基本思想10因此,主成分分析所要讨论的问题是:①基于相关系数矩阵还是基于协方差矩阵做主成分分析;②选择几个主成分;③如何解释主成分所包含的经济意义。当主成分分析中所选择的经济变量具有不同的量纲,变量水平差异很大时,应该选择基于相关系数矩阵的主成分分析。基于相关系数矩阵和基于协方差矩阵的主成分分析的具体步骤见11.2.3节。主成分分析的目的是简化变量,一般情况下主成分的个数应该小于原始变量的个数。关于保留几个主成分,应该权衡主成分个数和保留的信息。主成分的经济意义由各线性组合中权重较大的几个指标来确定。
11.1.2数据适用范围11主成分分析更多的是一种达到目的的方法,而非目的本身。这是因为主成分分析频繁地用作许多大型调研的中间步骤,也是第12章因子分析模型中协方差矩阵的其中一个“分解因子”方法。主成分分析方法是利用线性组合提取多变量信息的方式解决变量复杂、变量间相互影响的问题,研究定量数据型的自变量对定量数据型的因变量的影响。主成分分析主要通过寻找数据矩阵的特征值和特征
您可能关注的文档
最近下载
- 四川省达州市2024年中考理综物理试题(含答案).docx VIP
- CS8683_ch_v13926596180单声道D类音频功放芯片.pdf VIP
- (完整版)朱子家训教案.pdf
- 高考作文备考素材集锦:“光明观察”2015版10月号第10辑.doc VIP
- Walkera华科尔无人机地面站控制软件GCS必威体育精装版版本V1.0.3发布.apk.pdf
- 水果网店策划与运营.doc VIP
- ”月伴湾”月子中心创业计划书(20页).doc
- 12J926 无障碍设计参考图集.docx VIP
- 成都市国有企业招标采购管理办法.docx VIP
- 2024年10月 高等教育自学考试 真题 C++程序设计 04737.pdf VIP
文档评论(0)