ch04第四章 主成分分析.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
ch04第四章 主成分分析

第四章 主成分分析 主成分概述 主成分的数学原理 主成分分析在综合评价中的应用 主成分回归分析 推荐阅读 引言 区域经济分析中,常常需要用多个指标对多个区域或城市进行综合评价。其共同特点是将多个相关指标合成一个综合指标,反映各地区的综合水平。 其步骤体现:1.选取指标; 2.指标无量纲化处理 3.对指标简化或归类 4.确定权重 5.计算综合评价值。 方法有层次分析法AHP,专家意见法,主成分分析或因子分析法等。 4.1 主成分概述 主成分概念首先由 Karl Parson在1901年引进,当时只对非随机变量来讨论的。1933年Hotelling将这个概念推广到随机变量。 在多数实际问题中,不同指标之间是有一定相关性。由于指标较多及指标间有一定的相关性,势必增加分析问题的复杂性。 主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息。 4.1.1 主成分的基本原理 主成分分析是考察多个数值变量间相关性的一种多元统计方法,它是研究如何通过少数几个主成分来解释多变量的方差—协方差结构。 导出几个主成分,使它们尽可能多地保留原始变量的信息,且彼此间不相关。 4.1.2 主成分分析的基本思想 将原来众多具有一定相关性的指标重新组合成一组新的相互无关的综合指标来代替原来指标。 以两个指标为例,信息总量以总方差表示: 其中y1、y2分别都是x1、x2的线性组合,并且信息尽可能地集中在y1上。在以后的分析中舍去y2,只用主成分y1来分析问题,起到了降维的作用。 主成分分析就是通过适当的变量替换,使新变量成为原变量的线性组合,并寻求主成分来分析事物的一种方法。 4.1.3 几何解释 4.1.3 几何解释 旋转变换的目的是为了使得n个样本点在y1轴方向上的离散程度最大,即y1的方差最大,变量y1代表了原始数据的绝大部分信息,在研究某经济问题时,即使不考虑变量y2也损失不多的信息。 Y1与y2除起了浓缩作用外,还具有不相关性。 Y1称为第一主成分,y2称为第二主成分。 4.2 主成分分析的数学原理 对原有变量作线性变换, 要求: 4.2.1 主成分的数学性质 如果z1=u1’x满足① ② 则称z1为x的第一主成分。 若z1不足以代表原变量所包含的信息,就考虑采用z2。 Z2满足① ② ③ Z2为第二主成分 4.2.1 主成分的数学性质 从公式的计算推导可以发现,主成分方程中的系数向量U恰好是原有变量协方差矩阵的特征向量,其特征根是主成分的方差。 4.2.2 量纲对于主成分的影响 对数据进行标准化处理,以使每一个变量的均值为0,方差为1。 数据标准化后,总体的协方差矩阵与总体的相关系数相等. *4.2.3 样本主成分的计算 变量X 样本协方差为总体协方差的无偏估计 *4.2.3 样本主成分的计算 若X已标准化,则可用相关矩阵代替协方差矩阵 *4.2.3 样本主成分的计算 *4.2.3 样本主成分的计算 *4.2.3 样本主成分的计算 将R的特征根依大小顺序排列 其对应的特征向量记为U1,U2,…,Up 说明y1有最大方差,y2有次大方差… 4.2.4 样本主成分的性质 1、第K个主成分yk的系数向量是第K个特征根λk所对应的标准化特征向量。 2、第K个主成分的方差为第K个特征根λk,且任意两个主成分都是不相关的,也就是y1,y2,…,yp的样本协方差矩阵是对角矩阵 3、样本主成分的总方差等于原变量样本的总方差为p 4、第K个样本主成分与第j个变量样本之间的相关系数为: 4.3 主成分方差贡献率 1、主成分的方差贡献率: 这个值越大,表明第i主成分综合信息的能力越强。 2、主成分的累计贡献率 表明取前几个主成分基本包含了全部测量指标所具有信息的百分率。 4.3 主成分方差贡献率 主成分个数的选取: 1.累积贡献率达到85%以上 2.根据特征根的变化来确定 4.4 主成分分析的步骤及spss实现 1.将原始数据进行标准化处理 2.计算样本相关矩阵R 3.求相关矩阵R的特征值与特征向量,并计算贡献率 4.选择主成分 5.对所选主成分做经济解释 Spss实现 Spss实现: 1.analyze-description statistic-

文档评论(0)

yan698698 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档