关于广州市居民消费结构主成分分析关于广州市居民消费结构的主成分分析.doc

关于广州市居民消费结构主成分分析关于广州市居民消费结构的主成分分析.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
关于广州市居民消费结构主成分分析关于广州市居民消费结构的主成分分析

广州市居民消费结构的主成分分析 摘 要: 简要介绍了主成分分析的基本理论和基本方法, 初步探讨了主成分分析在实际应用中需要注意的几个问题, 并结合对广州市居民消费结构的综合评价, 给予主成分一个具有实际意义的诠释。 关键词: 主成分分析; 多指标综合评价; 居民消费结构 引言 影响事物变动的因素很多, 有些是主要的, 有些是次要的。如果全都分析将会耗时又耗力。我们必须对各因素的相互关系进行综合的统计分析, 借以观察各因素变动对事物变动程度和方向的影响,根据各因素的不同作用清楚地观察事物发展规律并对事物发展作出综合评价。综合评价方法很多, 如回归分析、方差分析、聚类分析、主成分分析等。由于各因素间存在一定的相互关系, 我们可以对众多因素进行简化, 简化后的因素互不相关且能综合反映原始因素的信息。主成分分析正是处理这类问题的有效方法之一。 本文借助统计软件SPSS和EXCEL来综合分析和研究多个指标。就主成分分析的基本理论及其在实际应用中应注意的几个问题作一些初步探讨, 并结合与一个具体问题的商榷给予主成分具有实际意义的解释。 一、主成分分析的基本原理 ( 一) 主成分分析简述 主成分分析是一种降维的统计方法, 它可以用尽量少的综合指标代替众多原始数据, 并尽可能多地反映原始数据的信息。通过对样本相关阵的内部结构关系的研究, 找出影响事物变动的几个综合指标, 使综合指标为原变量的线性组合。综合指标彼此之间互不相关, 保留了原变量的主要信息, 又比原变量具有更优越的性质, 使我们在综合评价时更易抓住主要矛盾。 ( 二) 主成分分析的统计描述 设有p 个指标x 1 , x 2 , ,, xp , 反映了客观对象的各个特性。把每个对象观察到的p 个指标值作为一个样本值, 它是一个p 维向量。若观察n 个对象, 就可得n 个p 维向量, 构成一个n * p 矩阵X,该矩阵的每一行就是一个样本的观察值。 统计问题是: 已知数据矩阵X, 能否找到一个线性函数 ,它能最好地反映p 个指标x 1 , x2 、、、 xp的变化状况? 也即能否把p 个变量在n个样本上的差异用它们的一个线性函数的差异来综合表示? 如果行, 这个线性函数就是一个代表性很好的指标, 它称为这p 个变量的主成分。 ( 三) 进行主成分分析的具体方法 1、确定指标体系。在各项具体指标的设置和选择过程中, 要注意指标的全面性、代表性、可得性、简洁性和整合性。 2、建立原始信息矩阵Xn × p。即上述统计问题中的矩阵X。 3、对矩阵X 中的数据实行标准化处理, 使其具有可比性。 ( i= 1, 2, ,, n; j= 1, 2, ,, p) , 其中, 得标准化矩阵Z 4、求标准化矩阵Z 的相关矩阵R。利用标准化后的数据计算P 个指标间的相关系数 i, j= 1, 2, ,, p 得相关矩阵R: 5、求相关矩阵R 的特征值和特征向量。求解R 的p 个特征根。对每个特征根, j= 1, 2, ,, p 解方程组Rl= l 算得特征向量lj 6、给出主成分yi , i= 1, 2, ,, p的表达式。有, i= 1, 2, ,, p,且y1 , y2 , ,, yp 互不相关, 依次称为第一、第二、,、第p 主成分, yi 的方差为,i= 1, 2, ,, p。 7、确定主成分的个数k。按照≥85%,求出使累计贡献率大于等于85% 的k 值, 其中称为前k 个y1 , y2 , ,, yk的累计贡献率。由于主成分分析的核心思想是降维,故应使值尽可能小以达到明显的降维效果。 8、计算综合评价指标pc。记X= ( x1 , x2 ,,, x p ) 为指标向量, 则得前k 个主成分为: ,,…. 综合评价指标其实就是前K 个主成分的线性加权值, 按yj 的方差 占总体方差的比例求得权系数(贡献率) ,( j= 1, 2, ,, k) , 从而求得综合评价指标 9、计算评价分值并排序。标准化矩阵Z=( Z1 , Z2 , ,, Zn ) T 对应的主成分向量为U j= Zlj,j= 1, 2, ,, k。它的第i 个分量uij 是向量Zi ( i=1, 2, ,, n) 在lj 上的投影。从而评价分值为S= ( S1 , S2 , ,, Sn ) T = , 根据Si ( i= 1,2, ,, n) 值的大小可对样本进行评价排序。 二、应用主成分分析需要注意的问题 ( 一) 主成分分析的适用范围 由数理统计中的强大数定律知, 随着被评价对象的增加, 评价指标的平均水平和离散程度趋于稳定, 因而协方差矩阵也趋于稳定, 增加了评价结果的准确性, 因此主成分分析适宜于大样本的综合评价。又由于同一被评价对象在不同样本集合体中的均值和离散程度是变化的, 因而协方差矩

文档评论(0)

skewguj + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档