网站大量收购闲置独家精品文档,联系QQ:2885784924

基于主成分分析与聚类分析在我国31个省域地区统筹可持续发展中的应用.docx

基于主成分分析与聚类分析在我国31个省域地区统筹可持续发展中的应用.docx

  1. 1、本文档共22页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

-1-

基于主成分分析与聚类分析在我国31个省域地区统

筹可持续发展中的应用

韩洋1,付兴龙2

1辽宁工程技术大学理学院,辽宁阜新(123000)

2辽宁工程技术大学机械工程学院,辽宁阜新(123000)

摘要:党的十六届三中全会《决定》提出的统筹可持续发展的新要求,明确提出了五个统筹,是新一届党中央领导集体对发展内涵、发展要义、发展本质的深化和创新,是我国推进经济社会发展的重要目标,也是我国经济社会发展的重要保障。本文利用了2008年我国31个省域地区的12项指标,运用主成分分析与聚类分析方法,借助Matlab软件,对其进行了统筹可持续发展水平的分类,对结果进行分析,提出现阶段的发展战略,提高我国的可持续发展水平,对现实具有重要的指导意义。

关键词:统筹可持续发展;主成分分析;系统聚类;Matlab

1引言

党的十六届三中全会提出了“统筹城乡发展、统筹区域发展、统筹经济社会发展、统筹人与自然和谐发展、统筹国内发展和对外开放”的新要求,蕴含了全面发展、协调发展、均衡发展、可持续发展和人的全面发展的科学发展观。对此,我们要深刻理解和准确把握,这对于我国深化改革、发展、稳定有着重大的意义。

统筹城乡发展的实质是促进城乡二元经济结构的转变;统筹区域发展的实质是实现地区共同发展;统筹经济社会发展的实质是实现社会全面进步,增进全体人民的福利;统筹人与自然和谐发展的实质是人口适度增长、资源的永续利用和保持良好的生态环境;统筹国内发展和对外开放要求的实质是更好的利用国内外两种资源、两个市场,实现中国经济的振兴。据此,我们有针对性的选取了2008年全国31个省域地区的12个指标,运用主成分分析与聚类分析对其发展水平进行分类,并提出现阶段的发展战略。

2主成分分析

主成分分析也称主分量分析,旨在利用降维的思想,是把多指标转化为少数几个综合指标的的一种多元统计分析方法。在用统计分析方法研究多变量的课题时,变量个数太多会增加课题的复杂性,因此,人们自然希望用较少的综合变量来代替。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。主成分分析是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,而且这些新变量在反映课题的信息方面尽可能保持原有的信息。

2.1基本思想

主成分分析是设法将原来众多具有一定相关性的(比如p个)指标,重新组合成一组新的互相无关的综合指标来代替原来的指标。通常数学上的处理就是将原来p个指标作线性组合,作为新的综合指标。最经典的做法就是用F1(选取的第一个线性组合,即第一个综合指标)的方差来表达,即Var(F1)越大,表示F1包含的信息越多。因此在所有的线性组合中选取的F1应该是方差最大的,故称F1为第一主成分。如果第一主成分不足以代表

-2-

原来p个指标的信息,再考虑选取F2即选第二个线性组合,为了有效地反映原来信息,F1已有的信息就不需要再出现再F2中,用数学语言表达就是要求Cov(F1,F2)=0,则称F2为第二主成分,依此类推可以构造出第三、第四,??,第p个主成分。

2.2模型的建立及求解

(1)主成分的定义[1]

设X=(X1,X2,…,Xp)T

是p维随机向量,均值E(X)=μ,协方差阵D(X)=Σ。其

线性变换:

TVar(Zi)=aiΣai,(i=1,2,…,p)Cov(Zi,Zj)=aiTΣaj,(i,j=1,…,p)

T

(2-1)

(2-2)

称Zi=aiTX为X的第i主成分(i=1,2,…,p),如果:

①aiTai=1(i=1,2,…,p);

②当i1时,aiTΣaj=0(j=1,2,…,i?1);

(2)主成分分析的计算步骤

①计算相关系数矩阵

②计算特征值与特征向量

③计算主成分贡献率及累计贡献率

④主成分个数的确定

关于主成分的个数m如何确定,通常的做法是按累计贡献率达到一定程度(如70%或80%以上)来确定m。

3聚类分析

3.1聚类分析的概念

聚类分析指将物理或抽象对象的集合分组成为由类似的对象组成的多个类的分析过程。聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。

聚类分析的目的是把分类对象按照一定的规则分成若干类,这些类不是事先给定的,而是根据数据的特征

文档评论(0)

152****1430 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档