北航数理统计聚类分析大作业..doc

  1. 1、本文档共14页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
北航数理统计聚类分析大作业.

应用数理统计 地区生产总值及经济发展状况的聚类和判别分析 摘 要:本文选取了06、07年地区生产总值的各项指标数据,运用统计学方法对其经济发展状况进行了分类研究。分析结果显示,北京﹑山东﹑上海﹑广东等东部沿海地区在经济发展中处于领先地位,属于经济较发达地区;辽宁﹑湖南﹑河南等省份处于中游,属于中等发达地区;西藏﹑青海﹑宁夏等中西部省份,经济发展较为缓慢,属于欠发达地区。分析结果与我国目前地区经济发展情况基本相符。通过本次研究揭示了我国的经济优势地区和经济薄弱地区,这对国家进行统筹规划、实现共同富裕具有重要意义。 关键词:生产总值,经济发展, SPSS, 聚类分析, 判别分析 目录 1 2 1.1 源数据的提取 2 2 地区经济发展的聚类分析和判别分析 2 2.1 相关自变量的选择 2 2.2 聚类分析 2 2.3 判别分析 2 3 总结 2 1 引言 国内生产总值(Gross Domestic Product,简称GDP)是指在一定时期内(一个季度或一年),一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,常被公认为衡量国家经济状况的最佳指标。它不但可反映一个国家的经济表现,还可以反映一国的国力与财富。地地区可以较为准确反映地区经济发展状况,通过建立地区模型,对各地区经济发展状况进行分类,具有一定的准确性和合理性。 本文应用数理统计软件SPSS对各地区进行聚类和判别分析,分析和评定各地区经济发展情况,同时对各地区进行分类,确定经济优势地区和薄弱地区。1.1 源数据的提取 本文所用的数据全来自《中国统计年鉴2007》和《中国统计年鉴2008》,从中提取了有关北京市、河北省等31个省市自治区直辖市(不包括港澳地区)200 表1 06年地区生产总值各项指标数据 表2 07年地区生产总值各项指标数据 2 地区经济发展的聚类分析 地区主要包括的内容有(1)第一产业是农业包括林业、牧业、渔业等(2)第二产业是工业包括采掘业、制造业、自来水、电力、蒸汽、热水、煤气业)和建筑业;(3)第三产业是除上述各业以外的其它产业交通运输、仓储和邮政业。 相关自变量的选择 从分析地区的内容出发对地区经济发展的聚类分析地区为了便于分析,我们部分合为一类交通运输、仓储和邮政业元素作为自变量进行聚类分析和判别分析。需要聚类和判别的地区为北京、上海等31省市自治区直辖市(不包括港澳地区)。 聚类分析 首先采取系统聚类法(hierarchical cluster)对所有31个地区聚类进行分析(2007年度地区)表表示所有观测量都加入聚类判别分析。聚类进度表,表中列出了测量或类合并的详细步骤。 表4 聚类表 图1 树状谱系图 图1为分析得到的树状谱系图,图中横向聚类表示差异的大小,从图中可以清晰的看出整个的观测量的聚类过程。 分析结果显示,青海、宁夏、可以划归一类,它们在经济发展中处于不利地位,是经济欠发达地区。、浙江、江苏等作为经济较发达地区,可以划归另一类。其余省份划归第三类,为中等发达地区。 对结果进行判别分析,确定聚类结果的准确性。 判别分析 为了鉴别聚类结果,我们选2006年的数据对上述分类进行判别分析。这里我们选用Fisher判别法构造判别函数 分析结果如下: 表5表明所有变量都进入了判别分析。 用逐步分析方法选择用于构造判别函数的变量。 表8特征值 Eigenvalues代表用于分析的前两个典则判别函数的特征值, 是组间平方和与组内平方和之比值。 最大特征值与组均值最大的向量对应, 第二大特征值对应着次大的组均值向量。 标准化的典则判别函数系数 标准化的典则判别函数系数(使用时必须用标准化的自变量)。由图可知Fisher判别法构造的两个典则判别函数为: Y1=1.75X1+1.824X2-1.654X3 Y2=-0.639X1-0.815X2-0.065X3 表10 分类结果 从表10分类结果中可以看率。 从图中我们可以看出,有观测量错误地分到了第类上预测结果应是第类。 观测量分类点图,从图中我们可以清楚地看到观测量的分类情况,类距离较远,区分效果较好。 本文以SPSS 16.0为分析工具,通过地区对经济发展进行聚类和判别分析,对我国 总体来说,我国经济发展东强西弱的结果没有改变。我国东部沿海各省份的经济发展明显强于中西部地区而位于我国西部偏远地区的青海、西藏等省份,在我国经济发展格局中明显处于不利地位。 当然,我们也应该欣喜地看到,国家西部大开发战略的实施必然会对西部地区经济的发展起着巨大的促进作用。 总之,采用聚类和判别分析分析地区经济发展状况所得的模型符合我国当前实际情况,其结果具有统计学和现实意义,因此有比较实际的应用和研究价值。 参考文献 [1]

文档评论(0)

jiulama + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档