- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
( )
第 29卷第 6期 惠州学院学报 自然科学版 Vol29No6
2009年 12 月 JOURNAL OF HU IZHOU UN IV ER SITY D ec2009
广东省城市综合分类研究
朱 新 , 张未未
(惠州学院 数学系 , 广东 惠州 5160 15)
摘 要 :首先着重用 SA S中主成分分析与系统聚类分析对广东省 2 1个城市进行分类 ,然后用 自组织特征神经
网络的聚类分析对广东省 2 1个城市分类情况进行验证 ,这两种方法都把广东 2 1个城市分为 6 类 ,分类结果很相
似 。
关键词 :聚类分析 ;主成分分析 ; 自组织神经网络 ;累积贡献率
中图分类号 : X2 1 文献标识码 : A 文章编号 : 167 1 - 5934 (2009) 06 - 0055 - 07
1 引言
广东是改革开放的前沿经济社会发展迅速 ,但城市的人 口、面积悬殊 、地理环境各异 。广东 2 1个城市的政
治、经济 、文化发展很不平衡 ,要从整体上推进行政管理体制改革和机构改革 ,还必须根据城市的不同市情 , 区别
对待 ,分类指导 。在广东省城市人口最多的与最少的相差 2 19 倍 ,城市非农人 口相差 267 倍 ; 市区总面积相差
119倍 ;市区建成面积相差 68倍 。同时城市分布也很不平衡 ,这些城市有的依山傍水 , 自然条件优越 ,有的则地
理环境恶劣 。除此之外 ,各市在教育科技 、居民生活、医疗卫生 、治安环保等社会发展方面以及在市内交通 、邮电
通信 、居民住房 、供电、供水 、供气等基础设施方面发展水平参差不齐 。城市之间的差异如此之大 ,说明各市具有
互不相同的市情 ,客观上要求我们在整体上研究城市的相关问题时 ,不能完全套用一个尺寸、一个模式 ,必须对城
市进行科学的分类 。1993年 , 中央编委各市的经济发展和人口面积等不同的情况 ,将各城市分为一、二 、三类 [ 1 ] 。
随着经济发展这些指标过于单一或简单化 ,无法全面 、正确反映一个城市的综合实力 ,不能针对不同种类的城市
实施正确的经济政策 、教育政策 、工农业政策等 。针对当前的经济指标不能很好的反映一个城市的综合实力 ,本
文用 sa s中的主成分分析和系统聚类与自组织神经网络分别对广东省的 2 1个城市按中国可持续发展指标体系进
行了重新分类 ,对这些分类结果做出合理的解析 ,并对分类的结果的合理性进行分析 。下面我们具体研究这两种
方法在文中问题的应用 。
2 SA S 中主成分分析和系统聚类的聚类分析
2 1 主成分分析和聚类分析基本思想
( )
1 主成分分析的原理及基本思想 。
原理 :设法将原来变量重新组合成一组新的互相无关的几个综合变量 , 同时根据实际需要从中可以取出几个
较少的总和变量尽可能多地反映原来变量的信息的统计方法叫做主成分分析或称主分量分析 ,也是数学上处理
降维的一种方法 。
( )
基本思想 :主成分分析是设法将原来众多具有一定相关性 比如 P个指标 ,重新组合成一组新的互相无关的
综合指标来代替原来的指标 。通常数学上的处理就是将原来 P 个指标作线性组合 ,作为新的综合指标 。最经典
( ) ( )
的做法就是用 F1 选取的第一个线性组合 , 即第一个综合指标 的方差来表达 , 即 V ar F1 越大 ,表示 F1包含的信
息越多。因此在所有的线性组合中选取的 F1应该是方差最大的,故称 F1为第一主成分 。如果第一主成分不足
收稿日期 : 2009 - 09 - 10
( )
文档评论(0)