- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于主成分分析对城市工业三废排放情况的研究
基于主成分分析对城市工业三废排放情况的研究
王元彬
(大理学院 数学与计算机学院)
摘 要:本文讨论了…
关键字:主成分;工业三废
0 引 言
随着改革开放的不断深入, 在一定时期内, 由于片面追求经济效益, 虽然城市经济得到了迅猛发展, 但工业三废排放量不断增加,近年来我国城市化和工业化的进程加快,但由于历史政治等多种原因,我国城市的空间分布不均匀,工业发展水平地区差异显著。由于工业起步较晚,与工业发展相配套的环境工程设施建设也不够健全,导致了我国工业发展中各种工业废弃物的产生量较大,处理和循环利用的程度也不高。2000 年开始,中国环境监测总站根据原国家环境保护总局的有关要求,组织了47个环境保护重点城市开展城市环境空气质量日报和预报工作,对这些城市进行重点监测。
本文首先介绍主成分分析方法的基本原理、数学模型及基本步骤,然后然后对所收集到的数据进行主成分分析, 获得主成分因子, 利用21个城市对应主成分的值对各城市得分进行排序;再从区域经济角度出发, 运用主成分分析的方法对各区域的数据进行分析. 最后综合排序结果来探讨这些城市工业三废排放情况的差异性。这21个城市的工业三废排放量的统计数据来源于2008 年中国统计年鉴,其中有几个数据
1 主成分分析的基本原理、模型及基本步骤
1.1 主成分分析的基本原理
三废污染监测指标是多要素的复杂系统,在我们进行环境系统分析时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们的思想是在各个变量之间相关关系研究的基础上用较少的新变量代替原来较多的原变量,而且使这些较少的新变量尽可能多地保留原变量所反映的信息,主成分分析法就是在保留原始变量尽可能多的信息的前提下把原来多个变量化为少数几个相互无关的综合变量的一种统计分析方法,从而达到降维的目的, 以简化问题的复杂性并抓住问题的主要矛盾.这些新的综合变量称之为主成分. 一般地说, 利用主成分分析得到的主成分与原来的变量之间有如下基本关系:
◇ 每一个主成分都是各原始变量的线性组合.
◇ 主成分的数目大大少于原始变量的数目.
◇ 主成分保留了原始变量的绝大多数信息.
◇ 主成分之间互不相关.
1.2 主成分分析的数学模型
在一个统计问题中, 假设我们收集到n 个样品, 每个样品观测到p 个变量(记为,,...,,为简单起见,可设 均值为0方差为,即已经为标准化数据) , 构成一个n × p 阶的样本资料阵:
即: …… ①
主成分分析的目的在于利用p 个原始变量(,,..., ) 构造少数几个新的综合变量, 使得新变量为原始变量的线性组合, 新变量互不相关, 新变量包含p 个原始变量的绝大部分信息. 这样定义 为原始变为新的综合变量指标, 每一个新综合变量指标是p 个原始变量的线性组合:
…… ②
同时要求满足以下几个条件:
1) 协方差Cov(,)=0(i≠j;i,j=1,2,…,p)即与相互无关;
2) 是的一切线性组合中方差最大者;是与不相关的的所有线性组合中方差最大者;…;是与 都不相关的的所有线性组合中方差最大者. 这样决定的新变量指标分别称为原变量的第一, 第二, …, 第m 主成分. 其中,z1在总方差中占的比例最大,z2,z3,…,zm的方差依次递减。在实际问题的分析中,常挑选前几个最大的主成分,这样既减少了变量的数目,又抓住了主要矛盾,简化了变量之间的关系。
从以上的分析可以看出, 主成分分析的实质就是要确定原来变量 ( j = 1, 2, ?, p ) 在诸主成分 ( i = 1, 2, ?,m ) 上的系数 ( i = 1, 2, ?,m ; j = 1, 2, ?, p ). 从数学上可以证明,他们分别是p 个原始变量( ) 相关矩阵的前m 个具有较大特征值所对应的特征向量, 而各个综合变量 的方差var () 恰好是相应的特征值. 各主成分的方差贡献大小按特征根顺序排列, 是依次递减的, 即其几何意义: 主成分分析相当于对原坐标轴做一次旋转变换, 使得新坐标系的第1 轴对应于数据变易的最大方向, 第2 轴与第1 轴正交, 且对应于数据变易的第二大方向, 依次类推.
1.3 主成分分析的基本步骤
1) 确定分析变量, 收集数据;
2) 对原始数据进行标准化;
即对于原始样本资料阵①
令
其中分别为第j列元素的样本均值和样本方差,
而且:
则为标准化后的样本资料阵,为标准化后的第k个观测变量
3) 由标准化后的数据求协方差矩阵C或原始数据的相关矩阵R(可证C=R). 如果不进行标准化处理, 忽略步骤2(本文不忽略), 则直接计算原始数据的相关矩阵. 方程式如下:
其中:且
其中:为原始变量与的相关系数
文档评论(0)