- 1、本文档共7页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
精心整理
空气污染研究的主成分分析
一、提出问题
本文对于给定的某城市 42 天中午 12 点的空气污染数据进行主成分分析, 主要解决以下几个问
题:
(1) 分别用样本协方差矩阵和样本相关矩阵作主成分分析,对比二者的结果差异;
(2 ) 对原始数据的变化选取三个或者更少的主成分反映,并对所选的主成分做出解释。
二、分析问题
主成分分析旨在利用降维的思想, 把多指标转化为少数几个综合指标。 在实际问题研究中, 为
了系统、全面地分析问题, 我们必须考虑众多影响因素。 因为每个因素都在不同程度上反映了所研
究问题的某些信息, 并且指标之间有一定的相关性, 因而所得到的统计数据反映的信息在一定程度
上有重叠。 本文中所研究的问题变量较多, 因此利用主成分分析法研究本问题, 减少计算量和降低
分析问题的复杂性。
针对问题一, 首先将数据标准化, 计算样本协方差矩阵和相关矩阵, 然后分别计算样本协方差
矩阵和相关矩阵的特征值和特征向量, 贡献率和累计贡献率, 确定选取成分个数, 列出主成分方程
并解释主成分意义。
针对问题二,考虑主成分的贡献率,只要主成分的累计贡献率达到 80%,就可以反映原始数
据的变化,并且对所选取的主成分做出解释。
三、模型假设
1、影响污染程度的变量只有本文中所提到的变量;
2、随机选取的 42 天;
3、题目中所提到的城市是平衡发展,政府对环境治理干预较小,即此城市的环境不会出现强烈波
动;
4 、题目中所给的污染浓度及气象参数有效,数据都准确可靠,同时不考虑人为因素、检测仪器精
确度不同等影响。
四、符号说明
符号 符号含义
样本方差
原始变量
样本主成分
样本协方差
精心整理
样本相关矩阵
样本平均值
协方差矩阵
特征向量矩阵
矩阵的特征值
矩阵的特征向量
信息提取率
五、问题求解
5.1 协方差矩阵主成分分析
设 是 x (x , x ,x , ,x )T 的协方差矩阵, 的特征值与正交化特征向量分别为
1 2 3 p
0 及 e ,e ,e , ,e ,且 x 的第 i 个主成分为
1 2 3 p 1 2 3 p
Y e x e x e x e
文档评论(0)