空气污染研究的主成分分析报告.docxVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Word Word格式 空气污染研究的主成分分析 一、提出问题 本文对于给定的某城市 42天中午12点的空气污染数据进行主成分分析 ,主要解决以 下几个问题: ,对比二者的结果差异,并对所选的主成分做出解释(1) 分别用样本协方差矩阵和样本相关矩阵作主成分分析 ,对比二者的结果差异 ,并对所选的主成分做出解释 (2) 对原始数据的变化选取三个或者更少的主成分反映 分析问题 主成分分析旨在利用降维的思想,把多指标转化为少数几个综合指标 。在实际问题研究中,为了系统、全面地分析问题,我们必须考虑众多影响因素。因为每个因素都在不同程度上反映了所研究问题的某些信息,并且指标之间有一定的相关性,因而所得到的统计数据反映的信息在一定程度上有重叠。本文中所研究的问题变量较多,因此利用主成分分 主成分分析旨在利用降维的思想 ,把多指标转化为少数几个综合指标 。在实际问题研 究中,为了系统、全面地分析问题 ,我们必须考虑众多影响因素。因为每个因素都在不同 程度上反映了所研究问题的某些信息 ,并且指标之间有一定的相关性 ,因而所得到的统计 数据反映的信息在一定程度上有重叠 。本文中所研究的问题变量较多 ,因此利用主成分分 析法研究本问题,减少计算量和降低分析问题的复杂性 。针对问题一,首先将数据标准化,计算样本协方差矩阵和相关矩阵,然后分别计算样 析法研究本问题,减少计算量和降低分析问题的复杂性 。 针对问题一,首先将数据标准化,计算样本协方差矩阵和相关矩阵 ,然后分别计算样 本协方差矩阵和相关矩阵的特征值和特征向量,贡献率和累计贡献率,确定选取成分个数, 本协方差矩阵和相关矩阵的特征值和特征向量 ,贡献率和累计贡献率 ,确定选取成分个数, 列出主成分方程并解释主成分意义 。 80%,就可以反映 80%,就可以反映 原始数据的变化,并且对所选取的主成分做出解释 。 三、模型假设 1、影响污染程度的变量只有本文中所提到的变量 2、随机选取的42天; 3、 题目中所提到的城市是平衡发展,政府对环境治理干预较小,即此城市的环境不会出现 强烈波动; 4、 题目中所给的污染浓度及气象参数有效 ,数据都准确可靠,同时不考虑人为因素、检测 仪器精确度不同等影响。 四、符号说明 符号 符号含义 样本方差 x 原始变量 Y 样本主成分 Cov(Xj,Xj) 样本协方差 P 样本相关矩阵 片 样本平均值 S 协方差矩阵 P 特征向量矩阵 z 矩阵的特征值 e 矩阵的特征向量 信息提取率 五、问题求解 5.1协方差矩阵主成分分析 设二:是X =(捲,X2 ,X3 ,…,Xp)T的协方差矩阵,7的特征值与正交化特征向量分别为 r _ ,..2 一,?.3 一…_人p丄0及e ,e2, ?3,…,ep,且x的第i个主成分为 Y = e「Xi +G2X2 +U3X3 十…ejpXp,(i = 1,2,3,…,p) (1) 根据已有数据计算得样本 x=(Xi,X2,X3, ,Xp)T的均值向量X=(Xi,X2,X3, ,Xp)T为 X =(7.5 73.8333 4.4762 2.1905 10.0476 9.4048 3.0952 )T 根据协方差矩阵计算公式 1 n — (Xi — X)(Xi —X)T n -1 i 4 - 2. 500 -2. 781 -0 .378 -0 .463 -0. 585 -2. 232 0. 17们 -2 .781 300. 156 3. 909 -1 .387 6. 763 30. 791 0. 624 -0 378 3. 909 1. 522 0. 674 2. 315 2. 822 0. 142 -0 .463 -1. 387 0. 674 1. 182 1. 088 -0. 811 0. 177 -0 585 6. 763 2. 315 1. 088 11 364 3. 127 1. 044 -2 232 30. 791 2. 822 -0 .811 3. 127 30.979 0. 595 - 0. 171 0.624 0. 142 0. 177 1. 044 0. 595 0. 479」 代入数据可求得随机变量 X =(X1,X2,X3,X4, X5, X6,X7)T相应的样本协方差矩阵为 利用特征值计算公式 XE -送=0代入数据可求得 V的特征值■ i与对应单位正交化特征向 量e(i =1,2/ ,7)分别为 \ =303.6941, ? =(0.0099 -0.9932 -0.0150 0.0046 -0.0246 -0.1125 -0.0024)T ■2 =28.3132, e2 =(0.0766 0.1163 -0.1059 0.0128 -0.1501 -0.9727 -0.0237)T ■3 =11.4674 ,

文档评论(0)

laugh + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档