- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Word
Word格式
空气污染研究的主成分分析
一、提出问题
本文对于给定的某城市 42天中午12点的空气污染数据进行主成分分析 ,主要解决以
下几个问题:
,对比二者的结果差异,并对所选的主成分做出解释(1) 分别用样本协方差矩阵和样本相关矩阵作主成分分析
,对比二者的结果差异
,并对所选的主成分做出解释
(2) 对原始数据的变化选取三个或者更少的主成分反映
分析问题
主成分分析旨在利用降维的思想,把多指标转化为少数几个综合指标 。在实际问题研究中,为了系统、全面地分析问题,我们必须考虑众多影响因素。因为每个因素都在不同程度上反映了所研究问题的某些信息,并且指标之间有一定的相关性,因而所得到的统计数据反映的信息在一定程度上有重叠。本文中所研究的问题变量较多,因此利用主成分分
主成分分析旨在利用降维的思想
,把多指标转化为少数几个综合指标 。在实际问题研
究中,为了系统、全面地分析问题
,我们必须考虑众多影响因素。因为每个因素都在不同
程度上反映了所研究问题的某些信息
,并且指标之间有一定的相关性
,因而所得到的统计
数据反映的信息在一定程度上有重叠
。本文中所研究的问题变量较多
,因此利用主成分分
析法研究本问题,减少计算量和降低分析问题的复杂性 。针对问题一,首先将数据标准化,计算样本协方差矩阵和相关矩阵,然后分别计算样
析法研究本问题,减少计算量和降低分析问题的复杂性 。
针对问题一,首先将数据标准化,计算样本协方差矩阵和相关矩阵
,然后分别计算样
本协方差矩阵和相关矩阵的特征值和特征向量,贡献率和累计贡献率,确定选取成分个数,
本协方差矩阵和相关矩阵的特征值和特征向量
,贡献率和累计贡献率
,确定选取成分个数,
列出主成分方程并解释主成分意义 。
80%,就可以反映
80%,就可以反映
原始数据的变化,并且对所选取的主成分做出解释 。
三、模型假设
1、影响污染程度的变量只有本文中所提到的变量
2、随机选取的42天;
3、 题目中所提到的城市是平衡发展,政府对环境治理干预较小,即此城市的环境不会出现
强烈波动;
4、 题目中所给的污染浓度及气象参数有效 ,数据都准确可靠,同时不考虑人为因素、检测 仪器精确度不同等影响。
四、符号说明
符号
符号含义
样本方差
x
原始变量
Y
样本主成分
Cov(Xj,Xj)
样本协方差
P
样本相关矩阵
片
样本平均值
S
协方差矩阵
P
特征向量矩阵
z
矩阵的特征值
e
矩阵的特征向量
信息提取率
五、问题求解
5.1协方差矩阵主成分分析
设二:是X =(捲,X2 ,X3 ,…,Xp)T的协方差矩阵,7的特征值与正交化特征向量分别为
r _ ,..2 一,?.3 一…_人p丄0及e ,e2, ?3,…,ep,且x的第i个主成分为
Y = e「Xi +G2X2 +U3X3 十…ejpXp,(i = 1,2,3,…,p) (1)
根据已有数据计算得样本 x=(Xi,X2,X3, ,Xp)T的均值向量X=(Xi,X2,X3, ,Xp)T为
X =(7.5 73.8333 4.4762 2.1905 10.0476 9.4048 3.0952 )T
根据协方差矩阵计算公式
1 n
— (Xi — X)(Xi —X)T
n -1 i 4
-
2.
500
-2. 781
-0
.378
-0
.463
-0. 585
-2. 232
0. 17们
-2
.781
300. 156
3.
909
-1
.387
6.
763
30. 791
0.
624
-0
378
3. 909
1.
522
0.
674
2.
315
2. 822
0.
142
-0
.463
-1. 387
0.
674
1.
182
1.
088
-0. 811
0.
177
-0
585
6. 763
2.
315
1.
088
11
364
3. 127
1.
044
-2
232
30. 791
2.
822
-0
.811
3.
127
30.979
0.
595
-
0.
171
0.624
0.
142
0.
177
1.
044
0. 595
0.
479」
代入数据可求得随机变量 X =(X1,X2,X3,X4, X5, X6,X7)T相应的样本协方差矩阵为
利用特征值计算公式
XE -送=0代入数据可求得
V的特征值■ i与对应单位正交化特征向
量e(i =1,2/ ,7)分别为
\ =303.6941,
? =(0.0099 -0.9932 -0.0150 0.0046 -0.0246 -0.1125 -0.0024)T
■2 =28.3132,
e2 =(0.0766 0.1163 -0.1059 0.0128 -0.1501 -0.9727 -0.0237)T
■3 =11.4674 ,
您可能关注的文档
- 钢栈桥、桩基平台、钢护筒、钢围堰专项施工方案.docx
- 高层建筑轴线竖向控制[激光垂准仪]施工方法.docx
- 高二下学期语文月考试卷及答案学习资料.docx
- 高考生物_遗传大题总结.docx
- 高考政治(精讲+精练+精析)专题34_探究世界的本质习题(含解析)1.docx
- 高速公路绿化景观林带施工组织设计.docx
- 高速公路施工管理解决方案_长沙道好信息科技有限公司.docx
- 高铁路基CFG方案试桩(一).docx
- 高要市南岸街道社区卫生服务中心施工组织方案.docx
- 高中化学物质的量和摩尔质量讲解经典试题与精讲精练.docx
- 2025年高考数学复习新题速递之圆锥曲线综合(2024年9月).docx
- 2025年中考数学复习新题速递之代数式(2024年9月).docx
- 2025年中考数学复习新题速递之二次根式(2024年9月).docx
- 2025年中考数学复习新题速递之一元一次方程(2024年9月).docx
- 2025年中考数学复习新题速递之图形的对称(2024年9月).docx
- 2025年高考历史复习新题速递之工业革命(2024年9月).doc
- 2025年高考数学复习新题速递之常用逻辑用语(2024年9月).docx
- 2025年高考历史复习新题速递之秦汉时期(2024年9月).doc
- 2025年高考历史复习新题速递之晚清时期(2024年9月).doc
- 2025年高考数学复习新题速递之统计(2024年9月).docx
文档评论(0)