- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主
成
分
分
析
专 业:服装设计与工程题 目:浅析主成分分析及案例分析
专 业:服装设计与工程
题 目:浅析主成分分析及案例分析
姓 名:吴旭波
学 号:M090111114
指导老师:刘 翔
在统计学中,主成分分析(principal components analysis, PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大 HYPERLINK /wiki/%E6%96%B9%E5%B7%AE \o 方差 方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对 HYPERLINK /wiki/%E6%96%B9%E5%B7%AE \o 方差 方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。
在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为 HYPERLINK /wiki/%E5%8F%98%E9%87%8F \o 变量 变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的 HYPERLINK /wiki/%E7%BB%9F%E8%AE%A1%E6%95%B0%E6%8D%AE \o 统计数据 统计数据反映的信息在一定程度上有重叠。在用 HYPERLINK /wiki/%E7%BB%9F%E8%AE%A1%E6%96%B9%E6%B3%95 \o 统计方法 统计方法研究多变量问题时,变量太 多会增加计算量和增加分析问题的复杂性,人们希望在进行 HYPERLINK /wiki/%E5%AE%9A%E9%87%8F%E5%88%86%E6%9E%90 \o 定量分析 定量分析的过程中,涉及的变量较少,得到的 HYPERLINK /wiki/%E4%BF%A1%E6%81%AF%E9%87%8F \o 信息量 信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具
主成分分析法是一种降维的统计方法,它借助于一个正交变换,将其分量相关的原随机向量转化成其分量不相关的新随机向量,这在代数上表现为将原随机向量的协方差阵变换成对角形阵,在几何上表现为将原坐标系变换成新的正交坐标系,使之指向 HYPERLINK /wiki/%E6%A0%B7%E6%9C%AC \o 样本 样本点散布最开的p 个正交方向,然后对多维变量系统进行降维处理,使之能以一个较高的精度转换成低维变量系统,再通过构造适当的价值函数,进一步把低维系统转化成一维系统。
主成分分析的主要作用体现在五个方面,第一,主成分分析能降低所研究的数据空间的维数。第二,可通过因子负荷的结论,弄清X变量间的某些关系。第三,可用于多为数据的一种图形表现方法。第四,可由主成分分析构造回归模型,即把各个主成分作为新自变量代替原来自变量做回归分析。第五,用主成分分析筛选回归变量。
案例分析:
下表是关于全国31个省市的8项经济指标,以此为例,进行主成分分析。
省份
国内生产
居民消费
固定资产
职工工资
货物周转
消费价格
商品零售
工业产值
北京
1394.89
2505
519.01
8144
373.9
117.3
112.6
843.43
天津
920.11
2720
345.46
6501
342.8
115.2
110.6
582.51
河北
2849.52
1258
704.87
4839
2033.3
115.2
115.8
1234.85
山西
1092.48
1250
290.9
4721
717.3
116.9
115.6
697.25
内蒙
832.88
1387
250.23
4134
781.7
117.5
116.8
419.39
辽宁
2793.37
2397
387.99
4911
1371.7
116.1
114
1840.55
吉林
1129.2
1872
320.45
4430
497.4
115.2
114.2
762.47
黑龙江
2014.53
2334
435.73
4145
824.8
116.1
114.3
1240.37
上海
2462.57
5343
996.48
9279
207.4
118.7
113
1642.95
江苏
5155.25
1926
1434.95
5943
1025.5
115.8
114.3
2026.64
浙江
3524.79
2249
1006.39
6619
754.4
116.6
113.5
916.59
安徽
2003.58
您可能关注的文档
最近下载
- 来法莫林药物市场调研报告202312.pdf VIP
- [煤矿标准]GBT 20475.3-2012 煤中有害元素含量分级 第3部 分砷.pdf
- 2024年山东威海初中学业水平考试生物试卷真题(含答案详解).docx
- 山东亚洲金属循环利用环保有限公司年处理30万吨废旧蓄电池.doc VIP
- 耐克森nexans卷筒电缆.pdf
- 广州某银行业务连续性管理办法.pdf VIP
- 人教鄂教版五年级上册科学期末综合训练(含答案).docx
- 如何玩转抖音.pptx VIP
- 2024必威体育精装版“学宪法讲宪法”知识竞赛题库与答案.pdf
- 2023年哈尔滨工业大学(深圳)计算机科学与技术专业《数据结构与算法》科目期末试卷A(有答案).docx VIP
文档评论(0)