- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析法的原理应用及计算步骤主成分分析法的原理应用及计算步骤
一、概述
在处理信息时,当两个变量之间有一定相关关系时,可以解释为这两个变量
反映此课题的信息有一定的重叠,例如,高校科研状况评价中的立项课题数与项
目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基
础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量
之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。
为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这
必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种
更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会
造成信息的大量丢失。主成分分析正式这样一种能够有效降低变量维数,并已
得到广泛应用的分析方法。
主成分分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综
合指标,通常综合指标(主成分)有以下几个特点:
主成分个数远远少于原有变量的个数
原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建
模,这将大大减少分析过程中的计算工作量。
主成分能够反映原有变量的绝大部分信息
因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造
成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。
主成分之间应该互不相关
通过主成分分析得出的新的综合指标(主成分)之间互不相关,因子参与数
据建模能够有效地解决变量信息重叠、多重共线性等给分析应用带来的诸多问
题。
主成分具有命名解释性
总之,主成分分析法是研究如何以最少的信息丢失将众多原有变量浓缩成
少数几个因子,如何使因子具有一定的命名解释性的多元统计分析方法。
二、基本原理
主成分分析是数学上对数据降维的一种方法。其基本思想是设法将原来众多
的具有一定相关性的指标X1,X2,…,XP (比如p 个指标),重新组合成一组较
少个数的互不相关的综合指标Fm 来代替原来指标。那么综合指标应该如何去提
取,使其既能最大程度的反映原变量Xp 所代表的信息,又能保证新指标之间保
持相互无关(信息不重叠)。
设 F1 表示原变量的第一个线性组合所形成的主成分指标,即
F a X a X ...a X
1 11 1 21 2 p 1 p ,由数学知识可知,每一个主成分所提取的信息量可
用其方差来度量,其方差Var(F1)越大,表示F1 包含的信息越多。常常希望第
一主成分F1 所含的信息量最大,因此在所有的线性组合中选取的F1 应该是X1,
X2,…,XP 的所有线性组合中方差最大的,故称F1 为第一主成分。如果第一主
成分不足以代表原来 p 个指标的信息,再考虑选取第二个主成分指标 F2,为有
效地反映原信息,F1 已有的信息就不需要再出现在F2 中,即F2 与F1 要保持独
立、不相关,用数学语言表达就是其协方差Cov(F1, F2)=0,所以F2 是与F1 不
相关的X1,X2,…,XP 的所有线性组合中方差最大的,故称F2 为第二主成分,
依此类推构造出的F1、F2、……、Fm 为原变量指标X1、X2……XP 第一、第二、……、
第m 个主成分。
F a X a X ... a X
1 11 1 12 2 1 p p
F a X a X ... a X
2 21 1 22 2 2 p p
F a X a X ... a X
m m1 1 m2 2 mp p
根据以上分析得知:
(1) Fi与Fj 互不相关,即Cov(Fi,Fj) = 0,并有Var(Fi)=ai’Σai,其
中Σ为X 的协方差阵
(2)F1 是 X1,X2,…,Xp 的一切线性组合(系数满足上述要求)中方差最
大的,……,即Fm 是与F1,F2,……,Fm-1 都不相关的X1,X
您可能关注的文档
- 中考地理复习方案第3课时 地图(全国通用,27张ppt)中考地理复习方案第3课时 地图(全国通用,27张ppt).ppt
- 中考复习:《概率》真题练习中考复习:《概率》真题练习.doc
- 中考一轮复习《电功率》第一课时中考一轮复习《电功率》第一课时.ppt
- 中考政治专题:治理环境污染,推进生态文明中考政治专题:治理环境污染,推进生态文明.ppt
- 中考复习之——被动语态复习与练习专题课件中考复习之——被动语态复习与练习专题课件.ppt
- 中考数学卷精析版——宁夏回族自治区卷中考数学卷精析版——宁夏回族自治区卷.doc
- 中考数学卷精析版——山东临沂卷中考数学卷精析版——山东临沂卷.doc
- 中考数学卷精析版——山东济宁卷中考数学卷精析版——山东济宁卷.doc
- 中考数学卷精析版——山东枣庄卷中考数学卷精析版——山东枣庄卷.doc
- 中考地理试题分类之走进欧洲中考地理试题分类之走进欧洲.doc
最近下载
- 完整八年级物理综合实践活动课教案.docx
- 高考英语一轮复习知识清单(全国通用):专题20 语法填空介词100题(精练)解析版.docx VIP
- 110kV〜750kV架空输电线路施工及验收规范.docx VIP
- 2021-2022年国家开放大学电大法学《实用法律基础》课程考试打印版完美打印版 英语网考资料.doc
- 奥迪A6电路图之发动机BAT.pdf
- 2023年4月自考02207电气传动与可编程控制器PLC试题及答案含解析.pdf
- 医院普外科课件.pptx
- 游戏策划方案-数值策划笔试题.docx VIP
- 高考英语一轮复习知识清单:专题08 语法填空不定式100题(全国通用)解析版.docx VIP
- drillwork2005操作手册.ppt
文档评论(0)