- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主成分分析 景元萍 数理部 主成分分析的基本原理 主成分分析的计算步骤 主成分分析方法的应用实例 问题的提出 多数实际问题,都与多个不同指标有关,并且不同指标之间具有一定相关性。由于指标较多及指标间有一定的相关性,势必增加分析问题的复杂性。 因此,人们会很自然地想到,能否在相关分析的基础上,用较少的新指标代替原来较多的旧指标呢,而且使这些较少的新指标尽可能多地保留原来指标所反映的信息? 事实上,这种想法是可以实现的,主成分分析方法就是综合处理这种问题的一种强有力的工具。 基本思想: 主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替原来指标。同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的信息。从数学角度来看,这是一种降维处理技术 一.主成分分析的基本原理 假定一个问题有n个样本,每个样本共有p个指标,构成一个n×p阶的数据矩阵 满足如下的条件: 二.主成分分析的计算步骤 1.数据标准化 设实际问题中的样本数为n,每个样本有p个指标,则原始数据资料阵为: 在实际应用中,为了消除量纲的影响,往往对原始数据标准化。 其中 , 得到 。 2.计算相关系数矩阵 rij(i,j=1,2,…,p)为原变量xi与xj的相关系数,其计算公式为 (1) 可见 ,显然R是对称矩阵且主对角线上元素都是1. 2.计算相关矩阵R的特征值和特征向量 1)计算R的特征值并使其按大小顺序排列 2)分别求出对应于特征值 的正交单位化特征向量 (这一步骤可以使用matlab软件实现,也可以用迭代法求R的特征值和特征向量) 则第i个主成分为 3.在以确定的全部P个主成分中合理选择r个来实现最终的评价分析。 一般用方差贡献率 来解释主 成分 所反应的信息量的大小。 r的确定以累计贡献率 达 到足够大(一般在85%以上)为原则。 4.对所选主成分做出经济解释 1)从系数的大小、系数的符号上进行分析。 2)系数绝对值较大,则表明该主成分主要综合了绝对值大的变量。 3)正号表示变量与主成分作用同方向,负号表示原变量与主成分作用反方向。 5.计算n个样本在r个主成分上的得分 6.利用主成分分析结果对样本综合评价 通过主成分分析,选择r个主成分 , 以每个主成分 的方差贡献率 作为权数,构造综合评价函数 其中 为第i个主成分的得分。 当把r个主成分的得分代入F函数后,即可得到每个样本的综合评价函数得分,以得分的大小排序,可列出每个样本的经济效益排名。 三. 主成分分析方法应用实例 3)对于特征值 , , 分别求出其特征向量 。 得到前三个主成分为 从而得到各个变量 在主成分 上的载荷(表4) 参考文献 [1] 阮晓青 周义仓.数学建模引论.北京;高等教育出版社,2005. [2]张丽艳.主成分分析法在环境评价中的应用.环境保护,1994. [3]徐雅静,汪远征.主成分分析应用方法的改进.数学实践与认识,2005. Evaluation only. Created with Aspose.Slides for .NET 3.5 Client Profile 5.2.0.0. Copyright 2004-2011 Aspose Pty Ltd. Ev
文档评论(0)