- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于层次分析法的组合评价法 姓 名:陈从叶 指导教师:王俊杰 主成分分析法研究的背景及意义 主成分分析法的基本原理 主成分分析法的计算步骤 主成分分析法的不足及改进 主成分分析法改进的应用实例 主成分分析法研究的背景及意义 在实际问题中,为了全面系统地分析问题,必须考虑许多对实际过程有影响的因素,也称之为指标或变量。因为每个变量都在不同程度上反映了所研究问题的信息,而且指标之间或多或少都有一定的相关性,因此得到的统计数据所反映的信息在一定程度上会有所重叠;另一方面,在研究多变量问题时,变量太多会增大计算量,增加分析问题的复杂性,因此希望在定量分析的过程中涉及的变量少,而得到的信息量又多。主成分分析法就是解决这一问题的理想工具。 主成分分析法的基本原理 主成分分析法是一种对数据降维的常用统计方法,它的基本思想是将原有的众多具有一定相关性的指标 重新整理出一组具有较少数目的互不相关的综合性指标来代替原始指标。 其中,综合指标的选取应该具备两个特点: 1.它能够最大程度反映原变量 所包含的信息; 2.它能够保持指标之间的相互无关; 设F1表示原变量第一个线性组合所形成的主成分指标, 即 其中每一个主成分所提取的信息量可用其方差来度量,其方差 越大,表示 所包含的信息越多。在实际应用中,人们希望第一主成分 所包含的信息量最大,因此在所有的线性组合中选取的 应该是 的所有线性组合中方差最大的,故称 为第一主成分。如果第一主成分不足以代替原有n项指标的信息,再考虑第二个主成分指标 ,为有效的反映原信息, 中已有的信息就再出现在 中了,即 与 要保持独立、不相关,用数学语言表达就是其协方差 ,所以 是与 不相关的 的所有线性组合中方差最大的,故称 为第二主成分。 依此类推构造出的 为原变量指标 的第一、第二、第m项主成分。 主成分分析法的计算步骤 主成分分析法的计算步骤如下: 1.设某综合评价是用p项指标,先将指标同趋势化,即将逆向指标转化为正向指标,一般用指标值的倒数代替原指标; 2.进行无量纲化。将p项指标的原始数据标准化; 3.计算指标的相关矩阵R,求R的p项特征值记为 ,相应的正交化特征向量 ; 4.设方差贡献率 ,当累计方差贡献率G(q) 达到一定的数值(一般取大于等于 85%)时,取q项主成分 ,进而得到综合评价函数: 5.将每一个样本的标准化指标值代入上式求得各样本的综合评价函数值,根据综合评价函数值对各样本进行排序。 主成分分析法的不足及改进 主成分分析法存在的不足主要表现在如下两点: 1.数据标准化过程存在信息丢失 在对指标进行标准化处理时存在信息丢失问题,使特征提取能力下降。传统主成分分析法采用变换方法为倒数法,这种方法改变了线性相关系数。从而特征值与特征向量也产生了变动。因此,对评价结果的准确性有影响。 2.综合评价指标权重系数分配的不完全合理 在实际评价过程中我们常常发现,指标之间相关性高低程度影响着评价指标权重系数的分配,权重系数明显向相关性较高的变量倾斜,这些变量的权重系数明显高于其他变量的权重系数。不同研究者对问题偏重程度不同,使用的评价方法不同,就会造成不同的结果。所以在处理实际问题时,必须从多个角度综合考虑,才能做出正确的评价,因此需要均衡各个指标变量的系数。 主成分分析法的改进 1.原始数据的均值化 在传统主成分分析法中,为了消除变量量纲或数量级的影响,需要对原始数据进行标准化处理,但是在实施标准化的过程中,却抹杀了各指标变异程度的差异信息。为了避免上述情况的发生,我们需要对原始数据进行均值化处理。 2.综合评价指标权重系数分配的改进 设指标系统总体为I,按指标相关性强弱将总体I分成 和 两部分,将相关性较强的指标 分入 ,相关性较弱的指标 分入 , 。 对比传统主成分分析法的函数表达式 ,将相关性较强的指标连同它们的系数组合得函数 ,为指标相关性较
文档评论(0)