网站大量收购独家精品文档,联系QQ:2885784924

多元统计分析课件(主成分分析).pptVIP

  1. 1、本文档共53页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章 主成分分析 一项十分著名的工作是 美国的统计学家斯通(stone)在1947年关于国民经济的研究。 选择17个反映国民收入与支出的变量因素,例如雇主补贴、消费资料和生产资料、纯公共支出、净增库存、股息、利息外贸平衡等等,他利用美国1929一1938年各年的数据。 在进行主成分分析后,竟以97.4%的精度,用3个新变量取代了原17个变量。 根据经济学知识,斯通给这3个新变量分别命名为 总收入F1、 总收入变化率F2 经济发展或衰退的趋势F3 定理2、若上述矩阵A的特征根所对应的单位特征向量为 如果一个主成分仅仅对某一个原始变量有作用,则称为特殊成分。 如果一个主成分所有的原始变量都起作用,称为公共成分。 例一 应收账款是指企业因对外销售产品、材料、提供劳务及其它原因,应向购货单位或接受劳务的单位收取的款项。出于扩大销售的竞争需要,企业不得不以赊销或其它优惠的方式招揽顾客,由于销售和收款的时间差,于是产生了应收款项。应收款赊销的效果的好坏,不仅依赖于企业的信用政策,还依赖于顾客的信用程度。由此,评价顾客的信用等级,了解顾客的综合信用程度,对加强企业的应收账款管理大有帮助。某企业为了了解其客户的信用程度,采用西方银行信用评估常用的5C方法,5C的目的是说明顾客违约的可能性。 1、品格(用X1表示),指顾客的信誉,履行偿还义务的可能性。企业可以通过过去的付款记录得到此项。 2、能力(用X2表示),指顾客的偿还能力。即其流动资产的数量和质量以及流动负载的比率。顾客的流动资产越多,其转化为现金支付款项的能力越强。同时,还应注意顾客流动资产的质量,看其是否会出现存货过多过时质量下降,影响其变现能力和支付能力。 3、资本(用X3表示),指顾客的财务势力和财务状况,表明顾客可能偿还债务的背景。 4、附带的担保品(用X4表示),指借款人以容易出售的资产做抵押。 5、环境条件(用X5表示),指企业的外部因素,即指非企业本身能控制或操纵的因素。 首先抽取了10家具有可比性的同类企业作为样本,又请8位专家分别给10个企业的5个指标打分,然后分别计算企业5个指标的平均值,如表。 第一主成份的贡献率为84.6%,第一主成份 Z1=0.469X1+0.485X2+0.473X3+0.462X4+0.329X5 的各项系数大致相等,且均为正数,是对所有指标的一个综合测度,可以作为综合的信用等级指标。可以用来排序。 计算各企业的得分,并按分值大小排序: 在实际问题中,利用主成分的目的是为了减少变量的个数,所以一般不用P个主成分,而是根据如下方法选取前K个主成分。 定义 为第i主成分Fi的方差贡献率。 这个值越大,说明这个主成分Fi综合原指标信息的能力越强。 定义 ( K≤P) 为主成分Fl, F2,…,Fk的累积方差贡献率。 当前K个主成分的累积方差贡献率达到85%以上时,就取K个主成分。这样K个主成分基本反映了原指标的信息,指标数目由P个减少到K个。 这种由讨论多个指标降为少数几个综合指标的过程在数学上就叫做降维。 变量的标准化: 由于主成分是根据变量的离散度也即方差的大小来确定主成分的,这样当不同指标的量纲不同时,不同指标的方差大小差別很大,主成分会受到影响, 例如: X1表年收入,从万元到百万元变化, X2表净收入与总资产之比,从0.01到0.60变化, 那么X1的方差的绝对量将远远大于X2的方差, 这样主成分会过于照顾方差大的变量,为使主成分能均等地对待每一个原变量,应将原变量作标准化处理. 标准化公式: (i=1,2, …P) 这时有 = 因此求U时可用 的特征向量。 还可以证明 = 所以 = = 2、主成分的性质 性质1:F的协方差阵 为对角阵 性质2: 性质3: (i=1,2, …P) 对于标准化后的变量,则 原始变量与主成分之间的相关系数 主成分得分: 当选取了n个主成分后,把样本数据代入各主成分表达式可得样本的主成分得分。 若主成分是由原始数据协方差阵计算的,则计算主成分得分时,代原始数据。 若主成分是由标准化数据计算,即由R计算,则计算主成分得分时,一定要代标准化数据,否则会出现错误。 主成分的综合得分 利用主成分Fl,F2,…, Fk作线

文档评论(0)

kfcel5889 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档