- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《统计手册:金融中的统计方法》 第章 主成分分析和因子分析.doc
《统计手册:金融中的统计方法》 第16章 主成分分析和因子分析
《统计手册:金融中的统计方法》 ′ A=(C:L:C) (2.3) ??1r222时达到,其中C,L,C是∑∑关于∑的前r个特征值λ≥λ≥L≥λ所对应的r个1特征向量,也就是说,特征向量和特征值是从下面的行列式方程中产生的 2 ∑∑-λ∑=0 (2.4) 211222用z=Ay预测x的相对信息损失是 ??????1′′tr(∑??(A∑A)A∑∑A)/tr∑11??22????2112??1122 (2.5) λ+L+λ1r=1??tr∑11我们可以选择一些特殊的x和y,并导出具有(2.3)形式的最优变换A。 2.2. x=y的情形 #039;#039;考虑特定情形x=y,得到一般主成分Cx,L,Cx,其中C,L,C是行列式方程1r1r22∑??λI=0的前r个特征值λ≥L≥λ所对应的前r个特征向量。在这种情况下,信息111r损失(2.5)等于 2222λ+L+λλ+L+λr+1p1r 1??= (2.6) 2222λ+L+λλ+L+λ1p1p通常用百分数表示,r的选择取决于(2.6)的大小。 2实际上,需要从p维随机向量x的n个独立观测值样本中估计λ和C,这个样本用iip×n矩阵表示 X=(x:L:x) (2.7) 1n∑的估计量是 111??1????′′ S=(n??1)XI??eeX ????n????其中e是n维1向量。λ的估计l和C的估计量c可以从谱分解中得出 iiii22′′ S=lcc+L+lcc (2.8) 111ppp于是第i个个体观测值的主成分就是 ′′′ q=(cx,L,cx) (2.9) i1ipi其结果是,我们表示 s=S的第i个对角线元素, ii 2
《统计手册:金融中的统计方法》 ′ c=(c,L,c),j=1,L,p, (2.10.1) jj1jp?? c=lc,i=1,L,p, (2.10.2) jijji′ q=(q,L,q),i=1,L,n, (2.11.1) ii1ip??1?? q=lq,i=1,L,n. (2.11.2) ijjij应该注意,向量c和q(除坐标平移之外)可以从奇异值分解(singular value iidecomposition, SVD) 1????′′′ XI??ee=lcd+L+lcd (2.12) ????111pppn????′一步得出。其中具有关系式(ld:L:ld)=(q:L:q)。 11pp1n2.3.主成分解释 为了用原始测量指标的影响解释主成分,需要表1中列出的计算。 表1 与主成分的相关系数 x对z,L,z i1r原始变量 z K z 1p的复相关系数 r??122x ??s∑c=R1??L??c/sc/s11j111111p111j=1MMM M M r??L??c/sc/s??122x 1pppppppp??s∑c=Rppjppj=1 表1中相关系数的大小表明每一个变量由每一个主成分代表的效果,以及全部变量用前22r个主成分代表的效果(通过R的值判断)。对r=1,2,L计算R的值使得我们能够对r作ii2出决定,即决定选取主成分的个数。如果对某个r,除一个i值以外R的值都很高,比如说i是j,那么可以决定将x加入z,...,z中,或者增加其他能很好代表x的主成分。 j1rj2.4.数据的图形显示 依照原始测量指标表示所有个体,需要一个p维空间。但是为了直观地考察,我们需要这些个体在二维或者三维空间里的标示图,它应该尽可能反映个体在p维空间里的构形(configuration)(个体之间的距离)。为此,使用(2.
您可能关注的文档
- 论正态分布在教育评价中的应用【必威体育精装版】.doc
- 试论初中语文课堂教学设计中几个突出问题的应对策略_论文.docx
- 华家池,能否让世茂房地产回归“豪宅”本色.doc
- 大学生创新思维影响因素的分析——基于双变量相关分析的实证.doc
- 2018届广东省实验中学高三第一次阶段考试理科数学试题及答案.doc
- 银行职员转正自我鉴定范文.doc
- 2018住房供应保障体系建设工作情况汇报.doc
- 【名师A计划】(全国通用)2017高考数学一轮复习 第九章 计数原理、概率与统计 第十节 二项分布及其应用、正态分布习题 理.doc
- 结合现实生活谈谈你对共青团的历史的理解.doc
- 探究多元表征途径合理解决问题.doc
文档评论(0)