- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第五章 主成分分析;第五章1 主成分概念;如果以这条红线为横坐标轴,那么各点在红线上的横坐标值(记为y1 )就可以在很大程度上反映x1和x2的变化信息。;问题: y1与y2与原变量x1、x2有何关系?;因此,L= [l1, l2]就是新坐标基 [β1, β2];下面考察n个点在新旧坐标系中的离散程度(总离差平方和):;观察右图易知,长轴方向的离散程度要远大于短轴方向的离散程度,即y1的方差要远大于y2的方差,
如果对本例计算变换前后各变量占总离差平方和的比重为:
;即:
各主成分的系数向量都是单位向量;
不同主成分的系数向量相互正交。;以上分析是当x有2个变量(二维)时的情形。
下面给出当x具有m个变量时,主成分的一般定义:
设x=[ x1, x2, …, xm ]T是一个由m个随机变量组成的随机向量,
设x的数学期望为零向量0,
x的第i个主成分的定义为:;把m个主成分的表达式展开:;如果有n次观测,那么x有n列:;第五章2 主成分的导出与计算;第一主成分y1的导出;该问题为多元函数的条件极值问题(m元), 可以应用拉格朗日乘数法。;;第一主成分y1的方差: l1TSl1 =λl1Tl1= λ,因此,要使y1的方差达最大, λ应取S的特征值里面最大的那一个: λ1 ,
系数向量l1就是对应于最大特征值λ1的特征向量。;第二主成分 y2=l2Tx 的确定;所以,l2与l1类似,也是S的特征向量,此处的λ也是S的一个特征值。;与第一、二主成分类似, 我们可以推导出所有的主成分,
m个变量的主成分的系数向量就是其协方差阵S=XXT的特征值λ1≥ λ2≥… ≥λm所对应的单位化的特征向量 l1, l2, …, lm。
第k个特征值λk ,就是第k主成分yk的方差 ykykT。;总结 主成分的性质;(3)第一、二、… 主成分的方差大小是
由大到小顺序排列的, 也即按S的特征值由大到小排列。;主成分的各种形式;利用原始变量计算主成分;利用标准化变量计算主成分;XXT的特征向量;通过上图可以看出,如果对原始变量计算XXT的特征向量,将无法达到主成分分析的目的,因此,如果要分析原始变量的主成分,应该对协方差阵S=XdXdT或(S=(XdXdT)/n)计算的特征值与特征向量:;总结 主成分的计算步骤:;注意! 教材显示:本例中,利用距平资料和标准化资料计算的前??主成分的方差贡献率相同(都是0.60和0.85),但严格来说二者并不相等,只是接近。利用距平资料和标准化资料算得的方差贡献率并不具有可比性!
本例中之所以二者方差贡献率几乎相同是因为该例中的三个变量(3、4、5月气温)的标准差非常接近,导致协方差阵与相关阵几乎成比例。;主成分的计算 图例;X;第五章3 经验正交函数分解;因为L是正交矩阵(即LTL=LLT=I),所以,将上式左乘L,可得:;将资料阵X分解为空间函数和时间系数相乘的形式,称为:
X的“经验正交函数分解” (Empirical Orthogonal Function (EOF) decomposition),用于考察气象要素的时空分布特征。;空间函数值的性质;气象要素场的估计;每个li都是单位化的,但时间序列yi却是按方差从大到小排列的,即越前面的X (i) 就越重要(总方差越大),
如果取前p个EOF模态(主成分),即L前p列, Y取前p行(p=m), 这时就得到对原资料阵X的一种估计(重构):记为
;对X估计的精确程度,可采用实测值与估计值之间的残差平方和来度量,即:;30个变量,50次观测(m=30, n=50),得距平资料阵X:;l1;利用前p个EOF模态( p=1, 2, 10, 50) 对原图进行重构(估计):;高圆圆、赵又廷 11月28日在台北举行婚礼;实际应用 热带印度洋海表面温度年际异常的EOF分解;热带印度洋海温EOF第二模态;是否可使空间向量或时间系数数值具备物理意义?;;调整前后的EOF-1(印度洋海温异常);利用EOF对我国汛期降水分型P156,图5.2;;应用扩展:多变量EOF分解(Multi-variable EOF(MV-EOF);或称combined EOF(联合EOF));进行MV-EOF的k个气象要素的空间点数可以不一致
例如空间点数分别为m1,m2, …, mk ( m1+m2 + … + mk =m ), 都同时进行了n次观测,则需要把各气象要素按照一定的顺序在空间维罗列,排成m行n列的矩阵X。;例: 右图所示为东亚地区夏季(1979-2006年)降水、850-hPa风场、海平面气压(SLP)场、200-hPa风场的MVEOF第一模态空间向量以及时间系数
文档评论(0)