- 1、本文档共60页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
第六章地理系统要素的主成分分析;问题的提出;§1主成分分析方法的根本原理;当p较大时,在p维空间中考察问题比较麻烦。为了抑制这一困难,就需要进展降维处理.
要求:较少的几个综合指标尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的;例,成绩数据;对于多维变量的状况和二维类似,也有高维的椭球,只不过无法直观地观察
首先把高维椭球的主轴找出来,再用代表大多数数据信息的最长的几个轴作为新变量;这样,主成分分析就根本完成
留意,和二维状况类似,高维椭球的主轴也是相互垂直的。这些相互正交的新变量是原先变量的线性组合,叫做主成分.;正如二维椭圆有两个主轴,三维椭球有三个主轴一样,有几个变量,就有几个主成分
选择越少的主成分,降维就越好。什么是标准呢?那就是这些被选的主成分所代表的主轴的长度之和占了主轴长度总和的大局部。有些文献建议,所选的主轴总长度占全部主轴长度之和的大约85%即可,其实,这只是一个大体的说法;具体选几个,要看实际状况而定;定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm〔m≤p〕为新变量指标;;;特征值与特征向量与
方差--协方差矩阵的联系;数据的中心化;;中心化后的原始数据矩阵;把坐标轴X1、X2刚性地旋转一个角度,得到图中新坐标轴Y1和Y2;6个样方点在新坐标系中位置的数据为:
与中心化后的原始数据有如下关系:;;由
它的取值只依靠于坐标轴旋转角度一个变量,取极大值的必要条件是对θ的导数为0。即
=0
=0;所以上述条件等同于
因此,假设原坐标旋转后的Y1轴是我们要求的使Var(Y1)最大的直线的话,则必定有Var(Y2)最小,且。这说明6个样方点对新坐标的离差矩阵应为;;;;二、主成分分析的几何解释;§2主成分分析的解法;X1;1、方差—协方差的计算;;方差—协方差矩阵为
求特征值
;特征向量的求解
当时,
化为联立方程
求得
同理求得时的特征向量;算出
第一主成分I:特征值为37.9,特征向量为
其次主成分II:特征值为6.5,特征向量为;特征向量的方向由I、II中包括的两个数字掌握
第一主成分Z1的方差为37.9,其次主成分Z2的方差为6.5。两者之和恰为X1和X2的总方差44.4。可见,两个主成分Z1、Z2所代表的信息分别为86%和14%。假设用Z1代表原来的数据,则仅损失信息14%。但假设用X1和X2来代表原来的数据,则将损失信息46%或54%。;3、主成分得分的计算;原始数据的主成分得分;二、主成分分析的步骤;;;计算特征值和特征向量
依据特征方程计算特征值,即解
的特征多项式,求并使特征值按从大到小的挨次排列,即
列出关于每个特征值的特征向量
;计算主成分奉献率及累计奉献率
▲奉献率:;计算主成分载荷(主成分Zk与变量xi之间的相关系数)
;各主成分的得分:
;§3特征值与特征向量的计算方法;二维状况;雅可比法的计算步骤;假设在原始矩阵的对角线以外元素中,以确实定值为最大。设,作一个转轴变换;;;;;;;;例2,依据表1中给出的数据,对某农业生态经济系统做主成分分析;;步骤如下:将表中的数据作标准差标准化处理,然后将它们代入公式计算相关系数矩阵
;〔2〕由相关系数矩阵计算特征值,以及各个主成分的奉献率与累计奉献率〔见表3〕。由表3可知,第一,其次,第三主成分的累计奉献率已高达86.596%〔大于85%〕,故只需要求出第一、其次、第三主成分z1,z2,z3即可。;表3特征值及主成分奉献率;〔3〕对于特征值=4.6610,=2.0890,=1.0430分别求出其特征向量e1,e2,e3,再用公式计算各变量x1,x2,…,x9在主成分z1,z2,z3上的载荷〔表4〕。;表4主成分载荷;①第一主成分z1与x1,x5,x6,x7,x9呈显出较强的正相关,与x3呈显出较强的负相关,而这几个变量则综合反映了生态经济构造状况,因此可以认为第一主成分z1是生态经济构造的代表。
②其次主成分z2与x2,x4,x5呈显出较强的正相关,与x1呈显出较强的负相关,其中,除了x1为人口总数外,x2,x4,x5都反映了人均占有资源量的状况,因此可以认为其次主成分z2代表了人均资源量;明显,用三个主成分z1、z2、z3代替原来9个变量〔x1,x2,…,x9〕,描述农业生态经济系统,可以使问题更进一步简化、明白
文档评论(0)