- 1、本文档共22页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三讲 典型相关分析(安徽农大徐建新版)
第三讲 典型相关分析CANONICAL COORELATION ANALYSIS 对两个变量间的相关性研究,可以通过相关分析,了解其相关程度及性质。而在研究两组变量间的相关关系时,譬如,在研究一组环境因素与畜禽诸生产性能间的相关性时,通常不采用一对一的直接研究,而是把各环境因素当作一个整体,把各生产性能也作为一个整体来研究。这时研究两组变量之间的相关就变为研究两个新的变量之间的相关研究。当然,这两个新的变量分别由各自整体中变量的线性组合所构成,因而不会丢失原来的信息。而且,这两个线性组合具有这样的性质,即由它们所构成的两个新变量之间具有最大的相关。类似地,还可找出由两组变量构成的第二对线性组合,该组合与第一对线性组合不相关,但该对组合间有最大的相关。如此类推,直到两组变量间的相关被分解完毕。这种逐步得到的线性组合称为典型变量,它们之间的相关系数称为典型相关系数,这种分析方法就称为典型相关分析。可见,典型相关分析是研究两组变量间相关关系的一种统计方法。由于它避免了孤立地对两个变量间的研究,因此,分析结果较为全面,且各组中变量个数不受限制,应用十分广泛。 第一节 典型相关系数与典型变量 在实际工作中,我们通常接触到的多为样本资料,对其所在总体的参数常是未知的,所以,对于总体的典型相关系数及典型变量,只能通过样本数据对其估计。以下着重介绍样本典型相关系数及典型变量的计算方法。 第二节 典型相关系数的显著性检验 典型相关系数的显著性检验,可采用Bartlett关于大样本的χ2检验。因为两组变量X1,X2间若不相关,则相关阵R12中皆为零元素,故典型相关系数亦为零,于是可作如下检验: 一、检验步骤 1、做假设 H0:λ1=0 HA :λ1≠0 第三节 典型相关分析的应用实例 * * 一、典型相关系数 设有两组变量X1{x1,x2,…,xp}和X2{xp+1,xp+2,…,xp+q}的n次观察值取自多元正态总体Np+q(μ,∑),样本数据阵为: X=[X1,X2]= 由X计算得协方差阵为∑的最大似然估计。∑可剖分为: 其中∑11,∑22分别为第一组和第二组变量的协方差阵,∑12=∑21为第一组与第二变量之间的协方差阵。 在研究两组随即变量X1,X2的相关时,主要是考虑这两组变量线性组合间的相关。故令: (3—1) 上式分别为X1,X2的任意一个线性组合,其中,αi(i=1,2,…,p),βj(j=1,2,…q)为任意实数。 (3—1)式中的α,β若确定,则U,V便确定。确定α,β的原则是使U,V之间的相关系数ρ达到最大,即 为最大。 假设α,β是这样的向量:能使得U,V都具有单位方差(方差为1)即 (3—2) 此时有 于是问题转化为在方差为1的限制条件下,求使E(U,V)达到最大的α,β。根据求条件极值原理。令 式中λ1,λ2都是拉格朗日乘数。求θ对α,β的一价偏导数。并令其为零,则有: (3—3) 上、下式分别左乘以α′、β′得 : 而 故λ1′=λ2,并且λ1是一实数,转置任为λ1。所以λ1=λ2=λ 这表明,λ恰好等于线性组合U与V之间的相关系数。于是可将(3—3)式改写为 ∑12β-λ∑11α=0 (3—4) ∑21α-λ∑22β=0 (3—5) 对(3—4)左乘 然后将(3—5)代入得 (3—6) 对(3—6)左乘 得 即
文档评论(0)