典型相关分析2.ppt

  1. 1、本文档共90页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
典型相关分析2.ppt

典型相关分析 典型相关是研究两组变量之间相关性的一种统计分析方法。也是一种降维技术。 由Hotelling (1935, 1936)最早提出,Cooley and Lohnes (1971)、 Kshirsagar (1972)和 Mardia, Kent, and Bibby (1979) 推动了它的应用。 典型相关分析 一、典型相关分析及基本思想 二、典型相关的数学描述 三、典型变量的性质 四、样本典型相关系数 五、典型相关系数的检验 六、典型相关分析的应用 问 题 1985年中国28 省市城市男生(19~22岁)的调查数据。记形态指标身高(cm)、坐高、体重(kg)、胸围、肩宽、盆骨宽分别为X1,X2,…,X6;机能指标脉搏(次/分)、收缩压(mmHg) 、舒张压(变音)、 舒张压(消音)、肺活量(ml)分别为Y1,Y2,…,Y5。现欲研究这两组变量之间的相关性。 实例(X与Y地位相同) 一、典型相关分析及基本思想 通常情况下,为了研究两组变量 的相关关系,可以用最原始的方法,分别计算两组变量之间的全部相关系数,一共有pq个简单相关系数,这样又烦琐又不能抓住问题的本质。如果能够采用类似于主成分的思想,分别找出两组变量的各自的某个线性组合,讨论线性组合之间的相关关系,则更简捷。 例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量: 典型相关分析示意图 二、典型相关的数学描述 考虑两组变量的向量 如果我们记两组变量的第一对线性组合为: (二)典型相关系数和典型变量的求法 利用柯西不等式有 记m为?12的秩,则 由特征向量可以构成一个正交矩阵T,有 若取 第一对典型相关变量提取了原始变量x组和y组之间相关的主要部分,那么这部分的信息不够,则还可以在剩余相关中提取第二对典型变量: 求 当取 注 有相同的特征根,而可以验证: 在剩余的相关中再求出第二对典型变量和他们的典型相关系数。设第二对典型变量为: 例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量: 三、典型变量的性质 1、同一组的典型变量之间互不相关 2、不同组的典型变量之间相关性 不同组内一对典型变量之间的相关系数为: 3、原始变量与典型变量之间的相关系数 原始变量相关系数矩阵 例 家庭特征与家庭消费之间的关系 为了了解家庭的特征与其消费模式之间的关系。调查了70个家庭的下面两组变量: 第二对典型变量中u2与x2的相关系数为0.4614,可以看出u2可以作为文化消费特性的指标,第二对典型变量中v2与Y1和Y3之间的分别相关系数为0.8464和0.3013,可见典型变量v2主要代表了家庭成员的年龄特征和教育程度, u2和 v2的相关系数为0.1869,说明文化消费与年龄和受教育程度之间的有关。 4、各组原始变量被典型变量所解释的方差 X组原始变量被ui解释的方差比例 5、简单相关、复相关和典型相关之间的关系 若p=1且q=1,则x和y的典型相关就是简单相关; 若p=1或q=1,则x和y的典型相关就是复相关; 四、样本典型相关系数 在实际应用中,总体的协方差矩阵常常是未知的,类似于其他的统计分析方法,需要从总体中抽出一个样本,根据样本对总体的协方差或相关系数矩阵进行估计,然后利用估计得到的协方差或相关系数矩阵进行分析。由于估计中抽样误差的存在,所以估计以后还需要进行有关的假设检验。 1、假设有X组和Y组变量,样本容量为n。观测值矩阵为: 2、计算特征根和特征向量 求M1和 M2的特征根 ,对应的特征向量 。则特征向量构成典型变量的系数,特征根为典型变量相关系数的平方。 五、典型相关系数的检验   典型相关分析是否恰当,应该取决于两组原变量之间是否相关,如果两组变量之间毫无相关性而言,则不应该作典型相关分析。用样本来估计总体的典型相关系数是否有误,需要进行检验。 由于 所以若M的特征根为? ,则(l-M)的特征根为(1-?)。根据矩阵行列式与特征根的关系,可得: 在原假设为真的情况下,检验的统计量

文档评论(0)

docindoc + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档