网站大量收购独家精品文档,联系QQ:2885784924

数据分析论文(Notebook)..doc

  1. 1、本文档共11页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
数据分析论文(Notebook).

典型相关分析在居民家庭人均收入与支出指标中的应用 摘要:现阶段居民家庭的经济状况对分析我省各个城市的经济水平具有重要的代表性,通过使用典型相关分析的原理和方法,对2011年辽宁省14个大中城市居民家庭人均收入与支出指标数据之间的关系进行了分析和比较研究,得出了各个城镇居民收入与支出的主要构成因素。 关键词:典型相关分析 相关系数 组合系数 巴泰勒特检验 收入与支出指标 1 引言 随着我国经济建设的发展,城市居民家庭的收入与支出受到越来越多的重视。如何提高居民家庭的生活质量,达到真正的富裕生活,一直是领导人不断研究的问题。本文采用多元分析中的典型相关分析方法,根据居民家庭的收入与支出情况,给出了评价指标,并与之前的数据进行比对。 2 典型相关分析的基本介绍 2.1 典型相关分析的基本思想 典型相关分析(canonical correlation analysis,CCA)基本思想是类似于主成分分析法中把多变量与多变量之间的相关化为两个变量之间相关的做法,首先在每组变量内部找出具有最大相关性的一个线型变量组合,然后在每组变量内找出第二对线性组合,使其本身具有最大的相关性,并分别与第一对线性组合不相关。如此下去,直到两组变量内个变量之间的相关性被提取完毕为止。有了这些最大相关的线性组合,在讨论两组变量之间的相关,就转化为研究这些线性组合的最大相关,从而减少了研究变量的个数。 2.2 典型相关分析的基本原理 设有两随机变量组=(,,…,)和=(,,…,),不妨设p≤q.对于,,不妨设第一组变量的均值和协方差矩阵为 E(X)= Cov(X)= 第二组变量的均值和协方差矩阵为 E(Y)= Cov(Y)= 第一组与第二组变量的协方差矩阵为 Cov(X,Y)== 对于矩阵Z=[X Y] 有均值向量 μ=E(Z)=E[E(X) E(Y)]=[ ] 协方差矩阵=E(Z-μ)(Z-μ)′ = = 要研究两组变量,,…,和,,…,之间的相关关系,首先分别作两组变量的线性组合,即 U= =(,,…,)′, =(,,…,)′分别为任意非零常系数向量,则可得, Var(U)=a′Cov(X)a=a′ Var(V)=b′Cov(Y)b=b′ Cov(U,V)=a′Cov(X,Y)b=a′ 则称U与V为典型变量,它们之间的相关系数ρ称为典型相关系数,即 ρ=Corr(U,V)= 典型相关分析研究的问题是,如何选取典型变量的最优线性组合.选取原则是:在所有的线性组合U和V中,选取典型相关系数为最大的U和V,即选取和使得=与之间的相关系数达到最大(在所有的U和V中),然后选取和使得与的相关系数在与和不相关的组合U和V中最大,继续下去,直到所有分别与,,…,和,,…,,都不相关的线性组合,为止。此时p等于诸变量X与Y之间的协方差矩阵的秩. 典型变量和,和……和是根据它们的相关系数由大到小逐对提取,直到两组变量之间的相关性被分解完毕为止. 2.3 典型相关分析的应用 典型相关分析的用途很广.在实际分析问题中,当我们面临两组多变量数据,并希望研究两组变量之间的关系时,就要用到典型相关分析. 2.4 典型相关系数的检验 典型相关系数显著性检验,主要采用的是巴泰勒特(Bartlett)关于大样本的检验. 如果两组变量X和Y之间互不相关,则协方差矩阵仅包含零,因而典型相关系数都变为零.为此, 即Cov(X,Y)=0 对于矩阵A的p特征值,按照大到小排列为,这时作乘积: 其中是A=的特征根。 对于当n充分大,成立时,统计量 近似服从pq个自由度的分布,若在给定的显著性水平下,,则拒绝原假设相关性,相关系数为,第一个典型相关系数为显著的. 接下来,为检验其余的典型相关系数的显著性,先将剔出,在作乘积, 作统计量为 它近似服从自由度为的分布,若在给定的显著性水平下, ,则拒绝原假设认为显著,即第二对典型相关变量具有相关性. 如此进行下去,直至到第k个典型相关系数检验为不显著时,即第k对典型变量不具有相关性时停止. 2.5 典型相关分析计算步骤 2.5.1 原始数据矩阵 2.5.2 对原始数据进行标准化变化并计算相关系数矩阵 其中,分别为第一组变量和第二组变量的相关系数矩阵,=′为第一组变量和第二组变量的相关系数. 2.5.3 求典型相关系数和典型变量 计算矩阵以及矩阵的特征值和特征向量,分别得典型相关系数和典型变量. 2.5.4 检验各典型相关系数的显著性 3 对所选取的实例进行典型相关分析 3.1 2011年辽宁省14个大中城市居民家庭人均收入与支出 元 城市 收入 支出 工薪 经营 财产 转移 食品

文档评论(0)

s4as2gs2cI + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档