概率论与数理统计4.3协方差及相关系数辩析.ppt

概率论与数理统计4.3协方差及相关系数辩析.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
这一讲我们主要介绍了协方差和相关系数,相关系数是刻划两个随机变量间线性相关程度的重要的数字特征,它取值在-1到1之间. 小 结 例4 设随机变量X和Y相互独立且X~N(1,2), Y~N(0,1). 试求Z=2X-Y+3的概率密度. Y X -1 0 1 0 0.07 0.18 0.15 1 0.08 0.32 0.20 Y X -1 0 1 0 0.07 0.18 0.15 1 0.08 0.32 0.20 解 X与Y的分布律分别为 X -1 0 1 P 0.15 0.5 0.35 Y 0 1 P 0.4 0.6 于是 解 则 于是 解 所以 因此 例4 设随机变量X和Y相互独立且X~N(1,2), Y~N(0,1). 试求Z=2X-Y+3的概率密度. 故X 和Y 的联合分布为正态分布,X 和Y 的任意线性组合是正态分布. 解: X~N(1,2),Y~N(0,1),且 X 与Y 独立, D(Z)=4D(X)+D(Y)=8+1=9 E(Z)=2E(X)-E(Y)+3=2+3=5 即 Z~N(E(Z), D(Z)) 故 Z 的概率密度是 Z~N(5, 32) 目录 上页 下页 结束 概率统计教研室 目录页 上一页 下一页 结束页 一、协方差与相关系数的概念及性质 二、相关系数的意义 三、小结 第三节 协方差及相关系数 协方差和相关系数 1. 问题的提出 一、协方差与相关系数的概念及性质 对于二维随机向量(X,Y)来说,数学期望只反映了X与Y各自的平均值,方差只反映了X与Y各自离开均值的偏离程度,它们对X与Y之间相互关系不提供任何信息. 但二维随机向量(X,Y)的概率密度f(x,y)或分布律pij全面地描述了(X,Y)的统计规律,也包含有X与Y之间关系的信息.我们希望有一个数字特征能够在一定程度上反映这种联系. 在讨论这个问题之前,我们先看一个例子。在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关系。 1. 问题的提出 这里有两个变量,一个是父亲的身高,一个是成年儿子身高.为了研究二者关系,英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据, 画出了一张散点图。 儿子的身高 父亲的身高 问:父亲及其成年儿子身高存在怎样的关系呢? father son 1. 问题的提出 类似的问题有: 1、吸烟和患肺癌有什么关系? 2、受教育程度和失业有什么关系? 3、高考入学分数和大学学习成绩有什么关系? …… ??? 协方差 1. 问题的提出 因此,方差是协方差的特例,协方差刻画两个随机变量之间的“某种”关系. 2. 定义 特别, 若X=Y,则 cov(X,X)=E(X-E(X))2=D(X) 对两个随机向量(X,Y),若 存在,则称 为X和Y的协方差. 对于任意随机变量X与Y,总有 由协方差定义得 这是计算协方差的常用公式. 可见,若X与Y独立,则 Cov(X,Y)= 0 . Cov(X,Y)=E(XY)-E(X)E(Y) 3. 计算 (4) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y) (2) Cov(X,X)=D(X) 4.协方差的性质 (3) Cov(aX,bY)=abCov(X,Y) 其中 a、b是常数 (1) Cov(X,Y)=Cov(Y,X) (对称性) 特别的: Cov(X,c)=0 (c为常数) (5) 若X与Y独立,则 Cov(X,Y)= 0 . 协方差的数值在一定程度上反映了X与Y相互间的联系,但它受X与Y本身数值大小的影响.如令X*=kX, Y*=kY,这时X*与Y*间的相互联系和X与Y的相互联系应该是一样的,但是 Cov(X*,Y*)=k2Cov(X,Y) 为了克服这一缺点,在计算X与Y的协方差之前,先对X与Y进行标准化: 再来计算X*和Y*的协方差,这样就引进了相关系数的概念. 为随机变量X和Y的相关系数 (correlation confficient). 1.定义:若D(X)0, D(Y)0,且Cov(X,Y)存在时,称 在不致引起混淆时,记 为 . 二、相关系数 考虑以X的线性函数a+bX来近似表示Y.以均方误差 e=E{[Y-(a+bX

文档评论(0)

希望之星 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档