__协方差与相关系数.pptVIP

  1. 1、本文档共35页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
__协方差与相关系数

* * 前面我们介绍了随机变量的数学期望和方差,对于多维随机变量,反映分量之间关系的数字特征中,最重要的,就是现在要讨论的 协方差和相关系数 上页 下页 返回 结束 在讨论这个问题之前,我们先看一个例子。 在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关系. 上页 下页 返回 结束 这里有两个变量,一个是父亲的身高,一个是成年儿子身高. 为了研究二者关系. 英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据, 画出了一张散点图. 上页 下页 返回 结束 那么要问:父亲及其成年儿子身高是一种什么关系呢? 类似的问题有: 吸烟和患肺癌有什么关系? 受教育程度和失业有什么关系? 上页 下页 返回 结束 高考入学分数和大学学习成绩有什么关系? 为了研究诸如此类的两变量的相互关系问题,我们需要从理论上对两变量的相互关系加以研究. 上页 下页 返回 结束 这一讲就来讨论这个问题. 上页 下页 返回 结束 任意两个随机变量ξ和η的协方差,记为Cov(ξ,η), 定义为 ⑶ Cov(ξ+η,ζ)= Cov(ξ,ζ) + Cov(η,ζ) ⑴ Cov(ξ,η)= Cov(η,ξ) (一)、协方差 2.简单性质 ⑵ Cov(aξ,bη) = ab Cov(ξ,η) a,b是常数 Cov(ξ,η)=E(ξ-Eξ) (η-Eη) 1.定义3.5 上页 下页 返回 结束 Cov(ξ,η)=E(ξη) -Eξ?Eη 可见,若ξ与η独立, Cov(ξ,η)= 0 . 3. 计算协方差的一个简单公式 由协方差的定义及期望的性质,可得 =E(ξη)-EξEη-EηEξ+EξEη =E(ξη)-EξEη 即 Cov(ξ,η)=E(ξ-Eξ) (η-Eη) 上页 下页 返回 结束 若ξ1,ξ2, …,ξn两两独立,,上式化为 D(ξ+η)= Dξ+Dη+ 2Cov(ξ,η) 4. 随机变量和的方差与协方差的关系 常用上式计算相依随机变量和的方差. 上页 下页 返回 结束 协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受ξ与η本身度量单位的影响. 例如: Cov(kξ, kη)=k2Cov(ξ,η) 为了克服这一缺点,对协方差进行标准化: 这就引入了相关系数 . 上页 下页 返回 结束 二、相关系数 为随机变量ξ和η的相关系数 . 定义: 设D(ξ)0, D(η)0, 称 在不致引起混淆时,记 为 . 上页 下页 返回 结束 相关系数的性质: 证: 由方差的性质和协方差的定义知, 对任意实数b,有 0≤D(η-bξ)= b2Dξ+Dη-2b Cov(ξ,η) 令 ,则上式为 D(η-bξ)= 由于方差D(η)是正的,故必有 1- ≥ 0, 所以 | |≤1. 上页 下页 返回 结束 2. ξ和η独立时, =0,但其逆不真. 由于当ξ和η独立时,Cov(ξ,η)= 0. 故 = 0 但由 并不一定能推出ξ和η 独立. 请看下例. 上页 下页 返回 结束 例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X, (请课下自行验证) 因而 =0, 即X和Y不相关 . 但Y与X有严格的函数关系, 即X和Y不独立 . 不难求得, Cov(X,Y)=0, 上页 下页 返回 结束 存在常数a,b(b≠0), 使P{Y=a+bX}=1, 即X和Y以概率1线性相关. 上页 下页 返回 结束 考虑以X的线性函数a+bX来近似表示Y, 以均方误差 e =E{[Y-(a+bX)]2} 来衡量以a+bX近似表示Y的好坏程度, e值越小表示 a+bX与Y的近似程度越好. 用微积分中求极值的方法,求出使e 达到最小时的a,b . 相关系数刻划了X和Y间“线性相关”的程度. 上页 下页 返回 结束 =E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X) - 2aE(Y) e =E{[Y-(a+bX)]2 } 解得 这样求出的最佳逼近为 L(X)=a0+b0X 上页 下页 返回 结束 这样求出的最佳逼近为L(X)=a0+b0X 这一逼近的剩余是 若 =0, Y与X无线性关系; Y与X有严格线性关系; 若 可见, 若0| |1, | |的值越接近于1,

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档