- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
__协方差与相关系数
* * 前面我们介绍了随机变量的数学期望和方差,对于多维随机变量,反映分量之间关系的数字特征中,最重要的,就是现在要讨论的 协方差和相关系数 上页 下页 返回 结束 在讨论这个问题之前,我们先看一个例子。 在研究子女与父母的相象程度时,有一项是关于父亲的身高和其成年儿子身高的关系. 上页 下页 返回 结束 这里有两个变量,一个是父亲的身高,一个是成年儿子身高. 为了研究二者关系. 英国统计学家皮尔逊收集了1078个父亲及其成年儿子身高的数据, 画出了一张散点图. 上页 下页 返回 结束 那么要问:父亲及其成年儿子身高是一种什么关系呢? 类似的问题有: 吸烟和患肺癌有什么关系? 受教育程度和失业有什么关系? 上页 下页 返回 结束 高考入学分数和大学学习成绩有什么关系? 为了研究诸如此类的两变量的相互关系问题,我们需要从理论上对两变量的相互关系加以研究. 上页 下页 返回 结束 这一讲就来讨论这个问题. 上页 下页 返回 结束 任意两个随机变量ξ和η的协方差,记为Cov(ξ,η), 定义为 ⑶ Cov(ξ+η,ζ)= Cov(ξ,ζ) + Cov(η,ζ) ⑴ Cov(ξ,η)= Cov(η,ξ) (一)、协方差 2.简单性质 ⑵ Cov(aξ,bη) = ab Cov(ξ,η) a,b是常数 Cov(ξ,η)=E(ξ-Eξ) (η-Eη) 1.定义3.5 上页 下页 返回 结束 Cov(ξ,η)=E(ξη) -Eξ?Eη 可见,若ξ与η独立, Cov(ξ,η)= 0 . 3. 计算协方差的一个简单公式 由协方差的定义及期望的性质,可得 =E(ξη)-EξEη-EηEξ+EξEη =E(ξη)-EξEη 即 Cov(ξ,η)=E(ξ-Eξ) (η-Eη) 上页 下页 返回 结束 若ξ1,ξ2, …,ξn两两独立,,上式化为 D(ξ+η)= Dξ+Dη+ 2Cov(ξ,η) 4. 随机变量和的方差与协方差的关系 常用上式计算相依随机变量和的方差. 上页 下页 返回 结束 协方差的大小在一定程度上反映了X和Y相互间的关系,但它还受ξ与η本身度量单位的影响. 例如: Cov(kξ, kη)=k2Cov(ξ,η) 为了克服这一缺点,对协方差进行标准化: 这就引入了相关系数 . 上页 下页 返回 结束 二、相关系数 为随机变量ξ和η的相关系数 . 定义: 设D(ξ)0, D(η)0, 称 在不致引起混淆时,记 为 . 上页 下页 返回 结束 相关系数的性质: 证: 由方差的性质和协方差的定义知, 对任意实数b,有 0≤D(η-bξ)= b2Dξ+Dη-2b Cov(ξ,η) 令 ,则上式为 D(η-bξ)= 由于方差D(η)是正的,故必有 1- ≥ 0, 所以 | |≤1. 上页 下页 返回 结束 2. ξ和η独立时, =0,但其逆不真. 由于当ξ和η独立时,Cov(ξ,η)= 0. 故 = 0 但由 并不一定能推出ξ和η 独立. 请看下例. 上页 下页 返回 结束 例1 设X服从(-1/2, 1/2)内的均匀分布,而 Y=cos X, (请课下自行验证) 因而 =0, 即X和Y不相关 . 但Y与X有严格的函数关系, 即X和Y不独立 . 不难求得, Cov(X,Y)=0, 上页 下页 返回 结束 存在常数a,b(b≠0), 使P{Y=a+bX}=1, 即X和Y以概率1线性相关. 上页 下页 返回 结束 考虑以X的线性函数a+bX来近似表示Y, 以均方误差 e =E{[Y-(a+bX)]2} 来衡量以a+bX近似表示Y的好坏程度, e值越小表示 a+bX与Y的近似程度越好. 用微积分中求极值的方法,求出使e 达到最小时的a,b . 相关系数刻划了X和Y间“线性相关”的程度. 上页 下页 返回 结束 =E(Y2)+b2E(X2)+a2- 2bE(XY)+2abE(X) - 2aE(Y) e =E{[Y-(a+bX)]2 } 解得 这样求出的最佳逼近为 L(X)=a0+b0X 上页 下页 返回 结束 这样求出的最佳逼近为L(X)=a0+b0X 这一逼近的剩余是 若 =0, Y与X无线性关系; Y与X有严格线性关系; 若 可见, 若0| |1, | |的值越接近于1,
您可能关注的文档
最近下载
- 我的家庭故事(课件)五年级上册综合实践活动辽师大版.pptx
- XX集团财务共享中心绩效管理办法(含附件绩效评分表).docx
- 八年级道德与法治上册第四课《社会生活讲道德》PPT课件.ppt VIP
- 全册(导学案)人教PEP版英语四年级下册.docx VIP
- 2023入团团史团章考试精选100题题库(含答案).pdf
- 多维阅读第15级—Skycar 会飞的汽车.pptx VIP
- GB/T 39552.2-2020太阳镜和太阳镜片 第2部分:试验方法.pdf
- 2024年河北省继续医学教育公共必修课参考答案.docx VIP
- 中建八局西北公司质量通病防治手册(机电安装篇).docx VIP
- 大头鱼上学记.pptx VIP
文档评论(0)