- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
概率论与数理统计-协方差和相关系数2
§3 协方差和相关系数 Covariance and 一、协方差 二、相关系数 (correlation coefficient) 设(X,Y)是一随机向量,当D(X)0, D(Y)0,则称数值 三、几个常用的数字特征 1、矩 (moment) : 2、协方差矩阵 (了解) ①二维r.v(X,Y)有四个二阶中心矩即cov(X,X) 、cov(X,Y) 、cov(Y,X) 、cov(Y,Y),将它们排成矩阵 称为X,Y的协方差矩阵. 小结: 征 = = 数 字 特 * (1)定义:D(X)= 1. 设C是常数,则D(C)=0; 2. 若k是常数,则D(kX)=k2 D(X); 3. 若X1与X2 独立,则D(X1+X2)= D(X1)+D(X2); 复习:方差 (2)计算: 方法2: 方法1:由定义 (3)性质: 一般地: D(X1+X2)= D(X1)+D(X2) + 2 E{[X-E(X)] [Y-E(Y)]}。 (3)泊松分布: (1)(0-1)分布: D(X)=p (1-p ) (2) 二项分布: D(X)=np(1-p) D(X)= (4)正态分布: (5)均匀分布: D(X)= D(X)= (6) 指数分布 (4)常见分布的方差: (5) 切比雪夫不等式 设r.vX具有均值E(X)=? ,方差D(X)=?2,则对?? 0 ,有不等式 证明:根据数学期望与方差的性质: 证明E(Y)=0,D(Y)=1 P99T10: 设E(X),D(X)均存在,且D(X) ≠0 通常把由 r.v X 构造r.v Y的过程叫做对r.v X 标准化。 注意:更重要的是要知道如何将一个随机变量标准化. correlation coefficient 若X、Y相互独立 说明 ①对于r. vX,Y, D(X+Y)=D(X)+D(Y)+2Cov(X,Y) ② Cov(X,Y)=0, Cov(X,X)=D(X); Cov(X,k)=0. E(XY)=E(X)E(Y)+Cov(X,Y) 对于向量X和Y,期望和方差只反映了变量各自的情况,没有相互之间的关系。 若X、Y相互独立, E{[X-E(X)][Y-E(Y)]}=0, 因此 E{[X-E(X)][Y-E(Y)]} 在一定程度上反映了X与Y之间的关系,称为X与Y的协方差。 1)用定义式 Cov(X,Y)= E{[X-E(X)][Y-E(Y)]} 2、计算方法 2)用简单公式 Cov(X,Y)=E(XY)-E(X)E(Y) 为X与Y的协方差,记作Cov(X,Y),即 设(X,Y)是一随机向量,称E{[X-E(X)][Y-E(Y)]} Cov(X,Y)= E{[X-E(X)][Y-E(Y)]} 1、定义: Y X -1 0 1 -1 0 0 例1 设r.vX和Y的联合分布律为 求Cov(X,Y) 解: 用公式 Cov(X,Y)=E(XY)-E(X)E(Y) ①可求出(X,Y)关于X,Y的边缘分布律 X -1 0 3/8 2/8 3/8 1 Y -1 0 3/8 2/8 3/8 1 ② ∴ Cov(X,Y)=0-0=0 说明:虽然Cov(X,Y)=0,但 即X与Y不独立。 3、性质ⅰ) Cov(X,Y)=Cov(Y,X);(对称性) ⅱ) Cov(aX,bY)=abCov(X,Y), a,b是任意常数; ⅲ) Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y) 注: 协方差的大小在一定程度上反映了X和Y相互间的关系, 但它还受X与Y本身的系数影响. 例如: Cov(10X, 10Y)=100Cov(X,Y) 为了克服这一缺点,在计算协方差时,先对X与Y进行标准化.即: 实际上,10X与10Y之间的关系和X与Y之间的关系应一致。 标准化的协方差称为X,Y的相关系数 为X,Y的线性相关系数,简称相关系数. 注: 1、定义: ⑴ 相关系数是标准化的随机变量X*,Y*的协方差。 ⑵ ρXY 没有单位,只与两个r.v有关,能更好地反映X与Y之间的关系。 2、性质: 相关系数刻划了X和Y间“线性相关”的程度. 将e视为关于a,b的二元函数,求驻点: 解得 (*) 1)成立。 2)成立。 要使Y与某个a+bX最为接近,就是要找a,b使得误差平方e值最小. 证: e=E{[Y-(a+bX)]2}=E(Y2)+b2E(X2)+a2 -2bE(XY)+2abE(X)-2aE(Y) 对任意的a,b,令 刻画了Y与a+bX的偏离程度 若 =
文档评论(0)