应用统计学-相关与回归分析课件.ppt

  1. 1、本文档共52页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
应用统计学-相关与回归分析课件.ppt

y x2 y2 xy 100 105 130 145 170 175 190 190 220 235 0.81 1.00 1.44 1.96 2.25 2.56 2.89 3.24 3.61 4.00 10000 11025 16900 21025 28900 30625 36100 36100 48400 55225 90 105 156 203 255 280 323 342 418 470 1660 23.76 294300 2642 炉次 x 1 2 3 4 5 6 7 8 9 10 ? 0.9 1.0 1.2 1.4 1.5 1.6 1.7 1.8 1.9 2.0 15.0 原始数据加工表 于是: 所以: 故精炼时间关于含碳量的回归方程为: y= ?14.9525+120.635x ? 计算结果表明,这个方程显示着钢水溶液的含碳量每增加0.1%,则精炼时间平均来说大约要延长12.06分。 根据回归方程,可以给出自变量的任一数值估计或预测因变量的平均可能值。 y=?14.9525+120.635?2.2=150.4445(分) ? 例如,求含碳量2.2%所需的精炼时间: 二、估计平均误差 回归方程的一个重要作用在于根据自变量的已知值估计因变量的可能值。这个估计值和真正的实际值可能一致,也可能不一致。例如,当含碳量为1.8%时,推算的炼钢时间为202.19分钟,而实际为190分钟,相差12.19分钟。这就产生了估计公式即回归方程的可靠性问题,也就是说,根据回归方程计算的估计值,其代表性如何? 为了度量估计公式即回归方程的可靠性,通常计算估计平均误差。估计平均误差度量观察值回绕着回归直线的变化程度或分散程度。通常用Sy代表估计平均误差,其计算公式为: 注意,公式中根号内的分母是n?2, 而不是n。这是由于Q=?(y?y)2有两个线性关系的约束,一是 , 一是   , 因而, Q=?(y?y)2的自由度为n?2。 ? ? 当实际观测值很多,而且数值较大时,根据上述公式计算估计平均误差十分麻烦。借助下列公式,可以简化计算步骤,所得计算结果也相一致。 估计平均误差是一个衡量回归方程代表性大小的分析指标。估计平均误差愈大,则数据点围绕回归直线的分散程度就愈大,回归方程的代表性愈小。估计平均误差愈小,则数据点围绕回归直线的分散程度愈小,回归方程的代表愈大,其可靠性愈高。 §3.相关系数 相关分析是用以说明变量之间相关程度的统计工具。相关分析常常与回归分析联合使用,以衡量回归方程所表示的因变量变化的精确度如何。相关分析也可单独用于衡量变量之间的联系程度。本节我们讨论两个变量之间线性相关程度问题。两个变量之间线性相关程度的描述通常采用相关系数。 一、相关系数的意义 我们回过头来考察一下线性回归中指标 y的值yi与回归估计值 yi 的离差平方和。 ? 记 于是有:Q=Lyy(1?r2) r称为相关系数。它是在线性相关条件下用来说明两个变量之间相关关系密切程度的指标。 因为Q≥0,Lyy≥0,故相关系数有一个重要性质: |r| ≤1 r= ? 1 (1) ?1 r =0 (2) r=0 (3) r=0 (4) 0r1 (5) r=1 (6) 相关图与相关系数经验关系 由于Lyy对于一组实测数据来讲是定值,故由Q=Lyy(1?r2)可知,当|r|较大接近于1时,离差平方和Q就较小而接近于0,此时,y与x高度相关。特别当|r|=1时,称它们是完全相关的,上图(1)、(6)所示。当|r|较小而接近于0时,Q就大,y与x的相关关系很弱,特别当 r=0时,称它们线性无关。如上图 (3)、(4)所示 由于Lxy可正可负,所以相关系数r也可正可负。若r>0则称y与x正相关,如上图(5)、(6)所示。此时,随着x的增大(或减小),y将呈现增大(或减小)的趋势。特别对于上图(6)的情形,由于r=1,故称完全正相关。若r0,则称y与x负相关,如上图(1)、(2)所示。此时,随着x的增大(或减小),y将呈现减小(或增大)的趋势。特别对于图(1)的情形。由于r= ?1,故称为完全负相关。 应当注意,相关系数r只表明x与y之间的线性关系的密切程度和方向。当r很小甚至为0时,只表明x与y之间的线性关系不密切,或不存在线性关系,并不表示x与y之间就没有关系,可能二者之间有非线性关系。如上图 (4)所示,x与y之间就存在着曲线关系。 二、相关系数的计算 我们已经知道,相关系数的公式为: 第二节中我们介绍了离差乘积的和式: 于是有: 如果将分子分母同乘以n,又可得: 根据第二节中炼钢厂钢液含碳量与精炼时间资料,可计算相关系数。那里,我们已经求得: 于是其相关系数为: 计算得出r=0.9892,表明精炼时间和含碳量

文档评论(0)

带头大哥 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档