网站大量收购闲置独家精品文档,联系QQ:2885784924

数理统计课件81-2课件.pptVIP

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数理统计课件81-2课件.ppt

相关系数R(样本相关系数) 一、多元线性回归的数学模型 二、回归系数的最小二乘估计 三、回归方程和回归系数的显著性检验 数学的一个重要任务是从数量方面分析、揭示、表达现实世界中普遍地存在着的变量之间的关系。一般来说,变量之间的关系可分为两类: 1. 确定性的函数关系:已知一个(或几个)变量的值,就可以精确地求出另一个变量的值。如 V = 4/3?R3,S = V t 2. 非确定性的相关关系:几个变量之间存在着密切的关系,但不能由一个(或几个)变量的值精确地求出另一个变量的值。在相关关系中至少有一个变量是随机变量。如人的血压与年龄,环境因子与农作物的产量,树木的直径与高度,人均收入与商品的销量,商品的价格与消费者的需求量。 回归分析是研究变量之间的相关关系的一种统计方法。回归(regression)这一术语是1886年高尔顿(Galton)研究遗传现象时引进的。 本章仅简单介绍一元线性回归分析和多元线性回归分析。 8.2 回归分析 例1 以家庭为单位,某商品年需求量与其价格之间的调查数据如下: 价格x(元) 1 2 2 2.3 2.5 2.6 2.8 3 3.3 3.5 需求量y(500g) 5 3.5 3 2.7 2.4 2.5 2 1.5 1.2 1.2 1. x与y之间是相关关系,不能用解析表达式 y = f(x) 表示。 2. 作散点图。发现这些点分布在一条直线附近。 一元线性回归 yi=β0+β1xi+ ? i (i =1,2,…,n) 3. 把y 看成是由两部分叠加而成:一是x的线性式β0+β1x;二是由随机因素引起的误差? 。于是有 y =β0+β1x+? (1) 假定?i 相互独立,且? i ~ N(0, ? 2) 。称(1)式为线性回归的数学模型。 4. 为估计未知参数β0 、β1,将观测值(xi,yi)代入得 称它们为正规(正则)方程。解正规方程得 选取bi使残差平方和Q最小: 则 即 记 则 一、β0,β1的最小二乘估计 设 b0 ,b1分别为β0,β1的估计值, 即 整理得 记 则 得到经验回归方程 但当假定 y =β0+β1x+ε 不成立时,求得的经验回归方程是无意义的。所以,要检验 “y与x 存在线性关系” 这一假设。 实际上,对任何一组数据都可以用上述方法配一条直线。因此,必须判断y与x 是否真的存在线性相关关系。 欲检验假设 H0: β1= 0 0 SR Se 于是 总平方和 剩余平方和 回归平方和 当 F >F?(1,n-2)时,拒绝H0 二、回归问题的统计检验 即 Syy = SR + Se t 检验: ~ t(n-2 ),当 t> t?(n-2) 时拒绝H0 查相关系数表得临界值R?(n-2),当 |R|> R?(n-2) 时拒绝H0 查F分布表得临界值F?(1, n-2),当 F> F?(1, n-2) 时拒绝H0 三、预报和控制 所谓预报问题,就是问当x=x0时y应取何值。很自然地想到用 来预报y的真实值y0=β0+β1x0+ε,由于y是随机变量,给出y0的区间估计更为合理。通常是在一定的置信度1-α下,给出y0的容许限或y0的预报区间。 不难证明,当一元线性回归的基本假定成立时,统计量 其中, 为σ的估计。 因此,得到的置信度为1-α的预报区间为 2将曲线问题线性化 本节主要介绍一元线性回归分析中将曲线问题线性化的方法,本节涉及的几条曲线都是初等数学中的常见曲线,无复杂和困难的地方,故本节内容让同学们自学,不再赘述。 值得注意的是,模型 y=?0+?1x+?2x2+ ?pxp 是所谓的多项式回归,令 x1=x, x2=x2, xp=xp, 则有 y=?0+?1x+?2x2+ ?pxp 这就是§10.3中要介绍的多元线性回归问题。 将n次观测数据(xi1,x12,…,xip,yi),i=1,2,…,n代入上面的方程,可得多元线性回归的数学模型: 设因变量y与p个自变量x1,…,xp之间有线性关系: 假定ε1,ε2,…,εn相互独立,且服从同一正态分布N(0,σ2)。 其中ε为随机变量,称为随机误差。 3 多元线性回归 这里ei是?i的估计值,仍称为残差或剩余。令 为yi的估计值,即

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档