网站大量收购闲置独家精品文档,联系QQ:2885784924

【统计学】一元线性回归模型(精品·公开课件).ppt

【统计学】一元线性回归模型(精品·公开课件).ppt

  1. 1、本文档共97页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
§2.6 实例及时间序列问题 说明 本节列举了两个一元线性回归模型实例,完成了建立模型、估计参数、统计检验和预测的过程。 适合于课堂演示或者由学生在计算机上完成。 从理论上讲,经典线性回归模型理论是以随机抽样的截面数据或者平稳的时间序列数据为基础的。对于非平稳时间序列数据,存在理论方法方面的障碍。如何处理?本书第8章将专门讨论。在2—7章中大量采用非平稳时间序列数据作为实例,暂时不考虑理论方法方面的障碍。 一、拟合优度检验 Goodness of Fit, Coefficient of Determination 1、回答一个问题 拟合优度检验:对样本回归直线与样本观测值之间拟合程度的检验。 问题:采用普通最小二乘估计方法,已经保证了模型最好地拟合了样本观测值,为什么还要检验拟合程度? 2、总离差平方和的分解 Y的i个观测值与样本均值的离差 由回归直线解释的部分 回归直线不能解释的部分 离差分解为两部分之和 对于所有样本点,则需考虑离差的平方和: 记 总体平方和(Total Sum of Squares) 回归平方和(Explained Sum of Squares) 残差平方和(Residual Sum of Squares ) TSS=ESS+RSS Y的观测值围绕其均值的总离差(total variation)可分解为两部分:一部分来自回归线(ESS),另一部分则来自随机势力(RSS)。 在给定样本中,TSS不变, 如果实际观测点离样本回归线越近,则ESS在TSS中占的比重越大,因此 拟合优度:回归平方和ESS/Y的总离差TSS 3、可决系数R2统计量 是一个非负的统计量。取值范围:[0,1] 越接近1,说明实际观测点离回归线越近,拟合优度越高。 随着抽样的不同而不同。为此,对可决系数的统计可靠性也应进行检验,这将在第3章中进行。 二、变量的显著性检验 Testing Significance of Variable 说明 在一元线性模型中,变量的显著性检验就是判断X是否对Y具有显著的线性性影响。 变量的显著性检验所应用的方法是数理统计学中的假设检验。 通过检验变量的参数真值是否为零来实现显著性检验。 1、假设检验(Hypothesis Testing) 所谓假设检验,就是事先对总体参数或总体分布形式作出一个假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定是否接受或否定原假设。 假设检验采用的逻辑推理方法是反证法。先假定原假设正确,然后根据样本信息,观察由此假设而导致的结果是否合理,从而判断是否接受原假设。 判断结果合理与否,是基于“小概率事件不易发生”这一原理的。 2、变量的显著性检验—t检验 用σ2的估计量代替,构造t统计量 对总体参数提出假设:H0:?1=0,H1:?1?0 由样本计算t统计量值; 给定显著性水平(level of significance)?,查t分布表得临界值(critical value)t ?/2(n-2); 比较,判断: 若 |t| t ?/2(n-2),则以(1-α)的置信度(confidence coefficient)拒绝H0 ,接受H1 ; 若 |t|? t ?/2(n-2),则以(1-α)的置信度不拒绝H0 。 自学教材p48例题,学会检验的全过程。 3、关于常数项的显著性检验 T检验同样可以进行。 一般不以t检验决定常数项是否保留在模型中,而是从经济意义方面分析回归线是否应该通过原点。 三、参数的置信区间 Confidence Interval of Parameter 1、概念 回归分析希望通过样本得到的参数估计量能够代替总体参数。 假设检验可以通过一次抽样的结果检验总体参数可能的假设值的范围(例如是否为零),但它并没有指出在一次抽样中样本参数值到底离总体参数的真值有多“近”。 要判断样本参数的估计值在多大程度上“近似”地替代总体参数的真值,需要通过构造一个以样本参数的估计值为中心的“区间”,来考察它以多大的可能性(概率)包含着真实的参数值。这种方法就是参数检验的置信区间估计。 如果存在这样一个区间,称之为置信区间; 1-?称为置信系数(置信度)(confidence coefficient), ?称为显著性水平;置信区间的端点称为置信限(confidence limit)。 2、一元线性模型中?i 的置信区间 T分布为双尾分布 (1-?)的置信度下, ?i的置信区间是 在上述收入-消费支出例题中,如果给定? =0.01,查表得: 由于 于是,?1、?0的置信区间分别为: (0.6056,0.7344)

您可能关注的文档

文档评论(0)

花好月圆 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档