[数学]5-1一元线性回归 3.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[数学]5-1一元线性回归 3

第五章 回归分析 一元线性回归模型 (基本假定) 自变量 x 的取值是固定的,即假定 x是非随机的 误差项ε是一个服从正态分布的随机变量,且相互独立。即ε~N(0 ,σ2 ) 残 差 因变量的观测值与根据估计的回归方程求出的预测值之差,用 e 表示 反映了用估计的回归方程去预测而引起的误差 用残差证实模型的假定 残 差 图 表示残差的图形 关于 x 的残差图 关于 y 的残差图 标准化残差图 用于判断误差 ? 的假定是否成立 检测有影响的观测值 残差与标准化残差图 (例题分析) 残 差 图 (例题分析) 标准化残差 残差除以它的标准差 也称为Pearson残差或半学生化残差(semi-studentized residuals) 计算公式为 标准化残差图 ? 用以直观地判断误差项服从正态分布这一假定是否成立 若假定成立,标准化残差的分布也应服从正态分布 在标准化残差图中,大约有95%的标准化残差在-2到+2之间 (例题分析) 用残差检测异常值和 有影响的观测值 异常值 如果某一个点与其他点所呈现的趋势不相吻合,这个点就有可能是异常点,或称为野点 如果异常值是一个错误的数据,比如记录错误造成的,应该修正该数据,以便改善回归的效果 如果是由于模型的假定不合理,使得标准化残差偏大,应该考虑采用其他形式的模型,比如非线性模型 如果完全是由于随机因素而造成的异常值,则应该保留该数据 在处理异常值时,若一个异常值是一个有效的观测值,不应轻易地将其从数据集中予以剔除 异常值 (识别) 异常值也可以通过标准化残差来识别 如果某一个观测值所对应的标准化残差较大,就可以识别为异常值 一般情况下,当一个观测值所对应的标准化残差小于-2或大于+2时,就可以将其视为异常值 有影响的观测值 如果某一个或某一些观测值对回归的结果有强烈的影响,那么该观测值或这些观测值就是有影响的观测值 一个有影响的观测值可能是 一个异常值,即有一个值远远偏离了散点图中的趋势线 对应一个远离自变量平均值的观测值 或者是这二者组合而形成的观测值 有影响的观测值 (图示) 杠杆率点 如果自变量存在一个极端值,该观测值则称为高杠杆率点(high leverage point) 在一元回归中,第i个观测值的杠杆率用hi表示,其计算公式为 如果一个观测值的杠杆率 ,就可以将该观测值识别为有高杠杆率的点 一个有高杠杆率的观测值未必是一个有影响的观测值,它可能对回归直线的斜率没有什么影响 高杠杆率点 (图示) 不存在影响值的趋势 有影响的观测值 存在影响值的趋势 高杠杆率点 * * * * * * * 124 Note: 1. As we move farther from the mean, the bands get wider. 2. The prediction interval bands are wider. Why? (extra Syx) 四.回归方程的显著性检验 H0: β1= 0 vs H1: β1≠0 ①. 提出假设 为寻找检验 H0 的方法,将 x 对 y 的线性影响与随机波动引起的偏差平方和分开。 数据总的波动的偏差平方和 回归值记为 残差记为 1、F 检验 误差的分解 (图示) x y y ? 反映了回归自变量的波动 反映了其它因素的影响 记 回归平方和 残差平方和 可证: 在计算时: 定理: 设 y1,y2,…,yn 相互独立,且 则上述记号下,有 (1) (2) (3) SR与Se、 独立. 关于 SR 与 Se 的分布 故: 进一步,若 H0 成立,则有 ②、选择检验统计量 ③、对于给定的显著性水平α,当 时, 就拒绝 H0, 认为回归方程有显著意义. t -检验 (1) (2)检验统计量: (3) (4) 若 t t1-?/2, 拒绝 H0 若 t ? t1-?/2, 不拒绝 H0 查 |r| 分布的临界值表 (附表7) 得 r1-?(n-2),当 |r|≥ r1-?(n-2) 时拒绝 H0 检验统计量: 样本相关系数 r 提出假设 H0: ρ = 0 vs H1: ρ ≠0 相关系数检验: 设ρ为二维总体 (x, y) 的相关系数 注: 称 r2为判定系数, 它度量了经验回归方程对观测数据的拟合程度. 0≤r2≤1, 它的值越大, 表明因变量与自变量之间的相关性越强. 例1(续):应用合金强度与碳含量的数据,得到了回归方程.试用相关系数法验证回归方程的显著性。

您可能关注的文档

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档