网站大量收购闲置独家精品文档,联系QQ:2885784924

实用回归分析课件.ppt

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
实用回归分析课件

5.1 残差与残差图 5.1 残差与残差图 5.1 残差与残差图 5.1 残差与残差图 5.1 残差与残差图 5.2 残差的性质 5.2 残差的性质 5.2 残差的性质 5.2 残差的性质 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 强影响点不一定是y的异常值点,不能单纯根据杠杆值hii的大小判断强影响点是否异常 利用Cook距离,来判断强影响点是否为y的异常值点. 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 5.3 异常值与强影响值 违背基本假设的情况 第六章 关于异方差性问题 第六章 关于异方差性问题 第六章 关于异方差性问题 6.1 异方差性产生的背景 6.1 异方差性产生的背景 6.2 异方差性的诊断 6.2 异方差性的诊断 6.2 异方差性的诊断 6.2 异方差性的诊断 6.2 异方差性的诊断 二、异方差性带来的问题 当存在异方差时,普通最小二乘估计存在以下问题: (1)参数估计值虽是无偏的,但不是最小方差线性无偏估计; (2)参数的显著性检验失效; (3)回归方程的应用效果极不理想。 一、异方差性的检验 (一)残差图分析法 ——直观、方便的分析法 以残差ei为纵坐标,其他适宜变量为横坐标画散点图,横坐标有三种选择: 拟合值 xi 观测时间或序号 一、异方差性的检验 (一)残差图分析法 图5.1(b) 存在异方差 一般情况下,当回归模型满足所有假定时,残差图上的n个点散布应是随机的,无任何规律; 存在异方差时,残差图上的点散布呈现相应的趋势. 一、异方差性的检验 (二)等级相关系数法 等级相关系数检验法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既可用于大样本,也可用于小样本。进行等级相关系数检验通常有三个步骤。 第一步,作y关于x的普通最小二乘回归,求出ei的估计值,即ei的值。 * 一、残差概念与残差图 残差 误差项 残差ei是误差项ei的估计值。 一、残差概念与残差图 ****一般认为,如果一个回归模型满足所给出的 基本假定,所有残差应在e=0附近随机变化, 并在变化幅度不大的一条带子内. ****如果残差都落在变化幅度不大一条带子内, 也就可以说明回归模型满足基本假设. 一、残差概念与残差图 ****y观测值的方差并非相同,随x增加而增加. 【消除异方差】 一、残差概念与残差图 ****y与x之间并非线性关系. 可能y与x是曲线关系 可能y存在自相关 一、残差概念与残差图 ****蛛网现象(y具有自相关) 一、残差的性质 性质1 E (ei)=0 证明: 一、残差的性质 性质2 称为杠杆值 一、残差的性质 性质3. 残差满足约束条件: 二、改进的残差 异常值分为两种情况: 一种是关于因变量y异常; 另一种是关于自变量x异常。 一、关于因变量y的异常值 标准化残差 学生化残差 存在y的异常观测值,普通/标准化/学生化残差都不适用 可以证明: 二、关于自变量x的异常值 回归的杠杆值hii也是表示自变量的第i次观测值与 自变量平均值之间距离的远近。 杠杆值大的样本点称为强影响点。 二、关于自变量x的异常值 5.3 异常值与强影响值 三、异常值实例分析 例5.1 做异常值的诊断分析。 分别计算 普通残差ei, 学生化残差SREi, 删除残差e(i), 删除学生化残差SRE(i), 杠杆值chii, 库克距离Di RES-残差e DRE-删除残差 ZRE-标准化残差 SRE –学生化残差SREi SDR –删除学生化残差SRE(i) COO-库克距离Dii LEV-中心化杠杆值chii 改用非线性回归模型 7.模型选用错误,线性模型不适用 采用加权线性回归 6.存在异方差 增加观测数据,适当扩大自变量取值范围 5.缺少观测数据 增加必要的自变量 4.缺少重要自变量 删除或重新观测异常值数据 3.数据随机误差 重新测量数据 2.数据测量误差 重新核实数据 1.数据登记误差,存在抄写或录入 的错误 异常值消除方法 异常值原因 删除第19组数据 学生化删除残差、杠杆值、Cook距离——识别异常

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档