残差剖析数据剖析.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
23残差分析 前面讨论的是线性回归模型的参数估计和有 关的统计推断,这些讨论都是在对模型作了一定 的假设进行的,其中最重要的是回归关系的线性 假设,误差项的独立同正态分布假设。当给定了 一批数据后,如何考察这些数据满足假设是回归 分析的一个重要环节 这些假设涉及到误差项,而误差是不可测的, 我们能够使用的是其估计量残差 从误差的估计值(残差)出发分析关于误差项 假定的合理性以及线性回归关系的假定的可行性称 为残差分析 2.3.1误差项的正态性检验 学生化残差 假设误差向量E~N(O,O2D) 则残差向量E~N(0,a2(1-H)) 其中H是n阶对称幂等矩阵 H=X(XXX 故 E1~N(0,(1-h1),=1,2, 其中h1=x2(XX)x 是H主对角线的第i个元素,称为 杠杆量 由于残差的方差和杠杆量有关,故一般情况 下,残差的方差不相等,这不利于残差的应用,, 因此我们将残差标准化。 MSE(I-h,i) 称为学生化残差,当n较大时,可认为其服从 标准正态分布。这是检验误差项独立同正态分布 的基础。 残差正态性的频率检验 残差正态性的频率检验是一种很直观的检验 方法,其基本思想是学生化残差落入一些范围的 频率与标准正态分布在相应范围内的概率做比较, 若二者相差较大,则认为残差(从而模型误差) 不服从正态分布 在实际应用中,一般取几个具有代表性的区间 进行比较。例如(-1,1)(-1.5,1.5)(2,2) 服从标准正态分布的随机变量取值在(-1,1) 内的概率为0.68;在(-1.5,1.5)内的概率为0.87; 在(-2,2)内为0.95,因此若模型误差项独立同 正态分布,则当n较大时,学生化残差中应大约有 68%的点落在在(-1,1)内;大约有87%在( 1.5,1.5)内,大约95%在(-2,2)内 若在某个区间内差异较大,则有理由怀疑误差 独立同正态分布的假设的合理性 残差的正态qq图检验 (1)学生化残差正态q图做法 1)写出学生化残差的演统计量:1,12,…,m 2)对每个=12…,n计算90=4(m+025) 3)在坐标系中描出点n,) 则所得的散点图即为学生化残差的正态q图, 利用正态qq图可以直观检验误差正态性假设的合 理性 (2)相关系数检验 除了上述直观检验外,我们还可以构造两者 的相关系数来度量二者之间线性关系的强弱。其 相关系数估计为 (-7)∑(q-0 若p接近于1,则散点图上点大致在一条直线上 2.3.2残差图的分析 残差图是以残差为纵坐标,以其他有关量为横 坐标的散点图 通过考察不同类型残差图可以对误差项分布的 正态性,等方差性以及回归关系的线性性等假定的 合理性作出直观检测,还可以对回归方程是否有必 要引进自变量的高次项、交叉项等提供参考 (1)以因变量Y的拟合值为横坐标的散点图 若线性回归关系正确且误差服从正态分布,则 因变量的拟合值与残差向量相互独立。这时残差图 中的点应大致在一个水平的带状区域内,没有任何 明显地趋势,如下图

文档评论(0)

bokegood + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档