残差分析--数据分析幻灯片.ppt

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 2.3 残差分析 前面讨论的是线性回归模型的参数估计和有关的统计推断,这些讨论都是在对模型作了一定的假设进行的,其中最重要的是回归关系的线性假设,误差项的独立同正态分布假设。当给定了一批数据后,如何考察这些数据满足假设是回归分析的一个重要环节。 这些假设涉及到误差项,而误差是不可测的,我们能够使用的是其估计量残差。 2.3.1 误差项的正态性检验 一、学生化残差 从误差的估计值(残差)出发分析关于误差项假定的合理性以及线性回归关系的假定的可行性称为残差分析。 假设误差向量 则残差向量 其中H是n阶对称幂等矩阵 故 其中 是H主对角线的第i个元素,称为杠杆量。 由于残差的方差和杠杆量有关,故一般情况下,残差的方差不相等,这不利于残差的应用,,因此我们将残差标准化。 称为学生化残差,当n较大时,可认为其服从标准正态分布。这是检验误差项独立同正态分布的基础。 二、残差正态性的频率检验 残差正态性的频率检验是一种很直观的检验方法,其基本思想是学生化残差落入一些范围的频率与标准正态分布在相应范围内的概率做比较,若二者相差较大,则认为残差(从而模型误差)不服从正态分布。 在实际应用中,一般取几个具有代表性的区间进行比较。例如(-1,1)(-1.5,1.5)(2,2) 服从标准正态分布的随机变量取值在(-1,1)内的概率为0.68;在(-1.5,1.5)内的概率为0.87;在(-2,2)内为0.95,因此若模型误差项独立同正态分布,则当n较大时,学生化残差中应大约有68%的点落在在(-1,1)内;大约有87%在(-1.5,1.5)内,大约95%在(-2,2)内。 若在某个区间内差异较大,则有理由怀疑误差独立同正态分布的假设的合理性。 三、残差的正态qq图检验 (1)学生化残差正态qq图做法 则所得的散点图即为学生化残差的正态qq图,利用正态qq图可以直观检验误差正态性假设的合理性 (2)相关系数检验。 除了上述直观检验外,我们还可以构造两者的相关系数来度量二者之间线性关系的强弱。其相关系数估计为 通过考察不同类型残差图可以对误差项分布的正态性,等方差性以及回归关系的线性性等假定的合理性作出直观检测,还可以对回归方程是否有必要引进自变量的高次项、交叉项等提供参考。 2.3.2 残差图的分析 残差图是以残差为纵坐标,以其他有关量为横坐标的散点图。 (1)以因变量Y的拟合值为横坐标的散点图。 若线性回归关系正确且误差服从正态分布,则因变量的拟合值与残差向量相互独立。这时残差图中的点应大致在一个水平的带状区域内,没有任何明显地趋势,如下图: (2)以自变量观测值为横坐标的散点图。 (3)以观测时间或观测值序号横坐标的散点图。 还可以用以下坐标做残差图,两种残差图原理与上一个相同 通过残差分析可以发现所给数据的某些特点和模型 假定的一些不足之处,接下来的问题就是要采取相应的 措施改进其不足,以建立更好的回归模型。 一个常用的改进措施就是Box-Cox变换,它通过 对因变量Y做适当变换,使原数据尽可能满足线性回归 模型的条件。 2.3.2 Box-Cox变换 Box-Cox变换对因变量Y做如下变换: 也就是说,我们通过因变量的变换,使得变换后 因变量与自变量有线性相关关系,且满足误差项的 假设。 回归方程的选取包括回归方程类型的选取和回归 方程类型确定后自变量的选取。我们主要讨论自变量 的选取 人们在建立线性回归模型时,会考虑用全部可能 的自变量建立回归方程,这样做的问题有 : 2.4 回归方程的选取 (1)会将一些对因变量影响很小甚至根本无影响 的自变量也包含在回归方程中,从而使计算量增加, 并会导致回归参数估计和因变量预测值的精度下降。 (2)自变量太多不利于应用回归方程对实际问题 做出合理的解释,也会造成数据收集和模型应用 代价的不必要的增大。 因此在实际应用中,从与因变量有线形关系的 自变量集合中,选取一个最优的子集,以建立一个 合理而又简单的回归方程十分重要。

文档评论(0)

laolingdao1a + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档