网站大量收购闲置独家精品文档,联系QQ:2885784924

回归模型拟合精度分析-实用回归分析.doc

回归模型拟合精度分析-实用回归分析.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
回归模型拟合精度分析-实用回归分析

应用回归分析例库封面 案例名称: 民航客运量及相关因素分析 作者: 纪跃芝 教学目的: 掌握回归分析对实例进行基本分析。 适用课程: 应用回归分析 学习本案例的 前期知识准备: 回归分析、SPSS软件 本案例的知识点: 回归模型 一、案例背景 文章通过分阶段建立多元线性回归模型,分析了改革开放32年来民航客运量与相关因素之间的关系。结果表明:在不同历史阶段影响民航客运量的因素有所不同,并且从经济学角度对所建立的模型给出了合理的解释。 二、数据介绍 数据来自《新中国五十五年统计资料汇编》和《中国统计年鉴2010》。 三、分析过程 根据以上的分析,自改革开放以来,将中国民航客运量的增长趋势分为三个阶段,这里还有一个问题,就是年段的划分选在何处会更合理呢?对于这个问题,我们主要依据表2中分段回归拟合的残差平方和的大小,同时结合自变量选择时考虑的诸多因素做适当调整。 下面分阶段建立因变量关于自变量的各种组合的回归方程,这种组合方程共有 个,根据自变量的选择准则,从中选择最优回归方程。 3.1 第一阶段:1978~1988年最优回归模型 经过比较,在通过回归方程和回归系数的显著性检验的方程中(取显著性水平),发现表3中的两个模型最优。 由表3可见,模型一的各项指标都优于模型二,但是模型一中的系数, 与实际意义不符,最终消费与民航客运量应该正相关。模型二中的系数,与实际意义相符合,铁路客运量与民航客运量应该负相关,出现与实际意义不符的情况可能是由变量间的多重共线性造成的,为此考察其它几项指标,见表4. 表3 两个最优回归模型比较 模型 1978~1988年拟合回归方程 标准残差 复相关系数 PRESS AIC 模型一 41.91 0.9920 26372.68 111.0539 模型二 46.03 0.9904 52010.33 113.1177 表4 多重共线性、异常值诊断 模型 方差扩大因子 绝对值最大的删除学生化残差 最大库克距离 最大杠杆值 模型一 模型二 从表4可见,模型一的自变量间存在严重的多重共线性,而且存在异常值点,模型二的自变量间不存在多重共线性,而且没有异常值点。为了进一步考察模型二的拟合效果,做残差图4和拟合图5。 图4 1978~1988年的拟合-残差图 图5 1978~1988年的最优回归拟合图 由图4可见,残差波动较小,介于-80~60之间,且无规律。图5表明模型二的拟合效果 相当好,最优回归方程对变量间的描绘是理想的。 3.2 第二阶段最优回归模型的确立 自变量的选择方法同上。 第二阶段:1989~2002年间,选入最优回归模型的变量是。 第三阶段:2003~2009年间,选入最优回归模型的变量是。 值得注意的是,在第三阶段,2009年对应的第七组数据,绝对值最大的删除学生化残差 ,位于第一大,中心化杠杆值,位于第二大,库克距离,位于第一大,可见2009年的数据为异常值的原因是自变量异常和因变量异常两个原因共同引起的。为了确定年段划分,分别考虑了以下几种情形: 第二阶段:1989~2001年和1989~2002年两种情形。 第三阶段:2002~2009年、2003~2009年以及2002~2008年三种情形。 计算方法同上,具体结果见表5: 表5 第二阶段两个最优回归模型比较 模型 拟合回归方程 标准残差 复相关系数 PRESS AIC 1989~2001 455.1 0.9576 3166450 195.0669 1989~2002 470.5 0.9624 3725234 211.8764 以上两个模型均通过了回归方程和回归系数的显著性检验,回归系数也很接近,总体来说,第一个模型好于第二个模型。针对模型一,利用SPSS软件计算: 说明变量间不存在多重共线性和异常值。最终取那个模型,还需视第三阶段模型而定。 3.3 第三阶段最优回归模型的确立 第三阶段最优回归模型见表6,三个回归方程都通过了显著性检验。统计量的概率值见表7。 从表6可见,2002~2009年、2003~2009年的回归结果很接近,说明2002年的数据对回归结果影响不大,而删除2009年

文档评论(0)

youbika + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档