网站大量收购闲置独家精品文档,联系QQ:2885784924

多元线性回归——多重共线性.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 四、 多重共线性的补救措施 基本内容: ●修正多重共线性的经验方法 ●逐步回归法 * 1、修正多重共线性的经验方法 1) 剔除变量法 是降低多重共线性最简便的方法. 把方差扩大因子最大者所对应的自变量首先 剔除再重新建立回归方程,直至回归方程中 不再存在严重的多重共线性。 注意: 若剔除了重要变量,可能引起模型的设 定误差。 * 2)增大样本容 * 样本容量增加,会减小回归参数的方差,标准误差也同样会减小。因此尽可能地收集足够多的样本数据可以改进模型参数的估计。 * 样本容量越小有近似多重共线性的可能性就越大,反之,样本容量越大,多重共线性的可能性就越小问题:增加样本数据在实际计量分析中常面临许多困难,受制于实际情况。 * 增大样本容量并不必然降低近似的多重共线性,如增加的数据也有类似的共线性,就不起作用 * 如果变量总体中本来就有共线性问题,再增大样本容量也无济于事. * 3)变换模型形式 一般而言,差分后变量之间的相关性要比差分 前弱得多,所以差分后的模型可能降低出现共 线性的可能性,此时可直接估计差分方程。 问题:差分会丢失一些信息,差分模型的误差 项可能存在序列相关,可能会违背经典线性回 归模型的相关假设,在具体运用时要慎重。 * 4)利用非样本先验信息 通过经济理论分析能够得到某些参数之间的关 系,可以将这种关系作为约束条件,将此约束 条件和样本信息结合起来进行约束最小二乘估 计。 * 5)横截面数据与时序数据并用 首先利用横截面数据估计出部分参数,再利用 时序数据估计出另外的部分参数,最后得到整 个方程参数的估计。 注意:这里包含着假设,即参数的横截面估计和 从纯粹时间序列分析中得到的估计是一样的。 * 6)变量变换 变量变换的主要方法: (1)计算相对指标 (2)将名义数据转换为实际数据 (3)将小类指标合并成大类指标 变量数据的变换有时可得到较好的结果,但无 法保证一定可以得到很好的结果。 * 2、逐步回归法 (1)用被解释变量对每一个所考虑的解释变量做简单回归。 (2)以对被解释变量贡献最大的解释变量所对应的回归方程为基础,按对被解释变量贡献大小的顺序逐个引入其余的解释变量。 **若新变量的引入改进了 和 检验,且回归参 数的t 检验在统计上也是显著的,则在模型中保 留该变量。 * **若新变量的引入未能改进 和 检验,且对其他回 归参数估计值的t 检验也未带来什么影响,则认为该 变量是多余变量。 **若新变量的引入未能改进 和 检验,且显著地影 响了其他回归参数估计值的数值或符号,同时本身的 回归参数也通不过t 检验,说明出现了严重的多重共 线性。 * 案例分析 一、研究的目的要求 提出研究的问题——为了规划中国未来国内旅游产业 的发展,需要定量地分析影响中国国内旅游市场发展 的主要因素。 二、模型设定及其估计 影响因素分析与确定——影响因素主要有国内旅游 人数 ,城镇居民人均旅游支出 ,农村居民人均 旅游支出 ,并以公路里程次 和铁路里程 作为相关基础设施的代表 理论模型的设定 其中 : ——第 t 年全国国内旅游收入 * 数据的收集与处理 年 份 国内旅游收入Y(亿元) 国内旅游人数X2(万人次) 城镇居民人均旅游支出X3 (元) 农村居民人均旅游支出X4 (元) 公路里 程 X5(万公里) 铁路里 程X6(万公里) 1994 1023.5 52400 414.7 54.9 111.78 5.90 1995 1375.7 62900 464.0 61.5 115.70 5.97 1996 1638.4 63900 534.1 70.5 118.58 6.49 1997 2112.7 64400 599.8 145.7 122.64 6.60 1998 2391.2 69450 607.0 197.0 127.85 6.64 1999 2831.9 71900 614.8 249.5 135.17 6.74 2000 3175.5 74400 678.6 226.6 140.27 6.87 2001 3522.4 78400 708.3 212.7 169.80 7.01 2002 3878.4 87800 739.7 209.1 176.52 7.19 2003 3442.3 87000 684.9 200.0 180.98 7.30 数据来源:《中国统计年鉴》 * 该模型 , 可决系数很高,F检验值 173.3525,明显显著。 但是当 时 、 不仅 、 系数的t检验不显著,而且 系

文档评论(0)

小教资源库 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档