计量经济学第5章多重共线性.ppt

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
计量经济学第5章多重共线性

第五章 多重共线性 多重共线性的性质 多重共线性时的估计问题 多重共线性的实际后果 多重共线性产生的原因 多重共线性的识别 多重共线性的克服 一、多重共线性的性质 完全多重共线:对解释变量x1, x2, … xk, 如果存在一组不全为0的常数?1、?2、… ?k,使得: ?1x1i+ ?2x2i+ …+ ?kxki=0 非完全多重共线:包括变量间交互相关情形如下: ?1x1i+ ?2x2i+ …+ ?kxki+?i=0 二、完全多重共线的估计问题 以二元回归为例: 设:x3i=?x2i (r23=1) 代入上式: 三、多重共线的实际后果 完全多重共线是一种极端情形,非完全多重共线更常见。 非完全多重共线下,OLS估计量仍是最优线性无偏估计量,但有如下后果: ∴估计精度较低 称为方差膨胀因子 VIF表明:估计量的方差由于多重共线的出现而膨胀起来。 当r23=0.7时,VIF=1.96 当r23=0.9时,VIF=5.76 即: 是r23为零时的5.76倍。 当r23=0.95时,VIF=10.26 即: 是无共线时的10倍。 三、多重共线的实际后果 由于方差膨胀,接受零假设更为容易,出现多个偏回归系数单零t检验不显著。 虽然单零检验不显著,但是联合检验(F检验)却显著,总的拟合优度也很高。 OLS估计量及其标准误对数据的小变化敏感。 四、多重共线产生的原因 数据采集方法:解释变量取值范围过小; 模型或从中取样的总体本身的特点 例:在作电力消费对收入和住房面积的回归时,一般来说,收入较高的家庭住房面积也较大。 模型设定问题 如多项式回归: 一个过度决定的模型: 解释变量个数样本容量 五、多重共线的识别 注意:多重共线是个程度问题,而不是有无问题。 识别方法: R2值高,F检验显著,但显著t值少。 回归元间有高度两两相关(充分而非必要条件)。 本征值(eigenvalues)和病态指数(condition index) 五、多重共线的识别 辅助回归:作每一个xi对其余x变量的回归,并计算R2,记为 。这种回归叫辅助回归,以辅助y对x的回归。然后计算统计量: 六、多重共线的克服 1. 横截面数据与时间序列数据并用 例如研究汽车需求,假定有销售量、平均价格和消费者收入的时间序列数据,模型为: 六、多重共线的克服 2. 剔除变量:对严重多重共线,最简单的做法之一是剔除共显著变量之一。但从模型中剔除一个变量,可能导致设定偏误。 六、多重共线的克服 3. 差分法:时间序列数据间往往有较强的相关性,减小相关性的方法是形成一次差分方程: 六、多重共线的克服 4. 补充新数据:以二元回归为例 习题: 现有美国70-83年进口(百万美元)、GNP(10亿美元)和消费者价格指数(CPI)数据。请考虑一下模型: 用表中数据估计此模型的参数。 你认为存在多重共线吗?使用病态指数和方差膨胀因子分析共线性的性质。 你认为上述模型需要修正吗?说明理由。如果需要,应如何修正? * * ∴如果出现完全多重共线,则偏回归系数是不确定的,其标准误是无穷大。 或将x3i=?x2i 代入原模型: 偏回归系数无确定解的含义:无法从所给样本中将x2和x3的影响分离出来:当x2发生变化时,x3也按一个倍数因子?改变。 病态指数CI在10-30之间,中强多重共线 CI30,严重多重共线 ~(k-2, n-k+1)的F分布 当Fi显著时,认为xi与其余的x有共线性。 容许度与方差膨胀因子 经验规则:VIF10则说该变量是高度共线的。 在时间序列数据中,价格和收入变量一般都有高度共线的趋势。如果作上述回归时存在高度共线问题,可利用横截面数据估计收入弹性?3,因为这些数据都产生于一个时间点上,价格还不至于有多大变化。令收入弹性的横截面估计为 ,原回归可化为: yt=b1+b12x2t+?1t E(b12 ) = ?2 + ?3 b32 b12是的一个有偏且非一致的估计,无法得到反映x2对y的净影响的系数?2 yt=?1+?2x2t+?3x3t+?t 剔除一变量后变为: 虽然x2和x3的水平之可能高度相关,但是,其差分形式相关程度往往较低。因此,一阶差分回归常能减低多重共线性的严重程度。(对于横截面数据,一阶差分不适用。 差分法的问题:随机误差项可能存在序列相关;损失了一次观测值,因而减少了一个自由度,如果样本容量本身就不大,这可能会有影响。 当r23给定时,增加新样本,通常可以使 增大,从而减少 的方差,使我们能更准确地估计?2。 *

文档评论(0)

shaoye348 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档