新(多重共线性).pptVIP

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
新(多重共线性)

第一节 多重共线性的概念 第二节 多重共线性的后果 第三节 多重共线性的检验 第四节 多重共线性的修正方法 第五节 案例 一、多重共线性的定义 多重共线性是指解释变量 Xi 之间存在完全的或近似的线性关系。在线性模型中,解释变量的 观察值距阵X(包括常数项)其秩等于模型中的解释变量的个数加一 rank(X)= k + 1 如果此假定不成立,则称解释变量Xi之间存在多重共线性,至少有一列向量可由其它列向量线性表示。如 X2 = ? X1 X2与 X1的相关系数为1,解释变量X2 对因变量Y 的作用可由X1 完全替代。 1、经济变量之间的相互依存关系 如替代品价格之间会存在多重共线性 2、滞后变量的引入 同一变量的前后期之值可能是高度线性相关的 3、时间趋势影响 经济繁荣和经济衰退 时间序列样本建立线性模型时,往往存在多重共线。 4、样本资料方面的原因 样本资料推算数据往往存在多重共线性 一、完全多重共线性的影响 1、无法估计模型参数 yi = b1 x1+ b2 x2 完全共线性:∣X’X∣=0,(X’X)-1不存在,R23=1; 例: 2、模型参数估计方差无穷大 1、可以估计参数,但参数估计不稳定 2、参数估计量的方差增大,使参数估计量的精度降低。不能正确判断各解释变量对被解释变量的贡献。 3、由于参数估计量的方差和标准差增大,在对参数进行显著性检验性t 检验时,增大了接受零假设的可能性。 4、若作区间预测也将降低预测的精度。 1、简单相关系数法 解释变量组的相关矩阵中解释变量间的简单相关系数的绝对值甚至大于被解释变量与解释变量之间的简单相关系数的绝对值 cor X1 X2 几何度量 2、综合统计检验法 若 R2,F 均很大,而各t值均偏小,则可以认为存在多重共线性 3、用 F 检验确定哪些解释变量是多重共线的 对每个解释变量 Xj 作它与其它解释变量的回归,并计算样本决定系数 R2 4、用 t 检验来找出哪些解释变量是造成多重共线的原因 四、 逐步回归法 逐步回归法分为逐个剔除法与逐个引入法 “逐步”指的是在使用回归分析方法建立模型时,一次只能剔除(减少)一个解释变量或者一次只能引入(增加)一个解释变量。进行一次剔除或引入称为“一步”,这样逐步的进行下去,直到最后得到模型达到“最优”——模型中无不显著解释变量。 引入的准则:引入解释变量后使模型的拟合优度(及F)显著增加的,应当引入;否则不引入。 剔除的准则:剔除解释变量后使模型的拟合优度(及F)不显著的减少,应当剔除;否则不剔除。 1、逐步剔除法 先将一切可能的解释变量全部引入模型 再依据各个解释变量的显著性 每次从模型中剔除一个不显著的解释变量 从不显著的解释变量中,剔除t最小(对应的概率P最大)的解释变量 直至留在模型中的全部解释变量影响显著,得到最简洁的模型(模型中不包含不显著的解释变量)。 逐步剔除与多重共线性 如果剔除一个解释变量,使模型拟合优度(及F)显著地减少,那么这个剔除是不应当的。但证明了该剔除变量与留在模型中的解释变量不构成多重共线。它对解释变量Y的贡献不能由已在模型中的解释变量线性表出。 如果剔除一个解释变量,使模型拟合优度(及F)不显著地减少,那么这个剔除是应当的。而且证明了它与留在模型中的解释变量构成多重共线。它可由这些变量线性表出,所以剔除不至于引起拟合优度的减少。 2、逐个引入法 如果引入解释变量,使模型拟合优度显著地增加,那么这个引入是应当的,而且它与模型中已有的解释变量不构成多重共线。 如果引入解释变量,使模型拟合优度不显著地增加,那么这个引入是不应当的,而且它与已在型中的解释变量构成多重共线,它可由这些解释变量线性表出。也就是说,它对被解释变量的贡献已由这些共线变量提供。所以,引入它并不能提高拟合优度。 第五节 案例一——中国粮食生产函数 根据理论和经验分析,影响粮食生产(Y)的主要因素有: 农业化肥施用量(X1);粮食播种面积(X2) 成灾面积(X3); 农业机械总动力(X4); 农业劳动力(X5) 1、用OLS法估计上述模型: R2接近于1; 给定?=5%,得F临界值 F0.05(5,12)=3.11 F=638.4 15.19, 故认为上述粮食生产的总体线性关系显著成立。 但X4 、X5 的参数未通过t检验,且符号不正确,故解释变量间可能存在多重共线性。 2、检验简单相关系数 发现: X1与X4间存在高度相关性。 3、找出最简单的回归形式 可见,应选

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档