- 1、本文档共23页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章多重共线性:解释变量相关会有什么后果1126要点
完全多重共线性和不完全多重共线性:举例 完全多重共线性模型: X3=300-2X2 R2=1, 且相关系数r=1 (模型8-3) 两个变量之间存在精确的线性关系 不完全多重共线性模型 X4=299.92-2.0055X2+e (模型8-9) R2=0.9770, 且相关系数r=-0.9884 两个变量之间存在不精确的线性关系,即存在近似的线性关系. 5、方差膨胀因子 其中,R22表示解释变量之间辅助回归方程的样本决定系数。 四、多重共线性评价:必定不好吗? 根据不同的研究目地加以选择: 目的一:预测因变量的均值,即使存在多重共线性,只要模型中的共线性一直存在下去,并且具有较高的解释能力(判定系数较大) 目的二:除了要求进行预测,还要估计模型参数。则严重的共线性存在就不好 目的三:估计一组系数(如估计两个系数的和或差,例如,解释行业生产规模效应),存在共线性也没有问题。 第二部分 实践中的回归分析 基本假定违背:不满足基本假定的情况。 (1)模型设定有偏误;所选模型是正确设定的 (2)解释变量之间存在多重共线性; (3)随机误差项序列存在异方差性; (4)随机误差项序列存在序列相关性。 所选模型是正确设定的 解释变量之间不存在完全线性关系 误差项方差为常数 误差项之间不相关 基本假定 基本假定 基本假定 基本假定 第八章 多重共线性 Multi-Collinearity 一、多重共线性的性质 二、多重共线性的实际后果 三、多重共线性的诊断 四、克服多重共线性的方法 五、案例 一、多重共线性的性质(8.1-8.2) 1、完全多重共线性 2、近似(不完全)多重共线性 对于模型 Yi=B0+B1X1i+B2X2i+…+BkXki+μi i=1,2,…,n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。 完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。 如果存在c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n 其中: ci不全为0 如果存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n 其中ci不全为0,vi为随机误差项 1、解释变量间存在完全共线性(perfect multicollinearity) 2、近似(不完全、高度)共线性(near/imperfect/high multicollinearity) 不可能获得所有参数的唯一估计值及根据样本进行任何统计推断。 OLS估计量仍是最优线性无偏估计量 注意: 除非是完全共线性,多重共线性并不意味着任何基本假设的违背; 因此,即使出现较高程度的多重共线性,OLS估计量仍具有线性性等良好的统计性质。 问题在于,即使OLS法仍是最好的估计方法,它却不是“完美的”,尤其是在统计推断上无法给出真正有用的信息。 OLS估计量仍是最优线性无偏估计量( BLUE). (即不违背前面第四章所学过的任何基本假定) 但这不代表任何一个样本估计值的性质(如方差最小等) 多重共线性本质上是一个样本(回归)现象。即使在总体回归方程中解释变量X之间不是线性相关的,但在某个样本中,解释变量X之间可能线性相关. 存在不完全多重共线性时 参数估计值的方差与标准差变大 容易使通过样本计算的t值小于临界值, 误导作出参数为0的推断,最终得出t检验 结果与实际不符 可能将重要的解释变量排除在模型之外 概念:方差膨胀因子 根据P76第四章有: R2增加 b2和b3的方差(或标准差)增加(或膨胀) 多重共线性使参数估计值的方差增大,1/(1-R2)为方差膨胀因子(Variance Inflation Factor, VIF) 当完全不共线时, R2 =0 当近似共线时, 0 R2 1 二、多重共线性的实际后果(8.4) 1、OLS估计量的方差和标准误较大。 2、置信区间变宽。 由于标准误较大,故总体参数的置信区间就变宽了。 3、t值不显著。 由于标准误变大,所以t值变小,零假设易被接受。 4、R2值较高,但t值并不都是显著的。 变量间作用抵
文档评论(0)