网站大量收购独家精品文档,联系QQ:2885784924

stata第四讲.ppt

  1. 1、本文档共50页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
stata第四讲

Stata第四讲 一 多重共线性 多重共线性,即,解释变量之间是线性相关的。完全的多重共线性并不多见,即使出现了,stata 也会自动识别并且删除多余的解释变量。 例:打开1.dta gen x1=1+x reg y x1 x 存在多重共线性的变量被drop掉了 完全的多重共线性并不多见,较为常见的是近似的多重共线性,它的存在直接导致了模型参数估计值的不精确,并且,相应的显著性t 检验接受零假设的可能性变大。 多重共线性的检验 1、不显著系数法 由于多重共线性的存在,它所表现出的症状通常是整个回归方程的样本可决系数??较大,整体的显著性F 检验也是显著的,但是单个系数的t 检验却并不显著,或者系数估计值大小不合理、甚至符号与理论预期相反。 2、拟合优度检验 该类方法的思想是逐个模型中的解释变量对其它解释变量回归,分别求出个回归方程的样本可决系数,如果接近1,则该变量可以被其它变量线性解释,存在多重共线性。 例:打开1.dta gen x1=x*y x2=x*x 该类方法可以延扩为“相关矩阵法”,即:计算解释变量之间的相关系数矩阵,如果矩阵的某个元素绝对值很大(一般在0.8 以上),就可以判断两个解释变量间是否存在多重共线性。 corr x x1 x2 这里需要注意的是,该类方法只是一个充分而非必要条件,也就是说, 如果相关系数很大,一定存在多重共线性,但是,如果相关系数很小, 不一定不存在多重共线性。 3、方差膨胀因子 关于这种方法,思想不是很简单,只要把结论记住就好了。该方法是从回归系数的方差入手来分析多重共线性的。 命令:estat vif (vif 为variance inflation factor 的缩写) 该命令要在回归之后进行,会得到各个解释变量的方差膨胀因子,vif 越大,说明多重共线性问题越严重。一个经验规则是:最大的vif 不超过10 且平均的vif 值小于1,则认为不存在严重的多重共线性。 练习:检验多重共线性 reg price mpg weight length foreign estat vif 还可以利用解释变量的相关系数 pwcorr mpg weight length foreign 结论:weight和length具有严重的多重共线性 可以考虑去掉weight。 reg price mpg length foreign estat vif pwcorr mpg length foreign 多重共线性基本消除 多重共线性的修正 如果多重共线性的存在并不影响你所关心变量的显著性,可以不必理会,否则,则需要增大样本容量或者对模型进行重新设定。具体的方法有很多。stata提供了逐步回归法来修正存在的多重共线性问题。不同于书上的逐步回归思路,stata中的stepwise命令提供了前进法与后退法两种思想。 1、前进法 命令:stepwise, pe(#): ... 首先用被解释变量对每个解释变量进行回归,将 进行排序,通常选取最大的作为基础方程。然后由高到低的顺序依次加入解释变量,根据其显著性水平判断是否保留在模型中。其中,pe(#) 指定了从模型中删除的变量的显著性水平:如果, 则从模型中将改变量删除。 例:模型中存在四个解释变量,分别为x x1 x2 t2,则相应的命令为: stepwise,pe(0.05):reg y x x1 x2 t2 该命令等价于: (1) reg y x reg y x1 reg y x2 reg y t2 得到 的排序为: x1 x x2 t2,所以选择的基础方程为: (2)在模型中添加变量x reg y x1 x 结果显示,变量x不显著,所以删除变量x (3)在模型中添加变量x2 reg y x1 x2 结果显示变量不显著,所以,删除变量x2 (4)在模型中添加变量t2 reg y x1 t2 结果显示变量不显著,所以,删除变量t2 最终我们得到方程: 这与命令stepwise,pe(0.05):reg y x x1 x2 t2所得到的结果一致。 2、后退法 后退法的思想与前进法相反,是将被解释变量对所有解释变量进行回归,然后,将显著性水平最差且低于指定水平的变量删除后重新进行回归,如果仍存在解释变量不显著,则继续删除,直到所有解释变量均显著为止。 命令:stepwise,pr(#):… 针对上例,则命令为:stepwise,pr(0.05):reg y x x1 x2 t2 至于该回归的结果,可以自己进行回归验证

文档评论(0)

zhuwenmeijiale + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:7065136142000003

1亿VIP精品文档

相关文档