- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
c9 模型设定和数问题的深入专题
第9章模型设定和数据问题的深入专题摘要: 异方差被看成是模型误设的一种,但不是最重要的一种。更重要的是解释变量和误差u相关(MLR.4不成立),也就是所谓的内生性问题(endogenous explanatory variable)。本章讨论造成内生性问题的三种情况,以及补救措施。9.1 函数形式误设(Functional Form Misspecification)考虑小时工资的总体方程:,如果遗漏掉会有什么影响?在该例子中变量都取水平值,而如果实际情况是因变量取对数值呢?上述问题就属于模型的函数形式误设问题(functional form misspecification),该问题的直接后果是往往造成内生性问题。如此需要对模型进行误设检验!由于多项式函数是任意函数的一个很好逼近,如此可以建立含自变量平方项和交叉项的新模型,然后进行F检验。该模型误设检验被称为Ramsey回归误设检验(Ramsey’s (1969) regression specification error test ,RESET)。事实上,如果原模型:, (9.1)满足MLR.1-MLR.4, 那么在原模型添加自变量的非线性关系应该是不显著的。因此,将原模型扩大为如下的模型: (9.2)把(9.2)设为无约束模型,检验非线性关系是否显著,即原假设为:, 在原假设下,得到受限模型(9.1).所建立的联合检验的F统计量渐近服从分布,或者建立LM统计量,其服从自由度为2的开方分布。几点说明:模型(9)中自然可以加入自变量的二次项、交叉项和三次项,但会丧失很多自由度;拒绝了原假设,RESET检验并没有提供一个非线性的函数关系,这也是任何非线性检验都无法做到的;RESET可以用于异方差检验,但是在模型设定正确等情况时,它不能检验出异方差。对非嵌套模型的检验如果实际情况是需要对变量进行处理后,比如取对数后,然后线性模型设定才是正确的,此时模型属于非嵌套模型检验。例如,你是倾向于, (9.3)还是. (9.4)有两种方法,一种是Mizon-Richard检验 (Mizon and Richard,1986):先建立一个综合模型:,然后检验原假设,或者。另一种是Davidson-MacKinnon检验(Davidson-MacKinnon test,1981),即如果(9.4)成立,那么将(9.4)式的拟合值代入(9.3),其回归系数是不显著的:。上述过程也可以反过来操作。几点说明:两个非嵌套模型都有可能被拒绝或接受;拒绝其中的一个模型,并不意味着另一个模型就是正确的;对于因变量函数形式不同的检验,比较困难,见Wooldridge(1994a).9.2对无法观测的解释变量使用代理变量假定log (, 但是由于我们没有很好地界定什么是abil,从而其无法收集数据,最终这个关键变量在计量建模时不得不被遗弃,这样做的后果,显然是我们得到的OLS估计是有偏的估计。处理的办法有两种,一种是建模时,就引入一个能计量的abil指标比如IQ,讨论IQ的工资效应。另一种被称为代理变量(proxy variable)法,即引入一个能替代abil的可计量的变量,比如IQ。假如模型:,(9.5)满足高斯-马尔科夫假定,但是不可观测。我们找到了其的一个可计量的代理变量,满足:,(9.6)显然若是一个合理的代理变量,那么其和应该正相关(而且相关性越强越好)。直接用y对做回归,所得估计被称为遗漏变量问题的植入解(plug-in solution to the omitted variables problem). 但要得到的无偏和一致估计,还需要进一步的假设:误差u和都不相关, 或者;误差v和都不相关。即.如此,将(9.6)代入(9.5)式得:容易看出该模型满足高斯-马尔科夫假定。几点说明:如果不可观测的和相关,如何调整;有时如果有历史数据,可以将y的滞后变量作为代理变量;预测是建模的另一个目的,此时我们不关心系数偏误的问题,而只关心能否预报和预报的准确性。9.3随机斜率模型如果截距系数和斜率也会因个体变化而不同,那么我们得到了一个随机系数模型或者随机斜率模型(a random coefficient model or random slope model):,(9.7)显然(9.7)是无法估计的。我们可能更希望知道斜率和截距的平均值,定义为,其中的被称为平均边际效应(average marginal effect , AME)或者平均偏效应(averagepartial effect , APE). 进
文档评论(0)