C17受限因变量模型和样本选择纠正..docx

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
C17受限因变量模型和样本选择纠正.

第17章 受限因变量模型和样本选择纠正摘要: C7中的线性概率模型是受限因变量(limited dependent variable (LDV))模型的一例子,其容易解释,但有其缺陷,本章介绍的logit模型和probit模型更为常用,但解释相对困难。实际应用中,离散和连续是相对的,也就是说,实际离散的经济变量可能也适用于因变量离散的模型建模。本节介绍的模型包括Tobit模型,用于应对角点解响应(corner solution response);泊松回归模型(计数模型),用于建模LDV只能取非负整数的情况;截断数据模型和对样本选择的纠正。 受限因变量模型更容易在横截面数据中被使用。样本选择的纠正通常都源于横截面或面板数据。17.1 二值响应的logit模型和probit模型线性概率模型的缺陷?二值响应模型(binary response model)关注的核心问题是响应概率(response probability):.logit模型和probit模型的设定为此,需要先建一个连接函数:,其中G(.)是一个取值于(0,1)的函数。常见的连接函数有:,该函数是标准logistic随机变量的累积分布函数:常见的连接函数还有标准正态的累积分布函数,G可以被表示为:.使用上述两个连接函数,我们分别建立了logit模型和probit模型。关于logit模型和probit模型的推导:并定义,为示性函数。要求满足CLM假设或高斯-马尔科夫假设。显然当服从均值为0的正态分布,或者logistic分布,其都关于0点对称,则有: ,也即:.从该推导中我们知道,但由于的不可观测性本身的含义并不直观,也并不很有用,虽然和中x的影响方向具有一致性(这一点由下面推导保证)。我们关心解释变量对y的偏效应,由于(.)的非线性,对连续变量的情形就得依赖于偏导技术:,其中为概率密度函数,由于,所以偏效应的方向取决于。 一个有趣的结论是:任意两个自变量的偏效应之比等于其系数之比。此外,偏效应方程告诉我们偏效应依赖于密度函数的位置和的大小,从而logit模型和probit模型的最大偏效应位置出现在和=0.25.而对于二值变量情形,则其偏效应相对来说容易确定,例如,是一个二值变量,则其偏效应为:。其它离散变量情况类似。考虑如下问题的偏效应:.对于上述问题,有时还要考虑响应概率相对于一个解释变量的弹性:对的弹性为:;对的弹性为:;对含解释变量交互项的模型可能会更难处理,可依赖于偏导数讨论。logit和probit模型的极大似然估计极大似然法(maximum likelihood estimation , MLE)是基于条件分布的估计量,故一般其是有效估计和考虑了异方差性。其可用于对受限因变量模型的估计。假定有一个样本量为n的样本,为了得到极大似然估计量,需要给出在给定下的分布函数:对上述方程取自然对数:),对上述方程求和,得到对数似然函数:,则最大化上述函数可求得的MLE估计量,记为,对数似然函数值一般是负值。极大似然估计量一般是一致的、渐近正态的和渐近有效的(Wooldrige,2002,C13)。其标准误和检验统计量一般统计软件都会提供。多重约束性检验有三种常用的排除性约束检验统计量:Lagrange multiplier or score test(Wooldrige,2002,C15);Wald test(Wooldrige,2002,C13) 和likelihood ratio (LR) test。下面介绍似然比检验的思想:如果部分变量的确对y有联合显著性,那么去掉它们,对数似然函数取值应该有比较大的降低,从而可以构造似然比统计量:LR=2(),表示无约束模型的对数似然值,而表示有约束模型的对数似然值,那么在原假设(检验q个排除性约束)成立的情况下,有LR.解释Logit 和Probit模型的估计值拟合优度指标之一:正确预测百分数( percent correctly predicted),若,则定义,若,则定义,该变量是对的预测值,当表示预测对了,否则表示做了不正确的预测,所以只需要计算成立的对数。分类给出正确预测百分比数是更好的选择。关于临界值0.5的争议: 假如,那么可能发生的可能性很小,所以一种替代方法是将临界值定为,但可能在对进行0预测时会犯更大错误。更有效地方法是使用有哪些信誉好的足球投注网站的方法确定临界值,以使正确预测百分比达到最大。拟合优度指标之二:伪(pseudo R-squared)为McFadden(1974)建议的指标1-,表示只有截距项的模型的对数似然值。请解释?拟合优度指标之三:=G()为拟合概率,其也是对的估计值,考察和的相似度!拟合优度本身对经济问题研究是相对次要的,下面讨论相对重要的偏效应(在其它条件不变的情形下的显著关系探讨)。连续情形下,,此

文档评论(0)

dashewan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档