一般离散因变量模型和面板离散因变量模型参考.ppt

一般离散因变量模型和面板离散因变量模型参考.ppt

  1. 1、本文档共40页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一般离散因变量模型和面板离散因变量模型参考

商学院 王中昭 如果回归模型的解释变量中含有定性变量,则可以用虚拟变量进行处理。在实际经济问题中,被解释变量也可能是定性变量。如通过一系列解释变量的观测值观察人们对某项动议的态度,是否签订合同。对某一商品是否购买(汽车或房子),某件事情的成功和失败,求职者对某种职业是否接受或者拒绝,那么这种选择就可以用1或者0来表示,这与解释变量的虚拟变量一样,只不过这里的变量为被解释变量,建模过程就较为复杂。 当被解释变量为定性变量时怎样建立模型呢?这就是要介绍的二元选择模型或多元选择模型。这里主要介绍Tobit(线性概率)模型,Probit(概率单位)模型和Logit模型。 1.Tobit(线性概率)模型 Tobit模型的形式如下, Yt = ? + Xtβ + μt …… (1) 其中μt为随机误差项,Xt为解释变量,?和 β为待估计的参数。Yt为二元选择变量。此模型由James Tobit提出,因此得名。如利息税、机动车的费改税问题等。设 例如有如下数据,其X和Y的散点图为: 对Yt取期望, E(Yt) = ? + Xt ? ……(2) 下面研究Yt的分布。因为Yt只能取两个值0和1,所以Yt 服从二项分布。把Yt的分布记为: pt = P (Yt = 1) 1 - pt = P ( Yt = 0) 则: E(Yt) = 1×P ( Yt = 1) + 0×P ( Yt = 0) = pt = P ( Yt = 1)……(3) 由(2)和(3)式有 pt = P ( Yt = 1) = ? +Xt ? ……(4) 其中Yt的样本值是0或1,而预测值(拟合值)是概率。 因此模型(2)称为线性概率模型. 以pt=- 0.2+0.05Xt 为例,说明Xt 每增加一个单位,则采用第一种选择(Yt = 1)的概率增加0.05。假设用这个模型进行预测,当预测值落在 [0,1] 区间之内(即Xt取值在[4, 24] 之内)时,则没有什么问题;但当预测值落在[0,1] 区间之外时,则会暴露出该模型的严重缺点。因为概率的取值范围是 [0,1],所以此时必须强令预测值(概率值)相应等于0或1(见下图)。 采用线性回归的方式来构建二元选择模型,会导致如下问题: (1)、模型的随机误差项不能满足同方差的假设 因为线性概率模型的随机误差项的方差不是一个常数,因此不能用OLS来估计模型,线性概率模型往往使用极大似然法估计参数,有关极大似然法的推导见书P238-239。 logistic回归参数的极大似然估计具有如下性质:一是极大似然估计为一致估计。二是极大似然估计是渐进有效的,当样本容量较大时,极大似然估计的方差小于其它方法的方差。三是极大似然估计为渐进的正态分布。 因此变量的显著性检验是采用Z统计量。 (看相关的书:赵卫亚著《计量经济学》,机械工业出版社,2008年9月,p188-189)。 (2)、线性概率模型要求Yt的取值落入[0,1]内,但是模型参数估计后, 基于线性概率模型上述缺点,希望能找到一种变 换,使模型满足如下条件: (1)使解释变量Xt所对应的所有预测值(概率值)都落在(0,1)之间。 (2)同时对于所有的Xt,当Xt增加时,希望Yt也单调增加或单调减少。 显然累积概率分布函数F(Zt) 能满足这样的要求。采用累积正态概率分布函数的模型称作Probit模型。用正态分布的累积概率作为Probit模型的预测概率。另外logistic函数也能满足这样的要求。采用logistic函数的模型称作logit模型(服从Logistic分布)。 仍假定:Yt= ? + Xtβ 该模型是McFadden于1973年首次提出。其采用的是logistic概率分布函数。其形式是: Probit曲线和logit曲线很相似, logit曲线近似于自由度为4的t分布曲线。 两条曲线都是在pt=0.5处有拐点,但logit曲线在两个尾部要比Probit曲线厚。而且logit曲线计算上也比较方便,所以Logit模型比Probit模型更常用。 对logit曲线模型(6)式作如下变换: logit模型的一个重要优点是把在 [0,1] 区间上预测概率的问题转化为在实数轴上预测一个事件发生的机会比问题。logit累积概率分布函数的斜率在这pt =0.5时最大,在累积分布两个尾端的斜率逐渐减小。说明相对于pt =0.5附近的解释变量Xt的变化对概率(P(Yt=1)

您可能关注的文档

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档