网站大量收购独家精品文档,联系QQ:2885784924

第八章 离散因变量模型.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 离散因变量模型

第八章 离散因变量模型 离散(分类)因变量模型(Models with Discrete /Categorical Dependent Variables)分为二元选择模型(Binary Choice Models)和多类别选择(反应)模型(Multicategory Choice /Polytomous Response Models)。在多类别选择模型中,根据因变量的反应类别(response category)是否排序,又分为无序选择模型(Multinominal Choice Models)和有序选择模型(Ordered Choice Models)(也称有序因变量模型Ordered Dependent Variable Models、有序类别模型Ordered Category Models等) 一、二元选择模型 设因变量 1、线性概率模型(LPM模型) 如果采用线性模型, 给定,设某事件发生的概率为Pi,则有 所以 称之为线性概率模型。 不足之处: 1、不能满足对自变量的任意取值都有。 2、 3、 所以线性概率模型不是标准线性模型。 给定,为使, 可对建立某个分布函数,使的取值在(0,1)。 2、Logit模型(Dichotomous/ Binary Logit Model) Logit模型是离散(分类)因变量模型的常用形式,它采用的是逻辑概率分布函数(Cumulative Logistic Probability Function)(e为自然对数的底),逻辑曲线如图4-1所示。其中,二元Logit模型是掌握多类别Logit模型的基础。 图4-1 逻辑曲线(Logit Curve) 以二元选择问题为例,设因变量有0和1两个选择,由自变量来决定选择的结果。为了使二元选择问题的研究成为可能,首先建立随机效用模型: 令表示个体i选择=1的效用, 表示个体i选择=0的效用, 显然当时,选择结果为1,反之为0。将两个效用相减,即得随机效用模型: , 记为 (4-1) 当时,,则个体i选择=1的概率为: 若的概率分布为Logistic分布,则有 即 (4-2) 式(4-2)即为最常用的二元选择模型——Logit模型。 二元Logit选择模型的参数估计通常使用最大似然估计法,令似然函数,再求似然函数L的对数值最大时的参数估计量。 对(4-2)式进行适当的变换,得 即 (4-3) 式(4-3)与式(4-2)是等价的,而且更易于解释,式中为个体i做出选择1的机会比(odds),式中的因变量是机会比(odds)的自然对数,参数的含义为自变量每增加一个单位机会比(odds)的自然对数增加的数值。在多类别选择模型中,通常也是以机会比的自然对数(log-odds)作为因变量建立关于自变量X的线性模型,统称为Logistic回归。 3、Probit模型 同Logit模型的推导,不同在于取分布函数的形式为标准正态的分布函数,则有。 二、多类别Logit模型(Polytomous Logit Model) 对于多类别选择问题,即离散因变量有两个以上的选择类别,可建立多类别Logit模型来研究。根据因变量可供选择的结果类别是否排序,有几种不同类型的Logistic回归,有的只适用于排序选择模型(如Cumulative logit models,Adjacent Categories Models等),有的对于非排序选择模型也适用(如Baseline Logit Models, Conditional Logit Models等)。 1.基准类别Logit模型(Baseline-Category Logit Model) 对于非排序选择问题,通常用基准类别Logit模型来研究。 设离散因变量有类可能结果,令代表个不同的结果类别,各类结果之间相互独立,不存在等级排序关系,定义代表个体选择结果,则个体的可能选择;为个影响因变量选择结果的自变量;定义为个体选择结果的概率,即,则个体做出各类选择的概率 , 。以作为基准类别,可定义个机会比的自然对数(log-odds),引入自变量,则可得基准类别Logit模型(Baseline-Category Logit Model )如下: (4-4) 式中, ,,为样本容量,为自变量个数; ,,为离散因变量结果分类的个数。 可见,模型(4-4)中包括个方程,有个待估参数。 与模型(4-4)等价的是各类结果出现的概率函数,当为非基准类别,即时,

文档评论(0)

cgtk187 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档