logit的原理及应用.ppt

  1. 1、本文档共19页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
logit的原理及应用

* 北京理工大学能源与环境政策研究中心 Center for Energy Environmental Policy Research, BIT * Logit模型的原理及应用 2017年3月3日 1.问题的提出 如果回归模型的解释变量中含有定性变量,则可以用虚拟变量来处理。 在实际经济问题中,被解释变量也可能是定性变量。 因变量取值是离散的,这类回归模型称为离散选择模型或“定性反应模型” 。 例如通过一系列解释变量的观测值观察人们对某项提议的态度,某件事情的成功和失败等。 这类模型被称为“离散选择模型” :二值选择模型、多值选择模型、计数模型。 2.线性概率模型(Tobit) 2.线性概率模型(Tobit) 2.线性概率模型(Tobit) Pobit模型 Logit模型 2.线性概率模型(Tobit) * 3.Logit 模型---提出 3.Logit 模型---提出 ln 3.Logit 模型----分类 3.Logit 模型----二分类 3.Logit 模型----二分类 若将 看成是因变量,则logit线性回归模型与多元线性回归模型的形式是一致的,且有很多共性。不同的是: 1、logistic回归模型中因变量是二分类的,而且非连续,其误差的分布不再是正态分布,而是二项分布,且所有的分析均建立在二项分布的基础上。 2、由于上述原因,logit回归系数的估计不能再用最小二乘法,而要用极大似然估计法。回归模型和回归系数的检验也不是F检验和t检验,而要用Wald检验、似然比检验等。 3.Logit 模型----二分类 例:讨论某特定人群(例如糖尿病患者)中患动脉硬化的概率与年龄、婚姻状况的关系。试建立死亡率关于年龄和婚姻状况的logit模型。 其中,A表示年龄(取中值),M1、M2、M3表示婚姻状况 其中 3.Logit 模型----多分类 前面讨论的logit模型为二分数据的情况,有时候响应变量有可能取三个或更多值,即多类别的属性变量。 根据响应变量类型的不同,分两种情况: 响应变量为定性名义变量; 响应变量为定性有序变量; 当名义响应变量有多个类别(即名义、无序)时,多项logit模型应采取把每个类别与一个基线类别配成对,通常取最后一类为参照,称为基线-类别logit. 3.Logit 模型----多分类 有些协变量为定量数据,logistic回归模型的协变量可以是定性名义数据。这就需要对名义数据进行赋值。 通常某个名义数据有k个状态,则定义变量 代表前面的k-1状态,最后令k-1变量均为0或-1来代表第k个状态。 如婚姻状况有四种状态:未婚、有配偶、丧偶和离婚,则可以定义三个指示变量M1、M2、M3,用(1,0,0)、 (0,1,0) 、(0,0,1) 、(0,0,0)或(-1,-1,-1)来对以上四种状态赋值。 3.Logit 模型----多分类 【例】研究三个学校、两个课程计划对学生偏好何种学习方式的影响。调查数据见表: 其中,三个学校对应两个哑变量x1和x2(学校一(1.0)学校二(0.1)学校三(0.0)),两个课程计划为常规(M=1)和附加(M=0),学习方式分为:自修(y=1)、小组(y=2)、上课(y=3) 从题目可以看出,响应变量是学习方式有三类,属于多项逻辑斯蒂回归问题。于是,建模为: 3.Logit 模型----多分类(名义) 3.Logit 模型----多分类(有序) 对有序数据的赋值可以按顺序用数0,1,2,3,4分别表示 3.Logit 模型----多分类(有序) 3.Logit 模型----多分类(有序) * * 哑变量经常取值为0,1,-1,但这些取值并不代表数量的大小,仅仅表示不同的类别。在回归分析中,定义哑变量时为了避免共线性,当回归模型包含截距时,如变量有k个类别,需定义k-1个哑变量来表示这些类别;当回归模型中不包含截距时,k个类别,需定义k个哑变量来表示这些类别。哑变量有不同的赋值方法。如性别的选择有两种,则引入一个哑变量,是男则数值为1,否则为0,当然也可以设置为女为1,否则为0。季节的选择有4个,则引入3个哑变量,哑变量1:春为1,否则为0.哑变量2:夏为1,否则为0.哑变量3:秋为1,否则为0. * * * 北京理工大学能源与环境政策研究中心 Center for Energy Environmental Policy Research, BIT * * 哑变量经常取值为0,1,-1,但这些取值并不代表数量的大小,仅仅表示不同的类别。在回归分析中,定义哑变量时为了避免共线性,当回归模型包含截距时,如变量有k个类别,需定义k-1个哑变量来表示这些类别;当回归模型中不包含截距时,k个类别,需定义

文档评论(0)

135****6041 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档