- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* 北京理工大学能源与环境政策研究中心 Center for Energy Environmental Policy Research, BIT * * 哑变量经常取值为0,1,-1,但这些取值并不代表数量的大小,仅仅表示不同的类别。在回归分析中,定义哑变量时为了避免共线性,当回归模型包含截距时,如变量有k个类别,需定义k-1个哑变量来表示这些类别;当回归模型中不包含截距时,k个类别,需定义k个哑变量来表示这些类别。哑变量有不同的赋值方法。如性别的选择有两种,则引入一个哑变量,是男则数值为1,否则为0,当然也可以设置为女为1,否则为0。季节的选择有4个,则引入3个哑变量,哑变量1:春为1,否则为0.哑变量2:夏为1,否则为0.哑变量3:秋为1,否则为0. * * * Logit模型的原理及应用 1.问题的提出 如果回归模型的解释变量中含有定性变量,则可以用虚拟变量来处理。 在实际经济问题中,被解释变量也可能是定性变量。 因变量取值是离散的,这类回归模型称为离散选择模型或“定性反应模型” 。 例如通过一系列解释变量的观测值观察人们对某项提议的态度,某件事情的成功和失败等。 这类模型被称为“离散选择模型” :二值选择模型、多值选择模型、计数模型。 2.线性概率模型(Tobit) 2.线性概率模型(Tobit) 2.线性概率模型(Tobit) Pobit模型 Logit模型 2.线性概率模型(Tobit) * 3.Logit 模型---提出 3.Logit 模型---提出 ln 3.Logit 模型----分类 3.Logit 模型----二分类 3.Logit 模型----二分类 若将 看成是因变量,则logit线性回归模型与多元线性回归模型的形式是一致的,且有很多共性。不同的是: 1、logistic回归模型中因变量是二分类的,而且非连续,其误差的分布不再是正态分布,而是二项分布,且所有的分析均建立在二项分布的基础上。 2、由于上述原因,logit回归系数的估计不能再用最小二乘法,而要用极大似然估计法。回归模型和回归系数的检验也不是F检验和t检验,而要用Wald检验、似然比检验等。 3.Logit 模型----二分类 例:讨论某特定人群(例如糖尿病患者)中患动脉硬化的概率与年龄、婚姻状况的关系。试建立死亡率关于年龄和婚姻状况的logit模型。 其中,A表示年龄(取中值),M1、M2、M3表示婚姻状况 其中 3.Logit 模型----多分类 前面讨论的logit模型为二分数据的情况,有时候响应变量有可能取三个或更多值,即多类别的属性变量。 根据响应变量类型的不同,分两种情况: 响应变量为定性名义变量; 响应变量为定性有序变量; 当名义响应变量有多个类别(即名义、无序)时,多项logit模型应采取把每个类别与一个基线类别配成对,通常取最后一类为参照,称为基线-类别logit. 3.Logit 模型----多分类 有些协变量为定量数据,logistic回归模型的协变量可以是定性名义数据。这就需要对名义数据进行赋值。 通常某个名义数据有k个状态,则定义变量 代表前面的k-1状态,最后令k-1变量均为0或-1来代表第k个状态。 如婚姻状况有四种状态:未婚、有配偶、丧偶和离婚,则可以定义三个指示变量M1、M2、M3,用(1,0,0)、 (0,1,0) 、(0,0,1) 、(0,0,0)或(-1,-1,-1)来对以上四种状态赋值。 3.Logit 模型----多分类 【例】研究三个学校、两个课程计划对学生偏好何种学习方式的影响。调查数据见表: 其中,三个学校对应两个哑变量x1和x2(学校一(1.0)学校二(0.1)学校三(0.0)),两个课程计划为常规(M=1)和附加(M=0),学习方式分为:自修(y=1)、小组(y=2)、上课(y=3) 从题目可以看出,响应变量是学习方式有三类,属于多项逻辑斯蒂回归问题。于是,建模为: 3.Logit 模型----多分类(名义) * 北京理工大学能源与环境政策研究中心 Center for Energy Environmental Policy Research, BIT * * 哑变量经常取值为0,1,-1,但这些取值并不代表数量的大小,仅仅表示不同的类别。在回归分析中,定义哑变量时为了避免共线性,当回归模型包含截距时,如变量有k个类别,需定义k-1个哑变量来表示这些类别;当回归模型中不包含截距时,k个类别,需定义k个哑变量来表示这些类别。哑变量有不同的赋值方法。如性别的选择有两种,则引入一个哑变量,是男则数值为1,否则为0,当然也可以设置为女为1,否则为0。季节的选择有4个,则引入3个哑变量,哑变量1:春为1,否则为0.哑变量2:夏为1,否则
您可能关注的文档
- Excel表格运用培训-(演示).PPT
- Excel财务表格制作.PPT
- FTTH基础知识培训.PPT
- G01外圆自动加工练习.PPT
- GaN-LED-原理简介(英文版).PPTX
- GB7000.1新版2015标准差异说明.PPTX
- GHQ标准安全培训-防御性驾驶和交通安全.PPT
- GAS-SYSTEM施工规范(洁净管路).PPT
- GINA哮喘指南解读.PPT
- GMP卫生意识培训.PPT
- 2024至2030年中国不锈钢原粒莲子开边脱衣机行业投资前景及策略咨询研究报告.docx
- 2024至2030年传感信号处理集成电路项目投资价值分析报告.docx
- 2010-2023历年高考英语语法考前训练试题精选10.docx
- 2010-2023历年高考一轮专题2识记并正确书写现代常用规范汉字练习卷(带解析).docx
- 2024至2030年中国球头垫行业投资前景及策略咨询研究报告.docx
- 2024年中国数字校园数码录/播放器市场调查研究报告.docx
- 2010-2023历年黑龙江海林高级中学高二下学期期中考试历史卷(带解析).docx
- 2024至2030年中国细加工用立铣刀行业投资前景及策略咨询研究报告.docx
- 2010-2023历年高级中等学校招生全国统一考试数学卷(江苏宿迁).docx
- 2010-2023历年陕西定边县第四中学高一上期第一次月考历史试卷(带解析).docx
文档评论(0)