- 1、本文档共35页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六讲有限类别因变量回归:Logit模型原理及应用要点
* * Logistic回归的特点 因变量是因变量事件发生与不发生概率之比的对数值 两个概率之比称为odds,有多种翻译,包括发生比、概率比、几率等,而log(odds)被称为对数发生比 该值越大,说明事件发生的可能性越高 该概率比对数值的值域在(正负无穷之间)之间 * * Logistic回归的特点 自变量估计系数可以按照参照OLS回归的方法来解释 值得注意,由于因变量是对数概率比,这一数值本身没有太多现实含义,因此,我们一般不用“自变量每变化一单位,某一事件的对数概率比会变化多少”这一方法来解释估计结果,而是比较笼统地用“随自变量变大,某一事件发生的可能性会随之增大或减少” * * Logistic回归的特点 对数概率比对于参数是线性的,但自变量对事件发生的概率的影响是非线性的(只有非线性才会有边际的存在,线性下,影响是一样的) 如果你想得到某一自变量对事件发生概率的影响,该影响必定是边际影响,即你可以测算出在其他自变量取一定数值的条件下,某一自变量由某一特定的值变化一单位,事件发生的概率会变化多少。这需要进行一定转换计算,我们可以利用Stata进行计算,并绘图,之后会有介绍 * * Logistic模型的估计 最大似然法 对数似然函数(log-likelihood function)和迭代计算法 即通过对估计系数α和β不断的取值,使得对数似然函数值实现最大,具体统计推断参见参考书 最大似然估计法对样本容量的要求 “It is risky to use ML with samples samller than 100, while samples over 500 seem adequate. These values should be rasised depending on characteristics of the model and the data. First, if there are many parameters(参数), more observations are needed... A rule of at least 10 observations per parameters seems reasonable... This does not imply that a minimum of 100 is not needed if you have only two parameters. Second, if the data are ill-conditioned (e. g., or if there is little variation in the dependent variable (e.g., nearly all the outcoindependent variabless are highly collinear) mes are 1), a large sample is required. Third, some models seem to require more observations (such as the ordinal regression model or the zero-inflated count models) (Long, 1997:54) 有序类别回归 * * 如何在Stata中实现Logistic回归分析 两分类别变量的逻辑回归 -logit- 两分类别变量有两种结果,Stata进行logit回归时默认以赋值小的那个结果作为参照结果(baseoutcome) 例如,我们想探讨性别与受教育年限对农民外出从业可能性的影响,因变量是农民是否外出从业,0为在家从业,1为外出从业。此时逻辑回归的因变量即为:外出从业与在家从业的比率 logit emigrant gender edu * * 如何在Stata中实现Logistic回归分析 * * 如何解释Logistic回归的估计结果 用对数概率比进行解释 由于对数概率比没有实际意义,因此,推荐用趋势方法来解释估计结果 如本例,根据逻辑回归估计结果,我们可以说男性外出从业的可能性显著高于女性,受教育程度越高的农民外出从业的可能性越高,而不说,农民个人受教育年限每增加一年,农民外出从业的对数概率比会增加0.11 * * 如何解释Logistic回归的估计结果 用概率比进行解释 如果自变量是类别变量 男性外出从业是女性外出从业的e的0.41倍 自变量变化一单位,因变量概率比变化 倍 * * 如何解释Logistic回归的估计结果 如本例,根据逻辑回归结果 男性外出从业相对于在家从业的概率比是女性的 1.51倍 个人受教育年限每增加一年,农民外出从业相对于在家从业的
文档评论(0)