- 1、本文档共73页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第九章 stata与离散被解释变量模型 主要内容 1-二值选择模型 2-多值选择模型 3-排序数据模型 4-条件logit模型 5-嵌套logit模型 实验9-1:二值选择模型 一 实验基本原理 二 实验内容和数据来源 根据某统计资料,得到美国妇女就业的数据统计集,形成数据文件“womenwork.dta”,用来研究影响美国妇女就业的因素。被解释变量是work(就业work=1,不就业work=0),解释变量是age(年龄),married(婚否),children(子女数),education(教育年限)。完整的数据在本书附带光盘里的data文件夹的“womenwork.dta”工作文件中。 利用以上数据,建立合适模型对就业的影响因素进行计量分析,由于被解释变量取值有两个可以建立二值选择模型来分析问题。 三 实验操作指导 1.建立logit模型分析 (1)使用logit模型回归 Stata中使用logit模型回归的命令语句格式如下: logit y x1 x2 … [if] [in] [weight] [,options] 该命令中logit表示使用logit模型进行回归,相应y表示模型的被解释变量,x表示模型的解释变量,if表示logit的回归条件,in表示回归的范围,weight表示给观测值的加入权重,options的内容如下表所示: 本实验中,在Stata命令窗口中输入如下命令。 use womenwork, clear 输入此命令来打开需要的数据文件。 logit work age education married children 输入此命令对被解释变量为work,解释变量为age、education、married、children的模型使用logit模型进行回归估计。 在这个回归结果图中log likelihood即对数似然值,不断的试错迭代是logit模型的估计方法,在逐步进行回归时,通过比较不同模型的-2LL判断模型的拟合优度,选择取值更小的模型。LR chi2(4)是卡方检验的统计量,也就是回归模型无效假设所对应的似然比检验量;其中4为自由度,Probchi2 是其对应的P值,在这个估计结果显示以p=0显著说明模型的有效性。其实这两个指标与线性回归结果中F统计量和P值的功能是大体一致的。另外结果中的Pseudo R2是准R2,虽然不等于R2,但可以用来检验模型对变量的解释力,因为二值选择模型是非线性模型,无法进行平方和分解,所以没有,但是准衡量的是对数似然函数的实际增加值占最大可能增加值的比重,所以也可以很好的衡量模型的拟合准确度。此logit模型中拟合优度为0.1882。 coef是自变量对应的系数估计值,OLS通过t检验来检验估计量是否显著,logit模型通过z检验来判断其显著性;通过z检验结果可以看到此模型中系数均以p=0显著不为0。 (2)由于估计系数不像线性模型能够表示解释变量的边际效应,所以Stata中有额外的命令语句来计算解释变量的边际效应: mfx [compute] [if] [in] [,options] 此命令语句中mfx表示对回归之后的模型计算解释变量的边际效应,其中options内容如下表所示: 本实验中,在进行logit模型回归估计后,在Stata命令窗口中输入如下命令: mfx 此命令计算模型回归之后,解释变量取值在样本均值处的边际效应。 此输出结果显示了每一个解释变量的平均边际影响,另外读者可以自己设定计算在边际影响的点,其原理就是命令语句options中的at(atlist)将其具体化,例如“mfx, at (x1=0)”表示计算x1取值为0,其他解释变量取值在样本均值处的边际效应;而“mfx”默认是在所有解释变量在样本平均值处的边际效应。 (3)计算模型预测的百分比来计算模型的拟合优度。 如果要检验这个分类的依据或者要获得每个预测值,可以利用此二值模型进行预测分析,Stata中二值选择模型的预测的命令语句如下所示: predict [type] newvar [if] [in] [,single_options] 其中predict是表示对模型进行预测的命令;newvar表示预测新变量的名称,type可以表明设定新变量的类型;if和in表示对此预测设定的条件和范围;single_options的内容以下表所示: 本实验中,在Stata命令窗口中输入如下预测命令,可以得到预测结果图: predict p1, pr 此命令可以获得此模型的个体估计的值并记为新变量p1 list work p1 此命令可以将实际值与估计值对应罗列,对比看到预测值和实际值的一致程度。 (1)ROC曲线(受试者操控曲线) 此曲线是指图9.3提到的敏感性与(1-特异性)的散点图,
文档评论(0)