逻辑回归分析资料.ppt

  1. 1、本文档共55页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
逻辑回归分析资料

SPSS 16实用教程 逻辑回归分析 比如在致癌因素的研究中,我们收集了若干人的健康记录,包括年龄、性别、抽烟史、日常饮食以及家庭病史等变量的数据。响应变量在这里是一个两点(0-1)分布变量,Y=1(一个人得了癌症),Y=0(没得癌症)。 如果我们按照(1)建立一般线性模型: 因为Y只能取0或1,而 的取值是连续的。显然不能用 来预测因变量 Y 。 我们注意到,对于0-1型变量, E(Y)=P(Y=1)=p 因而,我们似乎可以用 来预测Y=1的概率,即: 问题1. Y=1的概率与自变量之间的关系到底是不是线性的?(答案是否定的) 例如:我们分析一个人是否买车与其年收入的关系。对于年薪5000元、5万元、50万元三个人,让他们的年薪分别增加5000元对于其买车的可能性影响是不一样的。 问题2. 概率的取值应该在0~1之间。但是(2)式的概率线性模型并不能满足这一点。 我们可以通过对P进行一种变换(logit变换) logit(p)= ln(p/(1-p)) 使得logit(p)与自变量之间存在线性相关的关系。 作业(共两题) 1.根据三个财务比率估计公司破产概率。(数据见ftp 财务比率与破产预测.sav) Y=0,若两年后破产 Y=1, 若两年后仍有偿付能力 X1=未分配利润/总资产 X2=支付利息税金前的利润/总资产 X3=销售额/总资产 按照习题模式,列出最终计算结果,并做出必要解释。 (Logistic 模型最终表达式 模型检验、拟合优度 Wald 检验 最终分类表、观测与预测分布图 系数相关矩阵) 2.对于1986年挑战者号航天飞机灾难之前的23次航天飞行,数据 航天飞机热遇险.sav给出了飞行时温度和是否至少有一个主要O型圈遭受热遇险。(数据见ftp) a)利用logistic回归建立温度对热遇险概率的模型,并对效应进行解释。 b)估计挑战者号飞行时温度为华氏31度时的热遇险概率。 c)温度为多少时,概率等于0.50?在该温度下,给出温度每增加一度导致的概率估计值的线性近似变化。 d)利用wald检验,检验不存在温度效应的假设 和线性回归一样,我们可以通过next按钮把自变量分成不同的组块,使不同的组块按顺序以不同的方式分步进入模型 这里,我们可以把几个变量的乘积作为自变量引入模型作为交互影响项 如果自变量中有分类变量,在这里可以设置相应的虚拟变量 图7-25 “Logistic Regression:Options”对话框 Classification plots:制作分类图,通过比较因变量的观测值与预测值的关系,反映回归模型的拟合效果。 Hosmer-Lemeshow goodness-of-fit: H-L检验。 Casewise listing of residuals:显示个案的残差值(显示标准化残差超过两倍标准方差的个案或显示所有个案) Correlations of estimates:输出模型中各参数估计的相关矩阵。 Iteration history:输出最大似然估计迭代过程中的系数以及log似然值。 CI for exp(B):输出exp(beta)的置信区间,默认置信度为95% 根据概率对数据进行分类时的概率界限值,默认值为0.5 参数估计时,似然函数值收敛到最大值前的最大迭代次数。 选择输出结果的方式。显示每一步的计算结果或是只显示最后的结果 设定自变量进入模型方程或被剔除出方程的标准。 在save选项中,我们可以选择需要保存的数据文件中的统计量。包括残差值、个案影响度统计量、预测概率值等等 (1)第一部分输出结果有两个表格,第一个表格说明所有个案(28个)都被选入作为回归分析的个案。 7.8.3 结果和讨论 第二个表格说明初始的因变量值(0,1)已经转换为逻辑回归分析中常用的0、1数值。 (2)第二部分(Block 0)输出结果有4个表格。(组块0里只有常数项,没有自变量) 分类表 (3)Omnibus Tests of Model Coefficients表格列出了模型系数的Omnibus Tests结果。 (4)Model Summary表给出了-2 对数似然值、Cox和Snell的R2以及Nagelkerke的R2检验统计结果。 (5)Hosmer and Lemeshow Test P值大于0.05,说明模型有一定的解释能力 (6)Classification Table分类表说明第一次迭代结果的拟合效果,从该表格可以看出对于y=0,有86.7%的准确性;对于y=1,有76.9%准确性,因此对于所有个案总共有8

文档评论(0)

wyjy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档