逻辑回归分析资料.ppt

下载文档 降价啦

16
0
约5.19千字
约 55页
2017-06-21 发布于湖北
举报
版权申诉
保障服务

逻辑回归分析资料.ppt

1、本文档共55页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

逻辑回归分析资料

SPSS 16实用教程逻辑回归分析比如在致癌因素的研究中，我们收集了若干人的健康记录，包括年龄、性别、抽烟史、日常饮食以及家庭病史等变量的数据。响应变量在这里是一个两点（0-1）分布变量，Y=1（一个人得了癌症），Y=0（没得癌症）。如果我们按照（1）建立一般线性模型：因为Y只能取0或1，而的取值是连续的。显然不能用来预测因变量 Y 。我们注意到，对于0-1型变量， E(Y)=P(Y=1)=p 因而，我们似乎可以用来预测Y=1的概率，即：问题1. Y=1的概率与自变量之间的关系到底是不是线性的？（答案是否定的）例如：我们分析一个人是否买车与其年收入的关系。对于年薪5000元、5万元、50万元三个人，让他们的年薪分别增加5000元对于其买车的可能性影响是不一样的。问题2. 概率的取值应该在0~1之间。但是（2）式的概率线性模型并不能满足这一点。我们可以通过对P进行一种变换（logit变换） logit(p)= ln(p/(1-p)) 使得logit(p)与自变量之间存在线性相关的关系。作业（共两题） 1.根据三个财务比率估计公司破产概率。（数据见ftp 财务比率与破产预测.sav） Y=0，若两年后破产 Y=1，若两年后仍有偿付能力 X1=未分配利润/总资产 X2=支付利息税金前的利润/总资产 X3=销售额/总资产按照习题模式，列出最终计算结果，并做出必要解释。（Logistic 模型最终表达式模型检验、拟合优度 Wald 检验最终分类表、观测与预测分布图系数相关矩阵） 2.对于1986年挑战者号航天飞机灾难之前的23次航天飞行，数据航天飞机热遇险.sav给出了飞行时温度和是否至少有一个主要O型圈遭受热遇险。（数据见ftp） a)利用logistic回归建立温度对热遇险概率的模型，并对效应进行解释。 b)估计挑战者号飞行时温度为华氏31度时的热遇险概率。 c)温度为多少时，概率等于0.50？在该温度下，给出温度每增加一度导致的概率估计值的线性近似变化。 d)利用wald检验，检验不存在温度效应的假设和线性回归一样，我们可以通过next按钮把自变量分成不同的组块，使不同的组块按顺序以不同的方式分步进入模型这里，我们可以把几个变量的乘积作为自变量引入模型作为交互影响项如果自变量中有分类变量，在这里可以设置相应的虚拟变量图7-25 “Logistic Regression：Options”对话框 Classification plots:制作分类图，通过比较因变量的观测值与预测值的关系，反映回归模型的拟合效果。 Hosmer-Lemeshow goodness-of-fit: H-L检验。 Casewise listing of residuals:显示个案的残差值（显示标准化残差超过两倍标准方差的个案或显示所有个案） Correlations of estimates:输出模型中各参数估计的相关矩阵。 Iteration history:输出最大似然估计迭代过程中的系数以及log似然值。 CI for exp(B):输出exp(beta)的置信区间，默认置信度为95% 根据概率对数据进行分类时的概率界限值，默认值为0.5 参数估计时，似然函数值收敛到最大值前的最大迭代次数。选择输出结果的方式。显示每一步的计算结果或是只显示最后的结果设定自变量进入模型方程或被剔除出方程的标准。在save选项中，我们可以选择需要保存的数据文件中的统计量。包括残差值、个案影响度统计量、预测概率值等等（1）第一部分输出结果有两个表格，第一个表格说明所有个案（28个）都被选入作为回归分析的个案。 7.8.3 结果和讨论第二个表格说明初始的因变量值（0，1）已经转换为逻辑回归分析中常用的0、1数值。（2）第二部分（Block 0）输出结果有4个表格。（组块0里只有常数项，没有自变量）分类表（3）Omnibus Tests of Model Coefficients表格列出了模型系数的Omnibus Tests结果。（4）Model Summary表给出了-2 对数似然值、Cox和Snell的R2以及Nagelkerke的R2检验统计结果。（5）Hosmer and Lemeshow Test P值大于0.05，说明模型有一定的解释能力（6）Classification Table分类表说明第一次迭代结果的拟合效果，从该表格可以看出对于y=0，有86.7%的准确性；对于y=1，有76.9%准确性，因此对于所有个案总共有8