十三 logistic回归模型.ppt

  1. 1、本文档共56页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
十三logistic回归模型整理ppt

模型拟合效果检验 模型拟合效果检验 这就是ROC曲线,预测效果最佳时,曲线应该从左下角垂直上升至顶,然后水平向右延伸到右上角。 结果分析 模型拟合效果检验 结果分析 本表是对ROC曲线下面积计算的结果,可见曲线下面积为0.708,95%可信区间为0.624~0.792。 模型拟合优度检验(Test of Goodness Fit ): 考察当前模型是否可以进一步改善,检验当前模型与饱和模型的预测效果之差是否有统计学意义。 拟合优度检验 Pearson 和Deviance 拟合优度检验: 当自变量很多,或包含连续性自变量时,不可以用这两种方法。 似然比检验: 主要用于考察饱和模型是否可以进一步简化。 Hosmer-Lemeshow检验: 通常用于自变量很多,或包含连续性自变量的情况。 拟合优度检验 模型拟合优度检验的常用方法: 点击主对话框中的options按钮,出现如下所示的对话框: 拟合优度检验 拟合优度检验 结果分析 ①用save子对话框可以保存各种残差; ②如果残差的绝对值大于2,提示该记录可能是异常点。 Save子对话框 模型的诊断与修正 残差分析 多重共线性的对偏回归系数的影响与线性回归模型中的表现一致,如增加或删除一条记录,模型中偏回归系数值发生较大变化,专业上认为有意义的因素无统计学意义等等。 如果在进行logistic模型分析中,尤其是在向模型中引入交互作用项时出现了回归结果反常现象,则自变量之间的多重共线性是需要排除的一种可能。 模型的诊断与修正 多重共线性的识别: 浙江大学医学院流行病与卫生统计学教研室 沈毅 二分类logistic回归模型 内容提要 非条件logistic回归 模型简介 简单分析实例 哑变量设置 自变量的筛选方法与逐步回归 模型拟合效果与拟合优度检验 模型的诊断与修正 条件logistic回归 对分类变量的分析,当考察的影响因素较少,且也为分类变量时,常用列联表(Contingency Table)进行整理,并用?2检验或分层?2检验进行分析,但存在以下局限性: 无法描述其作用大小和方向,更不能考察各因素间是否有交互作用; 当控制的分层因素较多时,将导致检验结果不可靠; ?2检验无法对连续性自变量进行分析(致命缺陷)。 模型简介 logistic回归模型适合于应变量为二项分类的资料,在医学研究领域中的应用广泛。如流行病病因学研究(包括队列研究、病例对照研究、横断面研究等)、临床疗效研究(如疗效与治疗方法、患病轻中重等因素关系)、卫生服务研究(如是否就诊与性别、年龄、文化程度的关系)等等。 模型简介 模型简介 logistic回归模型: 反应变量为二分类变量或某事件的发生率; 自变量与logit(P)之间为线性关系; 残差合计为0,且服从二项分布; 各观测间相互独立。 模型简介-适用条件 logistic回归模型应该使用最大似然法来解决方程的估计和检验问题,不应当使用以前的最小二乘法进行参数估计。 例1 某医师希望研究病人的年龄age、性别sex(0为女性、1为男性)、心电图检验是否异常ecg(ST段压低、0为正常、1为轻度异常、2为重度异常)与冠心病ca是否有关,数据见logistic_binary.sav。 简单分析实例 简单分析实例 选入应变量 选入自变量 简单分析实例 简单分析实例 结果分析 此表为应变量取值水平编码,SPSS默认取值水平高的为阳性结果。 简单分析实例 结果分析 本表输出当前模型的-2log(似然值)和两个伪决定系数,但对于logistic回归而言,通常看见的伪决定系数不像线性回归模型中的决定系数那么大。 简单分析实例 结果分析 此表输出模型中的各自变量的偏回归系数及其标准误、Wald ?2、自由度、P 值、OR值(即exp(B))。 哑变量设置 在回归模型中,回归系数b表示其他自变量不变,x每改变一个单位时,所预测的y的平均变化量,当x为连续性变量时,这样解释没有问题,二分类变量由于只存在两个类别间的比较,也可以对系数得到很好的解释。但是当x为多分类变量时,仅拟合一个回归系数就不太合适了,此时需要使用哑变量(dummy variable)方式对模型进行定义。 例2 Hosmer 和Lemeshow于1989年研究了低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重儿(变量名为LOW,1表示低出生体重儿,0表示非低出生体重儿),考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。(数据文件见:logistic_step.sav。) 哑变量设置 哑变量设置 哑变量设置 选入无序多分类变量 设置参照水平 哑变量设置 哑变量设置 结果分析 哑变量(种族)的设置情

文档评论(0)

zyzsaa + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档