网站大量收购闲置独家精品文档,联系QQ:2885784924

logistic回归(II).ppt

  1. 1、本文档共42页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第5讲 logistic族回归(II) 主要内容 多元logistic回归 条件logistic回归 多类结果的logistic回归 有序结果的logistic回归 logistic回归的正确应用 2 条件logistic回归 配比(matched)设计资料 1:1 1:2 2:1 n:m 1:m配比设计的资料格式 配比设计资料的logistic回归 软组织肉瘤与接触苯氧乙酸的关系 软组织肉瘤与接触苯氧乙酸或氯酚的原始数据 相应的条件logistic回归模型 子宫内膜癌与是否使用了雌激素 条件logistic回归(考虑是否使用过) 条件logistic回归(考虑使用过多少) 3 多类结果变量的logistic回归模型 多类结果变量的logistic回归模型 各类概率 产后大出血与妊高症的关系 产后大出血与妊高症的三类结果logistic回归 logit P宫/对=-1.6206+0.889755x logit P胎/对=-3.2806+1.776555x e0.889755=2.4345331 e1.776555=5.9094650 两类产后大出血与妊高症、人流史的关系 三分类结果的logistic回归 三分类结果的logistic回归 logit P宫/对=-1.5548+0.9483x1-0.3882x2 logit P胎/对=-3.5489+1.5972x1+0.9375x2 log-likelihood=-544.4177 有条件限制的多类结果的logistic回归 限制条件?11=?21: logit P宫/对=-1.5660+1.1100x1-0.4077x2 logit P胎/对=-3.4968+1.1100x1+ 0.9841x2 log-likelihood=-545.0718 实例:恶性淋巴瘤的病例-对照研究 实例:恶性淋巴瘤的病例-对照研究 其它对照形式(多分类) 鳞癌、腺癌:正常对照 病例:父母亲对照 病例:配偶:兄妹对照 病例:同单位:不同单位正常对照 4 有序分类资料的logistic回归 设结果变量y为k个等级的有序变量,k个等级分别用1,2,?,k表示。 累积概率(cumulative probability) 意义 有序分类结果的logistic回归定义为 k等级分为两类:{1,?,j} 与 {j+1,?,k} 在这两类的基础上定义的logit表示: 属于后k-j个等级的累积概率与前j个等级的累积概率的比数之对数,故该模型称为累积比数模型(cumulative odds model)。 回归系数的解释 回归系数 ?i 表示自变量 xi 每改变一个单位, y 值提高一个及一个以上等级之比数比的对数值。 儿童智力等级与母亲文化程度的关系 儿童智力等级与母亲文化程度的累积比数logistic回归 概率预测 累积比数模型的假定 第一种: {无效},{有效、显效、治愈} 第二种: {无效、有效},{显效、治愈} 第三种: {无效、有效、显效},{治愈} 无论对哪种分法,治疗方案的效应是相同的。 即自变量的回归系数与分割点j无关。 二分类结果的回归 第一种,{1},{2、3、4},得: ?= 1.4653, ?=0.6309 第二种,{1、2},{3、4},得: ? =-1.2143, ? =0.6279 第三种,{1、2、3},{4},得: ? =-3.6844, ? =0.7197 营养与智力的关系 单因素分析结果 多因素分析 其它类型的结果变量 疗效等级 无效、好转、显效、治愈 疾病的严重程度 正常、临界、异常 未发病、发病、病死 心功能分级 I、II、III、IV 5 logistic族回归模型的正确应用 logistic族回归模型的应用条件 独立性。各观察对象间是相互独立的。 logitP与自变量的关系是线性关系。 累积比数logistic回归模型假设,自变量的回归系数与分割点j无关。可通过建立多个二分类的logistic回归模型来考察。 队列资料,建议用Poisson回归。 回归系数的检验 似然比检验:最可靠 Wald检验:未考虑各因素的综合作用,当存在共线性时,结果不可靠。故在筛选变量时应慎重。可信区间是基于Wald统计量计算的。 比分检验。与似然比检验一致 在对混杂因素进行分析时,如协变量对回归系数的影响较大(比如,方程中某变量的回归系数,在有该协变量时比无该协变量时改变了0.5以上),则该变量就认为有重要影响的变量,无论该变量是否有统计学意义。 logistic回归的样本含量 有研究表明,当各组样本含量大于自变量数的20倍时,参数估计的偏差是可以接受

文档评论(0)

好文精选 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档