- 1、本文档共86页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
logistic回归分析43916.ppt
第十六章 logistic回归分析 问题提出: 医学研究中常研究某因素存在条件下某结果是否发生?以及之间的关系如何? 因素(X) 疾病结果(Y) x1,x2,x3…XK 发生 Y 1 不发生 Y 0 例:暴露因素 冠心病结果 高血压史 x1 :有 或无 有 或 无 高血脂史 x2 : 有 或 无 吸烟 x3 : 有或无 研究问题可否用多元线性回归方法? 1.多元线性回归方法要求 Y 的取值为计量的连续性随机变量。 2.多元线性回归方程要求Y与X间关系为线性关系。 3.多元线性回归结果 不能回答“发生与否” logistic回归方法补充多元线性回归的不足 Logistic回归方法 该法研究是 当 y 取某值(如y 1)发生的概率(p)与某暴露因素(x)的关系。 P(概率)的取值波动0~1范围。 基本原理:用一组观察数据拟合Logistic模型,揭示若干个x与一个因变量取值的关系,反映y 对x的依存关系。 第一节??? logistic回归一、基本概念 1.变量的取值 logistic回归要求应变量(Y)取值为分类变量(两分类或多个分类) 自变量(Xi)称为危险因素或暴露因素,可为连续变量、等级变量、分类变量。 可有m个自变量X1, X2,… Xm 2.两值因变量的logistic回归模型方程 一个自变量与Y关系的回归模型 如:y:发生 1,未发生 0 x : 有 1,无 0, 记为p(y 1/x)表示某暴露因素状态下,结果y 1的概率(P)模型。 几个logistic回归模型方程 logistic回归模型方程的线性表达 对logistic回归模型的概率(p)做logit变换, 在有多个危险因素(Xi)时 多个变量的logistic回归模型方程的线性表达: 2.模型中参数的意义 的含义:某危险因素,暴露水平变化时,即Xi 1与Xi 0相比,发生某结果(如发病)优势比的对数值。 危险因素 Y x 1 x 0 发病 1 30(a) 10( b) 不发病 0 70(c) 90(d) a+c b+d 危险因素 Y x 1 x 0 发病 1 p1 p0 不发病 0 1-p1 1-p0 多元回归模型的的 概念 反映了在其他变量固定后,X 1与x 0相比发生Y事件的对数优势比。 回归系数β与OR X与Y的关联 β 0,OR 1, 无关 β>1,OR>1 , 有关,危险因素 β<1,OR<1, 有关,保护因子 事件发生率很小,OR≈RR。 二、logistic回归模型的参数估计 1. 模型中的参数(βi)估计 通常用最大似然函数 maximum likelihood estimate, MLE 估计β, 由统计软件包完成。 讲义259页) 2. 优势比 OR 及可信区间的估计 如X 1,0两分类,则OR的1-α可信区间估计公式 例:讲义表16-1资料 一个研究吸烟、饮酒与食道癌关系的病例-对照资料(886例),试作logistic回归分析。 变量的赋值 经logistic回归计算后得 b0 -0.9099, b1 0.8856, b2 0.5261, OR的可信区间估计 三、Logistic 回归模型的假设检验 1.检验一:对建立的整个模型做检验。 说明自变量对Y的作用是否有统计意义。 检验方法(讲义260-261页) 1)似然比检验 likelihood ratio test 2)Wald检验 3)计分检验 score test 例表16-1吸烟、饮酒与食管癌资料(SAS软件计算) 1.对建立的整个模型做检验。 Testing Global Null Hypothesis: BETA 0 Test Chi-Square DF Pr 似然比 68.5457 2 .0001 计分检验 67.0712 2 .0001 Wald检验 64.2784 2 .0001 2.检验二: 检验模型中某β是否对Y有作用。 检验假设: 检验统计量:主要为Wald检验(SAS软件) 例; 在大样本时,三方法结果一致。 例表16-1资料,对各x的β做检验(wald检验) 参数 β估计值 标准误 Chi-Squa Pr 常数-0.9099 0.1358 44.8699 .0001 吸烟 0.8856 0.1500 34.8625 .0001 饮酒 0.5261 0.1572 11.2069 .0008 似然比检验(讲义) 对某个β做检验,检验统计量(G) 似然比检验对β做检验 例:X1为吸烟,X2为饮酒,检验饮酒与食管癌关系,H0:β2 0,H1:β2≠0 四、变量筛选 目的;将回归系数有显著意义的自变量
文档评论(0)