网站大量收购闲置独家精品文档,联系QQ:2885784924

logistic回归分析(重怕点、难点).ppt

  1. 1、本文档共65页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
logistic回归分析(重怕点、难点)

几个重要的流行病学概念 病因分析(预后分析)的目的:找出影响疾病发生(或预后好坏)的影响因素及其影响的强度。 如果某因素对疾病发生有影响,就称该因素与疾病的发生有关联,关联的强度则反映其对疾病发生影响的大小。 几个重要的流行病学概念 队列研究(cohort study) 病例对照研究(case-control study) 危险度(risk) 相对危险度(relative risk, RR) 比数比或优势比(odds ratio, OR) 队列研究 队列研究(cohort study) :对“因”分类上的人群作追踪随访,观察其“果”,然后对资料进行比较分析,从而判断“因”与“果”之间有无关联及关联的强度。 病例对照研究 病例对照研究(case-control study):是对“果”分类上的人群作回顾性调查,观察其“因”,然后对资料进行比较分析,从而判断“果”与“因”间关联有无统计学意义及关联的强度。 相对危险度 RR>1:表示该因素为危险因素,使发病危险度增大。 RR<1:表示该因素为保护因素,使发病危险度减小。 RR=1:表示该因素对疾病的发病无影响。 比数比 一个病例对照研究资料 第一节 Logistic回归分析 Logistic Regression 实例 实例 表16-2 冠心病8个可能的危险因素与编码说明 Logistic回归模型 Logistic曲线 实例分析 实例分析 数据准备成3列:例数、吸烟史(1:有,0:无),膀胱癌(1:有,0:无) 实例分析 Data Weight cases 实例分析 Analyze Regression Binary Logistic 实例分析 应变量编码 变量的筛选 表16-2 冠心病8个可能的危险因素与编码说明 第二节 条件Logistic回归分析 Conditional Logistic Regression 条件Logistic回归的原理 条件Logistic回归(conditional Logistic regression)是针对配对或分层资料分析的一种方法。 为了控制一些重要的混杂因素(如性别和年龄等),流行病学常采用1:M配对的研究方法,即每一个病例与M个与它条件相一致的对照形成一个匹配组(每一匹配组为一个层)。 条件Logistic回归,其实质是在构造似然函数时利用适当的条件分布,实现在各层中进行比较。 条件Logistic回归模型 实例分析 例16-3 某市调查三种生活方式与胃癌发病的关系,采用1:1配对的病例?对照研究形式。按每个病例的性别、年龄和居住地选取一个健康作为对照。调查的三种生活方式取值见表16-7,共调查了50对病例与对照。试作条件Logistic逐步回归分析。 实例分析 数据准备成4列:X1、X2、X3,配对号及疾病发生情况Y(1:病例,0:对照)。 实例分析 实例分析 第三节 Logistic回归的应用 及注意事项 Logistic回归的样本量 Logistic回归要求有足够的样本含量,样本含量愈大分析结果愈可靠。 实际中病例和对照的人数应至少各有20~30例,方程中的变量个数愈多需要的例数也就愈大。 对于配对资料,一般样本的匹配组数应为纳入方程中的自变量个数的20倍以上。 Logistic回归系数的理解 βj 的值并不具有OR或RR的直接含义,它只是OR或RR的自然对数值。 βj 的正负号与危险因素的赋值方式有密切联系,因此应结合Xj 具体的赋值方式来理解Xj 对所研究疾病的影响。 各βj 的绝对值大小并不直接表明各危险因素Xj 对疾病发生的相对重要性,这是由于各Xj 的量纲不同。如果要比较各危险因素对疾病影响作用的相对大小,应使用标准化Logistic回归系数βj ‘。 由病例对照资料作Logistic回归得到的模型不能直接用于发病概率的估计(此时,得到的是暴露率),而队列研究得到的Logistic回归模型可以用于发病率估计。 模型参数的意义 模型参数的意义 α α logistic回归模型的参数估计 原理:最大似然( likelihood )估计 参数估计 可反映某一因素两个不同水平(c1,c0)的优势比。 优势比估计 logistic回归模型的参数估计 logistic回归模型的假设检验 2. 1.似然比检验: -2lnL近似服从 分布 G = 2(lnL1-lnL0)= 2ln(L1/L0) ν=p-l 标准化回归系数 标准化回归系数绝对值越大,说明相应变量的作用越大. 模型拟合结果 方法:前进法、后退法和逐步法。 检验统计量:不是 F 统计量,而是似然比统计量、 Wald 统

文档评论(0)

150****4233 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档