6-使用SAS进行LOGISTIC回归.ppt

  1. 1、本文档共75页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
6-使用SAS进行LOGISTIC回归

多元Logistic回归分析 潍坊医学院预防医学系 卫生统计学教研室 Logistic回归分析 ●在医学研究中,我们经常要分析各种危险因素(自变量)与因变量之间的关系,分析危险因素与疾病的联系程度等。而单因素分析方法仅能分析一个因素与疾病的联系,Mantel-haenszel分层分析虽能分析多个因素,但分层较多时,由于要求各格子中例数不能太少,所需样本量大,往往难以做到,应用时受到一定限制。 ●多因素分析时,我们用多元线性回归模型来分析各种危险因素与因变量之间的关系,但要求因变量为服从正态分布的连续性变量,如血压、血红蛋白、血清胆固醇等。 ●在病因学、预后以及危险因素研究中,通常遇到每个观察对象只能是两个互相对立结果中的一种,即二分类资料,如发病、不发病;治愈、未治愈;成功、失败;生存、死亡等。此类变量Y只能取0或1,不能满足线性回归模型中因变量Y应具有正态分布和方差齐性的要求. ●同时,许多变量可能对因变量产生影响,而这种影响不一定是线性的,若用线性回归来分析,可能会得出不合理的结论。 Logistic回归的特点: ●Logistic回归模型克服了上述分析方法的缺点,特别适用于因变量为二项分类、多项分类的资料,可以定量地分析和研究各因素对因变量影响的大小。 ● Logistic回归模型是一种概率模型,它是以疾病、死亡、治愈等结果发生的概率为因变量,影响疾病的发生和预后的因素为自变量建立回归模型。 ● Logistic回归模型不仅用于病因学分析、预后分析、影响因素分析,还可用于鉴别诊断、评价治疗措施等方面的研究,如影响因素的联合作用等。 流行病学中 常用以下两种研究探讨危险因素或验证病因 1. 病例对照研究 2. 队列研究 1. 病例对照研究 病例对照研究是以现在确诊的患有某特定疾病的病人作为病例组,以不患有该病但具有可比性的个体作为对照组,收集病例组和对照组各种可能的危险因素的暴露史,比较两组各因素的暴露比例来做统计学推断,若两组差别有统计学意义,则可认为因素与疾病间存在统计学上的联系。 示意图 若病例与对照不匹配,其资料整理模式可为: 病例与对照匹配有1:1匹配和1:M匹配,其资料整理模式为: 2. 队列研究: 选择暴露于及未暴露于某因素的两组人群,随访观察一定的期间,比较两组人群某种疾病的结局(如发病或死亡),从而判断该因素与发病或死亡有无关联及关联大小的一种观察性研究方法。 示意图 资料整理样式: Logistic回归模型 Logistic回归模型参数估计 2、参数估计 ● Logistic回归的参数估计常用最大似然估计法。 ● 最大似然估计法的基本思想是先建立似然函数,求似然函数达到极大时参数的取值,即为参数的最大似然估计值。计算步骤为对数似然函数中待估计数分别求一阶偏导数,令其为0得一方程组,然后求解。 Logistic回归模型假设检验 求得各参数的估计值后,并不意味着每个因素都与因变量有联系,模型中应只保留对因变量有影响作用的因素,因此应对方程中的各自变量逐一进行检验,剔除对因变量无影响作用的因素,并对所拟合的模型效果进行检验。 Logistic回归模型假设检验 Logistic回归的分类 ●二分类资料Logistic回归可分为非条件Logistic回归和条件Logistic回归,两种方法适用的资料类型不同。 (1)非条件Logistic回归用于成组设计资料和流行病学研究中队列研究资料; (2)条件Logistic回归主要用于配对设计资料; 非条件Logistic回归和条件Logistic回归的计算方法相似,只是似然函数的构造不同。 ●多分类资料的Logistic回归,可用多状态Logistic回归模型进行分析。 非条件Logistic回归模型 非条件Logistic回归既适用于成组设计的病例对照研究,也适用于队列研究,只是应用时略有不同。 队列研究中以相对危险度(RR)定量地反映危险因素对个体发病的影响,而病例对照研究用比值比(OR)定量地反映危险因素对个体发病的影响。 1. 回归系数 的意义 2.非条件Logistic回归的应用要点 (1)不同研究方法应用时的区别 (2)交互作用 (3)不同类型变量的赋值 (4)各变量与logitP的关系 (5)因(应)变量的要求 (6)样本含量 (7)单因素和多因素非条件Logistic回归分析中的? 应用实例一(横断面资料): 应用实例二(成组病例对照研究): 例2:

文档评论(0)

yurixiang1314 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档