[数学]第11章 Logistic回归分析.ppt

下载文档 降价啦

4
0
约8.52千字
约 41页
2018-02-16 发布于浙江
举报
版权申诉
保障服务

[数学]第11章 Logistic回归分析.ppt

1、本文档共41页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

[数学]第11章 Logistic回归分析

第11章 Logistic回归分析学习目标了解Logistic回归模型的建立和假设检验；了解Logistic回归模型的应用领域；掌握Logistic回归模型系数的解释，及回归系数与OR值之间的关系；掌握Logistic回归过程步；掌握哑变量的设置和结果的解释；掌握多元Logistic回归模型的逐步过程法和系数的解释；了解条件Logistic回归的应用；掌握条件Logistic回归的SAS程序；概述线性回归模型和广义线性回归模型要求因变量是连续的正态分布变量，且自变量和因变量呈线性关系。当因变量是分类型变量时，且自变量与因变量没有线性关系时，线性回归模型的假设条件遭到破坏。这时，最好的回归模型是Logistic回归模型，它对因变量的分布没有要求，从数学角度看，Logistic回归模型非常巧妙地避开了分类型变量的分布问题，补充完善了线性回归模型和广义线性回归模型的缺陷。从医学研究角度看，Logistic回归模型解决了一大批实际应用问题，对医学的发展起着举足轻重的作用。非条件Logistic回归 Logistic回归分析在医学研究中应用广泛。目前主要是用于流行病学研究中危险因素的筛选，但它同时具有良好的判别和预测功能，尤其是在资料类型不能满足Fisher判别和Bayes判别的条件时，更显示出Logistic回归判别的优势和效能。本研究对Logistic回归方程的判别分析进行了探讨，并用一实例介绍其应用。非条件Logistic回归医学研究中经常需要分析分类型变量的问题。比如，生存与死亡、有病与无病、有效与无效、感染与未感染等二分类变量。研究者关心的问题是，哪些因素导致了人群中有些人患某种病而有些人不患某种病，哪些因素导致了某种治疗方法出现治愈、显效、好转和无效等不同的效果等。这类问题，实质上是一个回归问题，因变量就是上述提到的这些分类型变量，自变量x是与之有关的一些因素。但是，这样的问题却不能直接用线性回归分析方法解决，其根本原因在于因变量是分类型变量，严重违背了线性回归分析对数据的假设条件。那么应该怎样解决这个问题呢？非条件Logistic回归研究者将所研究的问题转换一个角度，不是直接分析y与x的关系，而是分析y取某个值的概率P与x的关系。例如，令y为1，0变量，y=1表示有病，y=0表示未患病；x是与患病有关的危险因素。如果P表示患病的概率，即P=prob（y=1），那么研究患病的概率P与危险因素x的关系就不是很困难的事情了。非条件Logistic回归分析因变量y取某个值的概率P与自变量x的关系，就是寻找一个连续函数，使得当x变化时，它对应的函数值P不超出[0，1]范围。数学上这样的函数是存在且不唯一的，Logistic回归模型就是满足这种要求的函数之一。与线性回归分析相似，Logistic回归分析的基本原理就是利用一组数据拟合一个Logistic回归模型，然后借助这个模型揭示总体中若干个自变量与一个因变量取某个值的概率之间的关系。具体地说，Logistic回归分析可以从统计意义上估计出在其它自变量固定不变的情况下，每个自变量对因变量取某个值的概率的数值影响大小。 Logistic回归模型有条件与非条件之分，前者适用于配对病例对照资料的分析，后者适用于队列研究或非配对的病例-对照研究成组资料的分析。问题的提出在流行病学研究中，经常遇到因变量为离散型分类变量的情况。如治疗效果的无效好转、显效、痊愈；不同染毒剂量下小白鼠的存活或死亡；在某种暴露下的发病与不发病等。最常见的情况是因变量为二分变量的问题。多元线性回归的局限性经典流行病学统计分析方法—分层分析的局限性 1.两种主要的流行病学设计 1）病历对照研究 2）队列研究 2.判断结局（疾病）和暴露（因素）联系强弱的指标 1）相对危险度：RR = p1 / p0 p1: 暴露于某个危险因素下发病的概率 p0: 不暴露于某个危险因素下发病的概率（对照） 2）比值比： OR = {P(D=1|E=1)/P(D=0|E=1)} / {P(D=1|E=0)/P(D=0|E=0)} D=1: 患某种疾病， D=0：不患某种疾病 E=1: 暴露于某个危险因素， E=0: 不暴露于某个危险因素可以简单地表述成：OR = (p1 / q1) / (p0 / q0) p1 : 暴露于某个危险因素下发病的概率 q1 : 暴露于某个危险因素下不发病的概率 p0 : 不暴露于某个危险因素下发病的概率 q0 : 不暴露于某个危险因素下不发病的概率 Mantel-H