- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
logistic回归整理ppt
Logistic回归分析及其应用 温泽淮 DME中心 概述 1967年Truelt J,Connifield J和Kannel W在《Journal of Chronic Disease》上发表了冠心病危险因素的研究,较早将Logistic回归用于医学研究。 一般概念 一元直线回归 多元直线回归 一元直线回归模型 y = a + b x + e 多元直线回归模型 y = a + b1x1 + b2x2 + … + bkxk + e 一般直线回归难以解决的问题 医学数据的复杂、多样 连续型和离散型数据 医学研究中疾病的复杂性 一种疾病可能有多种致病因素或与多种危险因素有关 疾病转归的影响因素也可能多种多样 临床治疗结局的综合性 简单的解决方法 固定其他因素,研究有影响的一两个因素; 分层分析:按1~2个因素组成的层进行层内分析和综合。 统计模型 寻找合适的模型 进行logit变换 logit(p) = ln( —— ), p为y=1所对应的概率 logit(0.1) = ln( ——— ) = ln(0.1/0.9) logit(p) = ln( —— ) p=0或1时,此式失效 以 p = r/n 代之 logit(p) = ln [ (r + 0.5) / (n – r + 0.5) ] 此称经验logistic变换 以Z代上式的logit(p), Z = a + b1x1 + b2x2 + … + bkxk 称此为logistic回归模型 P = ez / (1 + ez ) ea+ b1x1 + b2x2 +… +bkxk 1 + ea+ b1x1 + b2x2 +… +bkxk 此为非条件logistic回归模型 应用于成组数据的分析 自变量取定一些值时,因变量取0、1的概率就是条件概率,对条件概率进行logistic回归,称为条件logistic回归 表达式: eb1x1+b2x2+… +bkxk 1 - eb1x1+b2x2+… +bkxk 常用于分析配比的资料 概述小结 logistic回归对因变量的比数的对数值( logit值)建立模型 因变量的logit值的改变与多个自变量的加权和呈线性关系 因变量呈二项分布 分析的一般步骤 变量的编码 哑变量的设置和引入 各个自变量的单因素分析 变量的筛选 交互作用的引入 建立多个模型 选择较优的模型 模型应用条件的评价 输出结果的解释 1.变量的编码 变量的编码要易于识别 注意编码的等级关系 改变分类变量的编码,其分析的意义并不改变。 牢记编码 使用变量数值标识(value labels) 记录编码内容 变量的编码 变量名 变量标识 变量值 值标识 SEX 性别 1 男 2 女 EDU 教育程度 0 文盲 1 小学 2 初中及以上 variable labels qnum 问卷序号 rnum 录入序号 pnum 病人编号 hnum 住院号/门诊号 chname 患者中文姓名 drugroup 组别 name 患者姓名 sex 患者性别 age 患者年龄 2.哑变量的设置和引入 哑变量,又称指示变量或设计矩阵。 有利于检验等级变量各个等级间的变化是否相同。 一个k分类的分类变量,可以用k-1个哑变量来表示。 哑变量的设置 SPSS提供的方法 Indicator: 默认。以第1 或最后1类作对照,其他每类与对照比较; Sampl
文档评论(0)