- 1、本文档共34页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十三章 分类资料回归分析(Regression)
13.1 分类资料回归分析方法概述
分类资料回归分析(regression of categorical data)是针对因变量为分类资料的一类回归分析方法。常用的Logistic类回归(Logistic regression)属于概率型非线性回归,是一类研究因变量为二分类或多分类观察指标与一些“危险因素”间
一、常用术语
1.回归系数假设检验统计量
(1)Wald检验
Wald检验(Wald test)统计量服从分布,计算式为:
(13-1)2)似然比检验
用于比较两个模型的拟合效果。检验统计量为:G=2lnL-(-2lnL’)。其中L是模型1的似然函数,L’是模型2的似然函数,分布。原假设为模型1和模型2拟合效果无;备择假设为模型1和模型2拟合效果有改变。似然比检验既适合单个自变量的假设检验又适合多个自变量的同时检验。3)比分检验
比分检验(score test)分布。
2.相对危险度和优势比
相对危险度(relative risk,RR)是表示暴露在某危险因子下的发病率与不暴露在某危险因子下的发病率的比值。其公式为:
(13-2)
优势比(odds ratio, OR)是表示暴露在某危险因子的发病率p1与不发病率(1-p1)之比与未暴露在某危险因子下的发病率p2与不发病率(1-p2)之比的比值。其公式为:
(13-3)
二、Logistic类回归分析方法
1.二分类Logistic回归:因变量为二分类变量的Logistic回归分析,分为非条件Logistic回归和条件Logistic回归。
2.多分类Logistic回归:因变量为多分类无序变量的Logistic回归分析。
3.有序Logistic回归:因变量为有序分类变量的Logistic回归分析。
4.概率单位回归分析:分析剂量-反应关系,计算半数有效量或半数致死量。
13.2 二分类Logistic回归
一、统计方法回顾
(一)二分类非条件Logistic回归
1. 二分类非条件Logistic回归数学模型
设观察值有p个因素即自变量为X1, X2, …, Xp;因变量Y为二分类变量,即Y=1为阳性,Y=0为阴性。定义其阳性率P和阴性率1-P分别为
(13-4)
(13-5)
式中β0为与因素无关的截距项,β1, β2, …, βp称为偏回归系数或回归系数,它们分别反映自变量X1, X2, …, Xp作用的大小。阳性率与阴性率之比称为优势(odds),由式()与()可得优势的对数值为
ln(P/(1P))= β0+β1X1 +β2X2+ …+ βpXp (13-6)
(13-6)式称为线性Logistic回归,其中的回归系数β1β2,…,βp,用极大似然法进行估计。βi. 参数估计和假设检验Logistic回归的参数估计用大似然法假设检验常用似然比检验和Wald检验。
(二条件Logistic回归
在匹配设计的病例-对照研究中,每一匹配组内的病例与对照是可比的,需要按组内对象的暴露状况和发病情况建立Logistic回归。1:1配对设计介绍条件Logistic回归模型1.条件Logistic回归模型设有p个因素,即自变量为X1, X2, …, Xp;因变量Y为二分类变量, Y=1为阳性,Y=0为阴性。记一对中的病例为A对照为B。假定个体阳性的概率正比于exp(β0+βi),则一对病例和对照中只有一人得病的条件下恰好是A得病的概率为P(Y=1∣一对中只有一人得病)=
= (13-7)
其中exp(βi)表示其它变量值不变时,第i个变量增加一个单位时,患病的概率增加的倍数,即相对危险度RR。
2.条件Logistic回归的参数估计和假设检验同非条件Logistic回归二、SPSS操作指南
例13-1 某医师观察30例胃癌术后复发情况,以术后复发为因变量,拟选年龄、胃切除、家族遗传、营养状况、术后化疗为自变量,筛选胃癌复发的危险因素。
(一)变量设置
在Variable View中设置七个变量:病人编号;术后复发,取值Values:0=无复发复发Values:1=部分切除、2=大部分切除、3=全部切除;家族遗传,数值型,取值Values:1=无,2=有;营养状况,数值型,取值Values:1=差,2=中,3=好;术后化疗,数值型,取值Values:1=无,2=化疗。
(二)二分类Logistic过程界面说明
1.二分类Logistic回归主对话框
通过Analyze→Regression→Bina
文档评论(0)