- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
Stata做logistic回归概要
应用Stata做logistic回归 何保昌 实际生活中经常会遇到因变量只有0和1的二分类变量,不能满足正态性和方差齐性,故不能直接使用线性模型来拟合方程。 Logistic回归正是处理因变量是二分类或多分类变量的一种方法。现已广泛应用于队列研究,病例对照研究和试验性研究,成为分类因变量的首选多变量分析模型。 分类 按因变量性质,可分为二分类、无序多分类、有序多分类。 按是否匹配可分为非条件和条件logistic回归。 Stata软件专门有一组命令用于做不同类型的logistic回归,例如:logit、blogit、glogit、clogit、mlogit、ologit。 1.Logistic 回归 命令: logit 因变量 [自变量] [,选择项] (2) 分组频数资料,一般自变量较少,且均为分类变量,常以各自变量(不包括因变量)各水平的组合的频数表形式出现,因变量常表达为分子与分母。如例2。用下列命令: blogit 阳性数变量 总观察数变量 [,logit 命令选择项] 或 glogit 阳性数变量 总观察数变量 [,level(#) or] (3) 个体水平资料,即一个观察对象一条记录。如例3,直接使用logit 命令估计即可。 拟合模型后可以用指令predict 得到预测概率,然后进行模型诊断、应用等。 例1 本例是探讨妇女使用雌激素与患子宫内膜癌之间关系的病例-对照研究资料,见表1 ,请计算OR 及其95%可信区间。再用logistic 回归估计参数,写出回归方程,并说明回归系数与OR 的关系。 也可以用logit命令 可以利用例3做逐步回归 Stata 用于逐步回归分析的命令是在要执行的命令前增加sw 。 sw 回归命令 [因变量[自变量]], 筛选变量的P 值 [选择项] 其中,筛选变量的P 值有3 种组合 pr(#) /* 后退法 pe(#) /* 向前法 pr(#) pe(#) /* 逐步后退法 pr(#) pe(#) forward /* 逐步向前法 pr(#)是剔除变量的P 值,pe(#)是选入变量的P 值,如果只选pr(#),则表示用后退法,如果同时选用pr(#)和pe(#)表示逐步法。应用时,为防止计算进入死循环,pr(#)须略大于pe(#)。例如,pe(0.05),pr(0.051)。 1. 用逐步后退法,剔选变量的概率为:pe(0.05),pr(0.06),结果如下: sw logit y x1 x2 x3, pe(0.05) pr(0.06) 2. 用逐步前进法,剔选变量的概率不变,结果如下: sw logit y x1 x2 x3, pr(0.06) pe(0.05) forward 条件logistic 回归 非条件logistic 回归适用于平行组设计的病例-对照研究,队列研究,而不适用于配比设计的病例-对照研究。对于配比的病例-对照研究资料需要用条件logistic 回归。其命令为: clogit 因变量 [自变量] , group(配比变量) [ level(#) or ] 其中group()是必选项,它是用来区分各配比组的。level(#)及or 的意义同logit。 例4 在子宫内膜癌与使用雌激素关系的研究中,运用了1:4 的病例-对照研究,配比因素为年龄,共调查了20 对,100 例。 各变量定义如下: 1: match 配比组 2: y y=1:病例, y=0:对照 3: ht ht=0:无高血压, ht=1:有高血压 4: est est=0 未使用过雌激素, est=1:使用过雌激素 5: dose 剂量:dose=0:未使用过, dose=1:0.1-0.299(mg/day) 6: drug drug=0:未使用其他药物, drug=1:使用了其他药物 首先,使用ht、est、drug 三个变量作条件logistic 回归。. clogit y ht est drug, group(match) 结果显示,患高血压(ht)及使用其他药物(drug)与子宫内膜癌无关,而使用过雌激素者患子宫内膜癌的可能性比未使用过雌激素者大。因此,可以进一步考虑剂量-反应关系。变量剂量(dose)可以按两种方法处理,先按线性形式进入模型,再以哑变量形式进入模型,并比较两者的结果。 clogit y ht dose drug, group(match) 结果显示,随着剂量的上升,服用雌激素与患内膜癌间的联系也明显上升,呈现出明显的剂量-反应关系。这种关系是否为线性的?dose 用哑变量形式是否更好? xi : clogit y ht i.dose drug, group(match) 多类结果的logistic回
您可能关注的文档
最近下载
- 北京银行:首次公开发行股票招股说明书.docx
- 南京市2025届高三年级学情调研(零模)语文试卷(含答案详解).docx
- 《学习任务群视域下开展小学语文多文本阅读的实践研究》课题研究方案.doc
- 商业物业管理要点.ppt
- AIGC基础与应用 课件全套 第1--8章 认识AIGC---AIGC的发展与展望.pptx
- 佛山海天调味食品股份有限公司限制性股票激励计划.PDF
- AutomotiveSPICE 详解培训课件.pptx
- 办公室安全检查表.xls VIP
- GB50595-2010:有色金属矿山节能设计规范.pdf VIP
- 安徽省蚌埠市蚌山区2022-2023学年九年级上学期第一次月考数学试题( 含答案解析 ).docx VIP
文档评论(0)