- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第二十章 logistic回归.doc
第二十章 Logistic回归分析
教材:《卫生统计学 (6)》 方积乾主编
授课:中山医.公卫学院 骆福添 020luoft@mail.sysu.edu.cn
【说明】
? 统计学门类:
业务统计,如政府统计、经济统计、工业统计、农业统计,等
科研统计,如数理统计、生物统计、医学统计、卫生统计
另类统计,如中统、军统、联邦调查局
? 统计学教程:常包含两大方面内容
理论统计:模型公式、理论概念、严谨定义(ex:治愈80∕100,女性80∕100,两个80%是一样的)
应用统计:公式意义、应用条件、方法步骤、结果解释(ex:前者80%是频率,后者80%是比例)
? 这一章有理论推导和丰富的公式,建议自学;主要介绍应用“统计问题”(两三个公式)
【链接1】 统计分析的三大任务
1、描述样本数据的分布特征(数据?频数图表?平均数与变异度?95%范围)
2、估计总体指标置信区间(选定置信度,借误差分布规律反推)
3、检验总体指标之间差异(选定水准,据误差分布确定概率P)
*三大法则:数据、分布、对比
-1.96S +1.96S
把握度(1-?)=0.95=中间面积
图a 参考范围
图b 置信区间(反推)
-1.96 0 1.96
条件概率P=0.05 ? =尾部面积
图c 假设检验
【链接2】 简单相关与回归要点
图9.1 一年级女大学生体重与肺活量散点图2.0
图9.1 一年级女大学生体重与肺活量散点图
2.0
2.2
2.4
2.6
2.8
3.0
3.2
3.4
3.6
3.8
40
42
44
46
48
50
52
54
56
58
体重(kg) X
肺
活
量
(L)
Y
? 平均水平=回归直线
? 变异程度=相关系数(倒数)
?
2、估计:
? ρ=r ±1.96Sr
? β=b ±1.96Sb
3、检验:
?
?
【链接3】 复杂相关与回归(三大回归)要点
1、多重线性回归与相关:(多因素分析基础)
简单回归与相关的推广(自变量多了,描述-估计-检验类推)
2、Logistic回归:因变量Y=(0或1),自变量同多重回归(病因探索,尤其临床)
3、Cox回归:两个因变量Y =(t,d),自变量同多重回归(疗效分析,尤其慢病)
第一节 Logistic 回归模型
一、Logistic回归模型
例20-1 为探讨超重和肥胖对高血压病的影响,2004年,某研究者采用整群抽样的方法,对某地6个镇35周岁以上的常住人口进行高血压普查,同时收集了身高、体重等相关信息。体质指数判为“超重或肥胖”, 为“正常”;收缩压≥140 和(或)舒张压≥90 判为“高血压”。整理后资料见表20-1。记样本患病率为,是相应总体概率的估计值;自变量为体质指数,赋值为1与0,表示“超重或肥胖”,表示“正常” ;因变量为是否患病,表示“患病”,表示“未患病”。
表20-1 不同体质指数组高血压患病率
体质指数()
调查人数
患病(=1)
未患病(=0)
患病率(%)
正常 (=0)
6792
1331
5461
19.60
超重或肥胖(=1)
4148
1656
2492
39.92
合计
10940
2987
7953
27.30
? 因变量为二分类变量
? 首先对进行数据变换:
这个变换将取值在0-1间的值转换为值域在(-)的值。
(20-1c)
变换式(20-1 c),得
(20-4)
若自变量扩展到个,(,,...,),则多变量回归模型为
(20-5e)
其中,为常数项(截距),、、...为回归系数。
二、模型参数的意义
类似线性回归,表示模型中所有自变量均为0时,的值;回归系数表示在控制其他自变量时,自变量变化一个单位所引起的改变量。我们有关于“优势”的表达式
例20-1中, “超重或肥胖”组()患高血压的优势为
一般地,根据多个自变量的回归模型,在其他变量取值不变的情形下,与变量的二个水平与()相对应的事件的优势比为
(20-6)
当的二个水平相差1个单位时,,=。
回归分析广泛用于流行病学中前瞻性的队列(???)研究、回顾性的病例-对照研究以及现况研究。
第二节 Logistic 回归的参数估计及假设检验
一、回归的参数估计
? 极大似然估计( ,)最为常用。
? 求解,使似
您可能关注的文档
- 臂前肘前前臂前区.ppt
- 骨巨细胞瘤和骨肉瘤.ppt
- 骨科大整理.docx
- 第二十八章 其他病毒.ppt
- 骨科系统机考题总.doc
- 第二十八章心理治疗.doc
- 骨质疏松的健康管理(修改).ppt
- 第二十六章精神障碍的药物治疗.doc
- 骨骼肌的收缩功能.ppt
- 髋关节影像应用基础.ppt
- 10《那一年,面包飘香》教案.docx
- 13 花钟 教学设计-2023-2024学年三年级下册语文统编版.docx
- 2024-2025学年中职学校心理健康教育与霸凌预防的设计.docx
- 2024-2025学年中职生反思与行动的反霸凌教学设计.docx
- 2023-2024学年人教版小学数学一年级上册5.docx
- 4.1.1 线段、射线、直线 教学设计 2024-2025学年北师大版七年级数学上册.docx
- 川教版(2024)三年级上册 2.2在线导航选路线 教案.docx
- Unit 8 Dolls (教学设计)-2024-2025学年译林版(三起)英语四年级上册.docx
- 高一上学期体育与健康人教版 “贪吃蛇”耐久跑 教案.docx
- 第1课时 亿以内数的认识(教学设计)-2024-2025学年四年级上册数学人教版.docx
文档评论(0)