- 1、本文档共14页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SPSS10.0高级教程十三分类资料的Logistic回归分析.doc
SPSS?10.0高级教程十三:分类资料的Logistic回归分析
(2009-02-05 15:32:54)
转载
所谓Logistic模型,或者说Logistic回归模型,就是人们想为两分类的应变量作一个回归方程出来,可概率的取值在0~1之间,回归方程的应变量取值可是在实数集中,直接做会出现0~1范围之外的不可能结果,因此就有人耍小聪明,将率做了一个Logit变换,这样取值区间就变成了整个实数集,作出来的结果就不会有问题了,从而该方法就被叫做了Logistic回归。
随着模型的发展,Logistic家族也变得人丁兴旺起来,除了最早的两分类Logistic外,还有配对Logistic模型,多分类Logistic模型、随机效应的Logistic模型等。由于SPSS的能力所限,对话框只能完成其中的两分类和多分类模型,下面我们就介绍一下最重要和最基本的两分类模型。
10.3.1 界面详解与实例
例11.1 某研究人员在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例资料作为示例进行logistic回归分析(本例来自《卫生统计学》第四版第11章)。
i:标本序号
x1:确诊时患者的年龄(岁)
x2:肾细胞癌血管内皮生长因子(VEGF),其阳性表述由低到高共3个等级?
x3:肾细胞癌组织内微血管数(MVC)?
x4:肾癌细胞核组织学分级,由低到高共4级?
x5:肾细胞癌分期,由低到高共4期?
y:肾细胞癌转移情况(有转移y=1; 无转移y=0)。
i?x1?x2?x3?x4?x5?y1?59?2?43.4?2?1?02?36?1?57.2?1?1?03?61?2?190?2?1?04?58?3?128?4?3?15?55?3?80?3?4?16?61?1?94.4?2?1?07?38?1?76?1?1?08?42?1?240?3?2?09?50?1?74?1?1?010?58?3?68.6?2?2?011?68?3?132.8?4?2?012?25?2?94.6?4?3?113?52?1?56?1?1?014?31?1?47.8?2?1?015?36?3?31.6?3?1?116?42?1?66.2?2?1?017?14?3?138.6?3?3?118?32?1?114?2?3?019?35?1?40.2?2?1?020?70?3?177.2?4?3?121?65?2?51.6?4?4?122?45?2?124?2?4?023?68?3?127.2?3?3?124?31?2?124.8?2?3?025?58?1?128?4?3?026?60?3?149.8?4?3?1
在菜单上选择Analyze==》Regression==》Binary Logistic...,系统弹出Logistic回归对话框如下:
左侧是候选变量框,右上角是应变量框,选入二分类的应变量,下方的Covariates框是用于选入自变量的,只不过这里按国外的习惯被称为了协变量。两框中间的是BLOCK系列按扭,我在上一课已经讲过了,不再重复。中下部的a*b框是用于选入交互作用的,和其他的对话框不太相同(我也不知道为什么SPSS偏在这里做得不同),下方的Method列表框用于选择变量进入方法,有进入法、前进法和后退法三大类,三类之下又有细分。最下面的四个按钮比较重要,请大家听我慢慢道来:
Select钮:用于限定一个筛选条件,只有满足该条件的记录才会被纳入分析,单击它后对话框会展开让你填入相应的条件。不过我觉得该功能纯属多余,和专门的Select对话框的功能重复了。
Categorical钮:如果你的自变量是多分类的(如血型等),你必须要将它用哑变量的方式来分析,那么就要用该按钮将该变量指定为分类变量,如果有必要,可用里面的选择按钮进行详细的定义,如以哪个取值作为基础水平,各水平间比较的方法是什么等。当然,如果你弄不明白,不改也可以,默认的是以最大取值为基础水平,用Deviance做比较。
Save钮:将中间结果存储起来供以后分析,共有预测值、影响强度因子和残差三大类。
Options钮:这一部分非常重要,但又常常被忽视,在这里我们可以对模型作精确定义,还可以选择模型预测情况的描述方式,如Statistics and Plots中的Classification plots就是非常重要的模型预测工具,Correlations of estimates则是重要的模型诊断工具,Iteration history可以看到迭代的具体情况,从而得知你的模型是否在迭代时存在病态,下方则可以确定进入和排除的概率标准,这在逐步回归中是非常有用的。
好,根据我们的目的,应变量为Y,而
您可能关注的文档
- Krukenberg瘤的临床研究进展.pdf
- K_xNa_1_x_NbO_3无铅压电陶瓷的常压烧结及其性能研究.pdf
- L1_CAM在肿瘤组织中的研究进展.pdf
- LAK细胞对直肠腺癌细胞杀伤的观察_丁彦青.pdf
- LCD增亮膜专利技术分析.pdf
- LCMSMS串联质谱仪应用于中药多组分成分同时定性和定量分析.pdf
- LED组装技术及关键焊接工艺_史建卫.pdf
- Leptin对猪原代脂肪细胞脂解及其关键脂酶mRNA表达的影响.pdf
- LiFePO_4_C正极材料的液相合成及电化学性能研究.pdf
- LMP1在鼻咽癌中的研究HeadandNeckOncology2012aboutLMP1inNPC.pdf
文档评论(0)