有序多分类Logistic回归模型.ppt

下载文档 降价啦

33
0
约1.42千字
约 11页
2019-10-19 发布于江西
举报
版权申诉
保障服务

有序多分类Logistic回归模型.ppt

1、本文档共11页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

有序多分类Logistic回归模型一、模型适用条件研究变量Y是有序的而且是多分类的，常见的如生活满意度，答案包括五个：很不满意；不太满意；一般；比较满意；非常满意。或者三个：满意；一般；不满意。关于主观幸福感的研究，答案包括：比较幸福；一般；比较不幸福。具体的研究中，有些研究把上述五分类或者三分类变量合并成二分类，使用二项Logistic回归模型，这样的研究比较常见。二、具体操作有序多分类回归模型中既可以放分组变量，也可以放连续型变量。具体操作：Y放在Dependent框中，路径：Analyze-Regression-Ordinal 在Factors框中放分组变量，spss自动对分组变量进行分组，默认最后一组作为对照组。在Covariate框中放连续变量输出结果会出现Warnings，警告信息说明自变量的各种取值水平组合中有多少其观察频数为0。如果模型中有连续型变量，这个比例会很大，这样的情况属于正常，不必担心。 Model Fitting Information：是对是否所有自变量偏回归系数全为0进行似然比检验，结果P0.001，说明至少有一个自变量的偏回归系数不为0。说明拟合包括上述几个变量的模型拟合优度好于仅仅包含常数项的模型。 Goodness-of-Fit：输出的是Pearson和Deviance两种拟合优度检验结果。这两个统计量的致命缺点是对于自变量取值水平组合的实际观察频数为0的比例十分敏感，如果这一比例过高，这两个统计量不一定仍旧服从卡方分布，因而基于卡方分布计算的P值也不可信。 Pseudo R-Square：输出的是三种伪决定系数。对于分类数据的统计分析，对此不必太在意，一般情况下伪决定系数都不会太高。 Parameter Estimates：输出了最重要的结果。由于生活满意度是三分类，因此会建立两个回归方程，常数项有两个。需要注意的是，反应变量为有序多分类的Logistic回归的前提假设之一是各自变量对于反应变量的影响在两个回归方程中相同，所以，各自变量的偏回归系数只有一个。三、模型适用条件检验 Test of Parallel Linesa：输出的是检验各自变量对于反应变量的影响在两个回归方程中是否相同的结果。其实质是拟合不限定下属相等的模型（General Model），将该模型的似然值和当前限定系数相等的模型（Null Hypothesis）加以比较，进行似然比检验。如果检验结果P0.05，说明各回归方程互相平行，可以使用Ordinal Regression 过程进行分析，否则就要进行处理。如果平行性假设不能被满足，如何处理呢？首先，有序回归模型对此适用条件有一定的难受性，当条件被轻微违反时（P值很接近0.05），参数的估计仍然是较为稳定的。如果平行性检验的P值非常小，导致该情形出现的原因主要是两个：连接函数选择不准确或者系数的确在随着分割点发生变化。 SPSS提供了5种连接函数，不同的函数有不同的适用范围： Logit:反应变量各取值水平发生概率相近的资料。此选项为默认选项。 Complementary：反应变量取值水平高的水平发生概率高的资料。 Negative log-log：用于反应变量取值水平低的水平发生概率高的资料。 Probit：用于潜在变量服从正态分布的资料。 Cauchit：用于潜在变量存在很多极端值的资料。 * *