- 1、本文档共34页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
7.1logistic回归、probit回归与poission回归教程
Logistic回归(因变量为二分变量/二项分布)
probit回归
Poisson (因变量为poisson分布)
;概念;logistic回归的分类:
(1)二分类资料logistic回归: 因变量为两分类变量的资料,可用非条件logistic回归和条件logistic回归进行分析。非条件logistic回归多用于非配比病例-对照研究或队列研究资料,条件logistic回归多用于配对或配比资料。
(2)多分类资料logistic回归: 因变量为多项分类的资料,可用多项分类logistic回归模型或有序分类logistic回归模型进行分析。
也可以分为logistic回归和条件logistic回归;令因变量两个水平对应的值为0、1,概率为1-p、p,则显然我们也可以用多重回归进行分析?为什么要用logistic回归分析?
logistic回归回归系数、模型评估、参数估计、假设检验等与之前的回归分析有何不同?
因变量为二分变量时既可以用logistics回归也可以用probit回归,那么probit回归及其与logistic回归的异同之处是什么?;问题1:;;线性回归在处理有上限和下限的因变量时面临着一个问题:X上同样的变化对Y产生的影响不同,由图1也可以直观的看出这里并不适合进行线性回归。
虽然有很多非线性的函数可以呈现S形,但由于Logit转化比较简易,所以更受欢迎。
;Logit与概率不同,它没有上下限。比数去除了概率的上限,比数的对数去除了概率的下限;且是以0,5为中点对称的,概率大于0.5产生正的logit,logit距离0的距离反映了概率距离0.5的距离;概率上相同的改变与在logits上产生的改变是不同的,logit转化拉直了X与最初的概率之间的非线性关系。;回归系数的意义:; 反映了在其他变量固定后,X=1与X=0相比发生Y事件的对数优势比。
回归系数β X与Y的关联
β=0,OR=1, 无关
β>0,OR>1 , 有关,危险因素
β<0,OR<1, 有关,保护因子
; ;统计量????????? 趋势????????拟合??????????????????????? ?作用???????????????????????????????????? 备注?AIC?、SC????越小?????? 越好??????类似于多元回归中的残差平方和????????????? 似然比卡方??越大???????越好???????类似于多元回归中的回归平方和????????? P值越小越好RSQUARE?? 越大???????越好???????类似于多元回归中的R^2 C统计量 越大 越好 度量观测值和条件预测的相对一致性 ?? HL统计量 越小 越好 度量观测值和预测值总体的一致性???????P值越大越好;参数估计 ;除此以外,logistic回归还可以用优势比估计:;案例:;logistic回归模型的假设检验 ;3.比分检验(score test)
以未包含某个或几个变量的模型为基础,保留模型中参数的估计值,并假设新增加的参数为零,计算似然函数的一价偏导数(又称有效比分)及信息距阵,两者相乘便得比分检验的统计量S 。样本量较大时, S近似服从自由度为待检验因素个数的?2分布。;变量筛选 ;例 某工作者在探讨肾细胞癌转移的有关临床病理因素研究中,收集了一批行根治性肾切除术患者的肾癌标本资料,现从中抽取26例。试用logistic回归分析筛选出于癌细胞转移有关的危险因素(变量选入和剔除水平均为0.10)。 ;问题3; 在logistic回归中我们可以利用简单的公式来总结将概率变成比数对数的转化以及比数对数变成概率的转化。对于probit分析,标准正态分布曲线的复杂公式让这一切难度更大(尽管用计算机可以很容易得到)。
除了logit与probit转化当中的一些相似性,它们两个所得出的系数会有一个随意的常数(约1.8)的区别。(由于软件程序中probit分析将误差项的标准差定为1,而logistic分析将误差项的标准差大约定为1.814)logitic系数大约是probit系数的1.8倍,将logistic系数除以这个值可以让二者的单位具有可比性,但是由于logistic和正态曲线不同,所以logitic系数和probit系数依然会有小小的不同。但是基本上, logistic分析和probit分析得出的结果在本质上都是相似的。
与logisti
文档评论(0)