网站大量收购闲置独家精品文档,联系QQ:2885784924

【研究方法】多元回归和logistic回归原理.ppt

  1. 1、本文档共81页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
我们要讨论的是 SPSS建立方程 检验方程总体和各自变量的统计学意义 自变量的筛选 Case的剔除(强影响点) 共线性诊断 多元统计方法 线性回归 Logistic 回归 注:完全可以用于单因素分析,从这一点也可以看出统计学的方法是相通的。 SPSS无法进行条件Logistic回归 ,就像sas没有专门针对配对资料的语句一样,任何统计软件均有局限性。 调整或控制 多变量的控制或调整法就是同时记录可能有影响的因素,把他们与可能的危险因素一起作分析 单因素分析有统计学意义,多因素分析没有意义的解释,举例 单因素分析有意义,多因素没有意义的解释 In univariate analysis, the family histories of SAH and ICH were positively associated with each of the subtypes of stroke. whereas after adjustment for potential risk factors, family history of ICH no longer showed a significant association with haematoma. Family history of intracerebral haematoma was not an independent risk factor for haematoma, but it might be a good predictor, which indirectly influences the pathogenesis of intracerebral haematoma via certain hereditary components such as hypertension, and even lifestyle factors such as alcohol consumption. Is family history an independent risk factor for stroke? J Neurol Neurosurg Psychiatry. 1997 Jan;62(1):66-70. 多元线性回归(简单步骤) 回归的实际应用 在影响因素分析中 一种是探索模式,在回归模型中探索所有可能的自变量与应变量的关系 一种是控制模式,即控制混杂因素的影响 后者对回归模型的要求要小的多,不出现异常情况,可仅对模型拟合稍作考虑。 SPSS菜单 analyze-regression-linear 变量的数量化 名义分类变量的哑变量化 数据格式 回归的一些定义 应变量(dependent variable) 自变量( independent variable) 偏回归系数 pertial regression coefficient 常数项b0 决定系数 determination coefficient,R square 共线性 collinearity:自变量间存在着线性关系 回归方程的建立 就是求解b0和bi的过程 矩阵的各种计算(求解线性方程) SPSS的实现: analyze-regression-linear 线性与拟合优度 有线性关系拟合优度不一定很好 上述F和t检验有统计学意义,只是说明 自变量与y有线性关系,但未能表示“关系有多大” 举例:上述方程的R2很小,但因为样本量大,F值很大 R2的意义:可以由BMI,age和膳食口味解释SBP的4.3%变化 我认为,因素分析可以只考虑线性关系的有无。特别是在控制模式中。 自变量的选择 全局择优法: 求出所有可能的回归模型(共有2m-1个)对应的准则值;按R2,Cp准则,AIC准则等统计量选择最优模型。求出所有可能的回归模型(共有2m-1个)对应的准则值;按上述准则选择最优模型 缺点: 如果自变量个数为4,则所有的回归有24-1= 15个;当自变量数个数为10时,所有可能的回归为 210-1= 1023个;……;当自变量数个数为50时,所有可能的回归为250-1≈1015个。 全局择优法 决定系数(R2)和校正决定系数(R2c),可以用来评价回归方程的优劣。【 R2随着自变量个数的增加而增加,所以需要校正】 校正决定系数(R2c)越大,方程越优。 Cp选择法:选择Cp最接近p或p+1的方程(不同学者解释不同)。 Cp无法用Spss直接计算,可能需要手工。 其中p为方程中自变量的个数,m为自变量总个数 AIC准则的计算公式 自变量的选择逐步选择法 逐步选择法: (一)前进

文档评论(0)

好文精选 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档