高统计方法概论.PPTVIP

高统计方法概论.PPT

此“教育”领域文档为创作者个人分享资料,不作为权威性指导和指引,仅供参考
  1. 1、本文档共110页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
高统计方法概论

第九章 高级统计方法概论 本章内容 第一节?? 多重线性回归 第二节 logistic回归分析 第三节 生存分析 第四节????判别分析与聚类分析 第五节 主成分分析与因子分析 第六节 典型相关分析 ?四、自变量筛选 七、多重线性回归应用的注意事项 1、应满足LINE条件 残差图 2、指标的数量化 分类变量的哑变量设置见P327 3、样本含量 n =(5~10)m。 4、“最优”回归方程的意义 所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。 不同回归方程适应于不同用途,依专业知识定。 5、多重共线性 即指一些自变量之间存在较强的线性关系。如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量通常是高度相关的,有可能使通过最小二乘法建立回归方程失效,引起下列一些不良后果: (1)参数估计值的标准误变得很大,从而t值变得很小。 (2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化。 (3)t检验不准确,误将应保留在模型中的重要变量舍弃。 (4)估计值的正负符号与客观实际不一致。 回归分析的步骤 做出散点图(简单线性回归、多重线性回归) 考察数据的分布,进行必要的预处理(应变量) 进行直线回归分析(模型建立,变量选择等) 残差分析(模型前提假设) 强影响点的诊断,多重共线性问题的判断 结合专业知识对结果进行解释 三、Logistic 回归模型的假设检验 1.检验一:对建立的整个模型做检验。 检验方法 1)似然比检验 (likelihood ratio test) 2)Wald检验 3)计分检验(score test) 2.检验二:检验模型中某β是否对Y有作用。 检验假设: 检验统计量:主要为Wald检验(SAS软件) 四、Logistic回归对变量做筛选 目的;将回归系数有显著意义的自变量选入模型中,作用不显著的自变量则排除在外。 变量筛选算法有:前进法、后退法和逐步法(stepwise)。 例: 逐步筛选进入方程的自变量及参数估计 变量 β Sb Waldχ2 P 标准β’ OR 常数 -4.705 1.54 9.30 0.0023 年龄 0.924 0.477 3.76 0.0525 0.401 2.52 X5 1.496 0.744 4.04 0.0443 0.406 4.46 X6 3.136 1.249 6.30 0.0121 0.703 23.06 X8 1.947 0.847 5.29 0.0215 0.523 7.01 logistic回归的应用及注意事项 一、logistic回归的应用 1.流行病学危险因素分析 2.临床试验数据分析 3.分析药物或毒物的剂量反应 4.预测与判别 第三节 生存分析 生存分析(survival analysis)是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。 生存分析不同于其它多因素分析的主要区别点就是生存分析考虑了每个观测出现某一结局的时间长短。 一 生存分析基本概念 (一)生存时间 ( survival time,failure time ) 终点事件(失效时间)与起始事件之间的时间间隔。 终点事件指研究者所关心的特定结局。 起始事件是反映研究对象生存过程的起 始特征的事件。 生存时间举例 起始事件 终点事件 服药 痊愈 手术切除 死亡 染毒 死亡 化疗 缓解 缓解 复发 终点事件和起始事件是相对而言的,它们都由研究目的决定,须在设计时明确规定,并在研究期间严格遵守,不能随意改变。 生存时间的类型 1. 完全数据(complete data) 从起点至死亡(死于所研究疾病)所经历 的时间。 2. 截尾数据(删失数据,censored data) 从起点至截尾点所经历的时间。 截尾原因:失访、死于其

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档