网站大量收购闲置独家精品文档,联系QQ:2885784924

分析一生存分析数据所想到的.ppt

  1. 1、本文档共60页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
分析一个存分析数据所想到的 --出现的问题往往多于结论 吴喜之 阎洁 中国人民大学 统计学院 2004年12月 从教科书可期待什么? 整齐的数据(可能有些缺失值) 选好的意义明确的变量 完全确定的研究目标 按照一定的模型进行拟合 得到可合理解释的结果和漂亮的输出 根据理论(条件当然满足)做出解释 一切都令人满意 但是在实际中…… 数据形式和想象的差别可能很大 可能很难摸清大量变量的内在含义和关系 研究目标经常无法事先确定 没有任何现成的理论来确定什么模型合适 得到各种从统计或医学均不易解释的输出 永远不知数据是否满足一些定理和方法的条件 还需面对许多医学和统计的决策 这些决策很难说哪个“对”或“错” 我们的数据 一个鼻咽癌数据* 只有136个观测值 其中仅有129个可用 一共41个变量,其中包括 性别;病人诊断资料,如原发症状、原发部位、病理分级、B症状有无、国际预兆指数、国际预兆指数合并B症状、淋巴结大小、肿瘤M分期、WHO得分、分化程度、肿瘤T分期、淋巴结单双侧、肿瘤TNM分期等指标;病人治疗资料,如治疗方案、化疗方案、化疗周期;病人治疗近期效果资料,放疗疗效、化疗疗效、总初次治疗疗效;病人远期疗效资料,复发资料----是否复发、复发时间、复发部位、复发肿瘤的TNM分期,合并症资料----是否发生合并症、合并症发生时间,生存资料----是否死亡(指因癌症死亡)、生存时间。 我们面对的第一个决策问题 我们所关心的是复发还是死亡 没有任何理论上的理由来排斥哪一个 它们都和医疗效果相关,但是 从实践的角度,复发数据显然比死亡完整 因此我们仅以复发事件作为考虑重点 这里我们只考虑和此目的有关的22个变量(其中20个为“自变量”) 常规的分析方法 进行“复发时间”的常规生存分析 这些方法包括: 简单寿命表 Kaplan-Meier分析 Cox比例风险模型 等等 Kaplan-Meier方法 为了检验复发时间与哪些因素有关 通常采用了以下三种检验方法: Log Rank检验 Breslow检验 Tarone-Ware检验 三者的区别在于其检验统计量对不同时间的事件赋予的权重不同。 Kaplan-Meier方法 根据三种检验结果可知 有显著影响意义的因素包括: T分期、放疗疗效、化疗疗效、总初次治疗疗效 可能有意义的因素包括: 性别、原发症状、ipi和b症、有无转移、化疗周期数等 于是可以估计生存函数(画图) 一些累积生存函数估计图 有些可以区别明显 有些不明显 有些看不出来 Cox Regression 自变量:20个变量 逐步回归:Forward:LR Ordinal变量处理:当作分类变量。 Cox Regression Cox Regression 对这些结果的解释企图: 确诊时的T分期和M分期对于肿瘤的复发有显著影响。 确诊时其T分期较早的话,则治疗后复发的可能性要小于T分期较晚的人群,即使复发,其复发时间也相对要晚一些。 M分期也是一样。 因此,能在癌症早期及时发现是鼻咽癌诊治的一个重点。 三种检验不一致时的解释 : 控制“有无B症状”因素,分析放疗效果与复发的关系 其复发时间分布的Log Rank检验结果并不显著,p-值=0.0744,而另外两个检验的结果是显著的,Breslow检验, p-值=0.0280,Tarone-Ware检验, p-值=0.0403 三种检验不一致时的解释 : 多数文献只进行Log Rank检验,而很少用后两种 这三种检验有什么区别呢? 看看这些检验背后的机理 这三个检验的零假设都是检验各组间生存分布相同 三个检验的统计量均是基于比较每个时点的实际发生事件数与期望发生事件数 三种检验不一致时的解释 : 这三个检验的主要区别在于对不同时间点的权重不同: Log Rank检验对每个事件的权重相同,无论其发生早晚 Breslow检验按照在风险中的个体数对事件加权,而在风险中的个体时间而减少,因此早期发生的事件权重晚期发生的事件权重大 Tarone Ware检验按照在风险中的个体数的平方根对事件加权,因此结果则介于前面二者之间,对早期事件的权重要小于Breslow检验,大于Log Rank检验,因而其统计量和p-值也介于二者之间 三种检验不一致时的解释 : 面对以上的分析数据,可以认为:放疗效果对于复发来讲,是有显著影响的 但是其影响更多的是对早期复发,而对晚期复发的影响可能要小一些 定序变量看作分类变量或者定量变量? 一些方便(傻瓜)软件默认地把定序变量看作分类变量来处理 如果我们把这些Ordinal变量作Interval变量来处理的话,用同样的Forward:LR方法和自变量,结果又将如何呢? 定序变量看作分类变量或定量变量? 最后我们发现结果和上面完全不同。作为分类变量处理时,“T分

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档