网站大量收购独家精品文档,联系QQ:2885784924

基于原发性胆汁性肝硬化数据的生存分析.docVIP

基于原发性胆汁性肝硬化数据的生存分析.doc

  1. 1、本文档共21页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于原发性胆汁性肝硬化数据的生存分析 基于原发性胆汁性肝硬化数据的生存分析 \* \* 数据背景 、数据名称:原发性胆汁性肝硬化的数据 、数据来源: 、数据简介:该数据以的名字包含在程序包中,数据集有个变量,共有个患者的观测,每个患者只有一次观测。其数据是来自于梅奥诊所所审理的从年到年这十年间的原发性胆汁性肝硬化的病例。总共有个患者,按照资格标准随机采用安慰剂对照药物青霉胺进行。个个案在数据集中参加随机试验,而附加的个个案没有参加临床试验,但有基本的测量记录。个个案失去了确诊后没有跟进,所以数据上附加的是个个案以及个随机参与者,共组观测值。 、变量介绍: 变量名 描述 性质 个人代码 分类 登记到换肝或死亡天数 数量 状态(活着,肝移植,死亡) 分类 用药(青霉胺,安慰剂) 分类 年龄 数量 性别 分类 腹水() 分类 肝肿大() 分类 蜘蛛纹() 分类 水肿(无水肿,未用利尿剂水肿,用利尿剂仍水肿) 分类 血清胆红素() 数量 血清胆固醇() 数量 白蛋白() 数量 尿铜() 数量 碱性磷酸酶() 数量 血清谷氨酸谷草转氨酶() 数量 甘油三酯() 数量 血小板(每升千个) 数量 凝血酶原(秒) 数量 疾病组织学分期(期) 分类 、分析思路:如果对后面个观测值的缺失值整列进行弥补然后对个观测值进行分析意义不大,因此只将前个观测值单独提取出来进行非参数、参数、比例风险模型的建立。本文的分析包括:选择对生存函数有显著性影响的因子进行建模;通过图形、统计检验的方法比较各个因子变量的不同取值下的生存曲线是否存在差异,差异是否显著;建立的模型是否满足前提假定等。 、数据预处理:由于前个观测值存在缺失的情况,因此首先进行弥补。之后由于原始数据中变量分为活着,肝移植和死亡三个结果,而生存分析要求结果为两分类互斥事件,因此将肝移植和死亡的变量值合并。最终变量的取值为活着,换肝或死亡,并在个观测值中将分类变量、、、、、、转换为因子。 经过处理后的数据概况如下: 数据集一共包括个变量,其中个数值型变量:、、、、、、、、、、个分类变量: 、、、、、、、;无缺失值。 非参数模型 不含变量的估计 得到的的置信区间的拟合图如下所示: 检验青霉胺和安慰剂组生存函数的差异 ()图形检验 上图为用 比较青霉胺和安慰剂两种不同的药对生存时间的差异,红色的曲线代表安慰剂组,黑色的曲线代表青霉胺组,两种不同水平下的曲线大致是重合的,只有小部分存在分歧。因此可以初步判断两组不同的用药对生存函数没有影响。 三种检验方法的原假设均为,而得到的值均远远大于,因此可以认为两种不用的用药对生存函数是没有显著性影响的。 检验不同性别的生存函数的差异 ()图形检验 () 分析:从生存曲线可以看出,在起初的一小段时间里男性和女性的生存曲线重合,没有太大的差异,但随着时间的推移,不同的性别的生存曲线逐渐显示出了较大的差异,从而说明了性别对于生存函数是有影响的,从上面的三种检验得到的值均为左右也可以得到相应的结论。而且男性患病的风险比女性更高。 比例风险模型 、基于不同用药组()建立比例风险模型 从回归系数以及三种检验得到的值可以看出,不同用药组对于生存函数的影响不显著。 、基于不同性别()建立比例风险模型 从图和分析结果均可以看出,不同性别的生存曲线有显著性的差异,女性的风险是男性的倍,男性患疾病的风险更大。之后对做的检验,得到的值是大于的,因此满足风险成比例的假定。 对于不同性别组,将建立的曲线和比例风险模型的曲线进行比较: (说明:下图中的红色和绿色曲线分别代表的是用比例风险模型对男性和女性的生存状况的拟合,黑色和蓝色分别代表的是用—估计的男性和女性的生存状况) 从曲线中可以看出用比例风险模型拟合的女性生存曲线与曲线基本重合,男性生存曲线大部分是重合的,小部分存在差异。但从整体来看用比例风险模型拟合的曲线基本与曲线重合,因此说明比例风险模型拟合效果较好,也说明了变量是满足风险成比例的假定的。 基于水肿程度(:无水肿,未用利尿剂水肿,用利尿剂仍水肿)建立比例风险模型 ()直接建立比例风险模型 从上面的分析结果可以看出,不同水肿程度对生存函数有显著性的影响,其中(用利尿剂仍水肿)的风险是最高的。从医学的角度来看,用利尿剂仍水肿的个体在一定程度上就反映了该个体的生存状况最差,因此其风险理应最高。 下图是不同水肿程度拟合的比例风险曲线: 检验变量是否满足风险比例假定: 检验得到的值均小于,因此认为变量是不满足风险比例假定的。 建立与时间的交互项模型 将 设置为,建立变量与的交互项,得到的模型为: 得到的交互项的值为,小于,因此认为该项是显著的。同时也说明了将 设置为较为合理。 、基于不同疾病组织学分期()建立比例风险模型 从上面的分析

文档评论(0)

kfcel5889 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档