- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
摘要
随着世界经济的增长,卫生保健事业的发展,疾病谱的变化和平均寿命的提高,有关肿瘤、慢性病、老年性疾病的临床试验和流行病学方面的随访研究越束越重要,越来越多,这些临床试验和随访研究的资料都可整理为生存资料。目前对生存资料的多因素分析最常用的方法仍然是Cox比例风险回归模型,简称Cox模型。该模型是一种多因素的生存分析方法,可以分析带有截尾生存时间的资料,
同时分析众多因素对生存期的影响,且不要求估计资料的生存函数的分布类型。
用SAS分析膀胱癌手术后生存时间的影响因素。比较Kaplan-Meier估计的生存曲线,用生存资料拟合COX回归方程。进而得出结论。
[关键词] 生存分析,Cox回归,Kaplan-Meier估计, Nalson-Aalen估计, Log-Rank检验
1.理论及程序
1.1 Kaplan-Meier估计
乘积极限法适合于离散数据,它用于建立时刻t上的生存函数。kaplan-meier法是根据t时刻及其之前个时间点上的条件生存率的乘积,来估计t的生存函数S(t)和它的标准误SE(S(t)).设代表K个观测对象的生存时间,设为时刻开始之前生存的个体数目,即危险集的大小(i=1,2...k),再设表示生存时间的截尾性质,i=1,2...k。又令表示观察对象在时刻的条件生存率,即对于i=1,2,...k,有:
,其中
那么,观察对象在时刻t时的死亡率如下:
对于i=1,2,...k,kaplan-meier法定义时刻t上的生存函数和它的标准误的估计公式如下:
1.2 Nalson-Aalen估计
在删失情况下,可以根据累计死亡率与生存函数的关系H(t)=-ln(S(t))来估计累积死亡力函数H(t)。这时估计式为
。
nalson-aalen估计式比上一个估计式拥有更好的小样本性质。在最大时间观察范围内定义如下:
;
该估计式的方差可以从下式得到:
以死亡率的 nalson-aalen估计式为基础,生存函数的另一个估计式为:
nalson-aalen估计在分析数据时主要有以下两个应用,一是在选择事件发生时间的参数方法的应用。另一个是死亡力好h(t)提供粗估计,这些估计值是nalson-aalen估计式的斜率,对死亡力的更精确估计,可以通过对nalson-aalen估计式的跳跃进行参数核平滑得到。
所有估计函数都是阶梯函数,在死亡发生处发生跳跃。
1.3 Cox模型
Cox比例风险回归模型是一种多因素的生存分析方法,可以分析带有截尾生存时间的资料,同时分析众多因素对生存期的影响,且不要求估计资料的生存函数的分布类型。
基本Cox模型表达式为
式中为协变量或影响因素,一般包括研究开始时个体的年龄、性别、临床及生化指标等;h(t)为具有协变量个体在t时刻的风险函数,近似地表示t时刻存活的个体在t时刻之后一个单位时段内的死亡概率;ho(t)为t的未知函数,即时f时刻的风险函数,称为基准风险函数;为各协变量所对应的回归系数,需由样本资料做出估计。
任两个个体风险函数之比,即风险比或相对危险度
该比值与h(t)无关,在时间t上为常数,即模型中协变量的效应不随时间而改变,称为比例风险假定,简称PH假定,比例风险模型由此得名。
简单地,对o-l变量COX模型,0组的风险函数为,1组的风险为,则
即两组风险函数之比在时间上的常数,或两组风险函数成比例。
1.4 Log-Rank检验
这个检验是基于对每个观测值均赋予一定的分值而设计出来的。这些分值是生存函数的对数的函数。
作为对数生存函数在t(i)估计值。其中m(j),r(i)都是前面已经定义过的两。Peto和peto二人按照如下方式对各观测值赋予分值Wi;对非删除数据t(i), ;对删失数据T,。在实际运算时,若是删失数据时,则取,其中是满足的最大非删失数据。因此删失数据越大,对应的分值就越小。删失数据对应的分值是负的,两组数据和在一起后各数据对应的Wi值之和等于零。设一个组中的各个数据对应的分值Wi之和为S。S的“排列方法”是:
可以改写为:
log-rank检验就是选择作为检验统计量。可以证明在假设为真的情况下,L渐进服从标准正态分布。若S是从第1组得到的和数,则否定域是;若S是从第2组得到的和数,则否定域是,其中由等式决定。
2.实例
2.1 数据背景
选择1996-2000年间经手术治疗的膀胱肿瘤患者30例,对可能影响膀胱肿瘤术后生存时间的因素进行了调查,患者的生存结局(死亡与否)通过查阅病历、网上查询
Kaplan-Meier估计对年龄生存资料进行统计描述的结果,小与60岁患者的中位生存期数为44个月,平均生存期数为24.5395个月。大于等于60岁患者的中位生存期数为59个月,平均生存期数为32.5882个月
图1
文档评论(0)