- 1、本文档共10页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第13章:生存分析
生存分析
生存分析(Survival analysis)是研究特定人群生存过程的统计分析方法。对急性病的疗效考核,一般可用治愈率或病死率等,但对肿瘤、结核等慢性病,其预后不是短期内能明确判断的,帮上述指标不适用。为评价慢性病的疗效,通常可对慢性病病人进行长期随防,统计一定期限后的生存、死亡情况,然后用生存分柝方法作统计推断。
生存分析中用生存时间的长短评价慢性病的疗效。所谓生存时间,狭义地讲是从某个标准时点起至死亡止,即患者的存活时间。例如,患有某病的病人从发病到死亡或从确诊到死亡所经历的时间。广义地讲,“死亡”可定义为某研究目的的“结果”的发生,例如宫内节育器的失落,疾病的痊愈,女孩月经初潮的到来等(生存分析中往往统指各种“死亡”为失效)。相应的“生存”时间为,放节育器到节育器失落所经历的时间,接受某治闻开始到治俞所经历的时间,从女孩出生到月经初潮到来所经历的时间。不论是广义定义还狭义定义,生存时间均有三个要素:起点、终点和时间尺度(天,周,月,年等)。
理想的生存时间资料是对每个被研究对象,研究者兼掌握其生存时间的起点,又掌握其生存时间的终点(即研究目的的“结果”发生的时间),也就是研究者掌握每个研究对象的“生存时间”的全部信息。但实际工作中难以得到每个研究对象的这种“完全”的生存时间资料。有时,研究者没有掌握研究对象生存时间的起点,也有的是丢失生存过程中间的某段时间的信息,或缺少终点的信息,无论发生三种情况中的哪一,所得的数据资料均是不完全的,生存分析中称这种资料为不完全数据资料(censord data)。能处理不完全数据资料是生存分析的一个优点。
医学随访资料可能出现这些情况:被防对象因搬迁等原因而失去联系(失访);被访者死于其他疾病或非本病的其他原因;或者被访者直到研究者总结工作时仍活着。对这些对象,观察到的生存时间只有起点,没有终点,所得的资料是上述三种不完全数据资料中的第三种。生存分析中,称这种不完全数据为截尾数据。
生存时间是一个随机变量。例如,研究患某病的病人从确诊到死亡所经历的时间T,显然T的取值因人而异,即T是一个变量,而且T的变化不能预先确定(即使性别、年龄、体质等有关因素均已知的情况下,其取值也不能预先确定),这表明T不是一个普通的变量,而是一个随机变量。
在生存分析中,常用生存率(或称生存函数),风险率(或称危险率、风险函数),生存时间T的分布函数或密度函数描述生存过程。
T的分布函数F(t)为生存时间T不超过时点t的概率,即F(t)=Pr(T=t)。生存时间的密度函数f(t)是F(t)的导数,f(t)=F’(t), f(t)描述所有个体在时点单位时间内死亡的危险性。生存率S(t)是指生存时间T超过时点t的概率,即S(t)=Pr(Tt)=1-F(t)。
例如5年生存率是指生存时间T超过5年的概率,记为S(5)。风险率h(t)是密度函数与生存率的比,即h(t)=f(t)/s(t),风险率h(t)描述已活过时点t的个体在时点t后单位时间内死亡的危险性。
实际工作中,得不到所有患者的生存时间资料,就不可能得到T的总体分布,只能利用样本资料近似地描述T的分布,对T的分布作出有关的推断。若有大样本的完全数据资料,则可以借助频数分布表近似描述T的分布。
例 设有100名某病患者生存时间数据资料
i 确诊后(年)ti~ 死于本病例数fi 频数/年fi/年 频率/年f(ti) 累计频率/年F(ti+1) 1 0~ 5 5 0.05 0.05 2 1~ 10 10 0.10 0.15 3 2~ 20 20 0.20 0.35 4 3~ 30 30 0.30 0.65 5 4~ 10 10 0.10 0.75 6 5~ 5 5 0.05 0.80 7 6~ 4 4 0.04 0.84 8 7~ 3 3 0.03 0.87 9 8~ 2 2 0.02 0.89 10 9~ 2 2 0.02 0.91 11 10~ 1 1 0.01 0.92 12 11~12 8 0.8 0.008 1.00
这是一组完全资料,据此资料,可估计得生存时间不超过时点ti的概率为F(ti),在j时点ti后单位时间内死亡的危险性为f(ti)。例如,估计该病患者生存时间不超过2年的概率F(2)=0.15;估计该病患者在时点2(年)死亡的危险性f(2)=0.20;估计生存时间超过2年的概率,即估计2年生存率S(2)=1-0.15=0.85;在时点2(年)的风险率,即估计活过2年者在接下去的时刻死亡的危险率h(2)=0.20/0.85=0.24。
一般,生存资料中包含截尾数据,且我们的目的往往不仅是描述某特定人群的生存时间分布,还要研究影响生存时间的因素,故相应的统计方法较复杂。生存分析方法一般可分为参数、非参数和半参
文档评论(0)