清华时立文spss第11章教案详解.ppt

  1. 1、本文档共29页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第11章 生 存 分 析 生存分析方法是一种非常重要的统计分析方法,主要用于分析涉及一定时间的发生和持续长度的时间数据,揭示事件发生和发展的规律。 生存分析目前已广泛应用在医学、生物学、公共健康、金融学、保险和人口统计等诸多领域,它涉及数理统计中原有的参数统计与非参数统计的结合,而且涉及一些较深、较新的概率和其他数学工具。因此,生存分析方法日益受到人们的重视。 本章介绍了如何使用SPSS进行生存分析,SPSS所提供的功能主要有以下四项: Life Tables,生命表分析。 Kaplan-Meier,Kaplan-Meier估计。 Cox Regression:Cox回归分析。 Cox w/Time-Dep Cov,时间相依性的回归分析。 11.1 生存分析的概念 生存分析(Surviual Analysis)主要用于对涉及一定时间的发生和持续长度的时间数据的分析。生存分析所分析的数据通常称为生存数据,生存数据按照观察数据所提供的信息不同,可以分为完全数据、删失数据和截尾数据3种。 11.1.1 生存分析简介 在1986 年美国国家科学院委员会提出的数学发展概况的报告中,6个有代表性的分支学科中就有一个是论述生存分析的,而且被作为数学与其他学科,甚至社会科学互相渗透的一个重要例子。 Censor一词的原意是审查、删改的意思,近10多年来,广泛出现在统计学中。我们经常会碰到类似的一些数据:灯泡在长达500小时的寿命实验中没有毁坏;无线电信号在受到强烈干扰而无法收到信号前已经持续了15分钟;吃了致癌物质的小白鼠到4月2日早晨8 时还没有明显反应;机器从今天上午6时到现在已经出了三次毛病。这些数据的共同特点是它们由于某种原因被截断了,以致无法得知其确切值,但可以知道它们都大于某个数。例如,我们知道的信息仅仅是:灯泡的寿命大于 500 小时,无线电信号至少持续了 15分钟等。怎样在统计中利用这些信息呢?这就是生存分析所要研究的问题。从某种意义上讲,有一个统计问题,就可能有相应的截断数据的统计问题。 11.1.2 生存分析的数据类型 生存分析所要分析的数据称为生存数据,用于度量某事件发生前所经历的时间长度。事件可以是产品的失效、保单的索赔、疾病的发生、生命的死亡等。若跟产品失效有关,则生存数据也称为失效数据。 按照观察数据所提供的信息不同,生存数据又可以分为三大类。 1.完全数据 2.删失数据 3.截尾数据 11.1.3 生存分析的方法 在生存分析中常用的方法很多,可以按许多标准进行分类,例如按照参数使用参数与否可分为三大类。 1. 非参数方法 2. 参数方法 3. 半参数方法 11.1.4 生存分析的基本函数和参数模型 1.基本函数 (1) 生存函数S(t) (2) 危险率函数?(t) 2.常见的参数模型 (1) 指数分布(参数?0) (2) 线性危险率分布 (3) Weibull分布(参数?0,??0) 11.2 生命表分析 生命表分析用于检测两个事件的分布,但第二个事件不一定发生。也就是说,某些观测量被删截。生命表示建立在大数定理的基础上,其基本思想是将观测区间划分为很多小的时间区间,对每一个区间所估计的概率都用来估计事件发生在不同的时间点上的概率。 生存分析中的生命表方法就是利用构造生命表的原理来得到观察时间在任一时刻的生存状况。生命表法全称为由不完整数据样本估计表格式生存模型矩阵方法。 11.2.1 生命表分析简介 在生存分析中,对生存函数的估计是一个重要问题。生命表方法是一种重要的非参数估计方法,它不仅有悠久的历史,而且在各领域都有广泛的应用。 在实际研究中,通常需要了解两个事件之间间隔的时间长短的分布。 生命表分析正好适合于分析这种数据。生命表的基本思想是将观测区间划分为很多小的时间区间。对于每一个区间,所有在该区间依然“存活”的观测个案都会被用来计算在此区间“死亡”的概率。对每一个区间所估计的概率都用来估计事件发生在不同时间点上的概率。 人们习惯认为1693年Edmund Halley发表的《根据Breslau城出生与下葬统计表对人类死亡程度的估计》是生命表分析的创始,在这篇文章中Edmund Halley第一次使用生命表的形式给出了人类死亡年龄的分布。生命表建立在大数定理的基础上,用观察数据计算各年龄人群的死亡(生存)概率,因其简便准确,已经在人口学、医学统计、保险和可靠性研究等诸多领域得到广泛应用。 生存分析中的生命表方法就是利用构造生命表的原理来得到观察时间在任一时刻的生存状况。 11.2.2 生命表分析的SPSS操作 建立或打开数据文件后,即可进行生命表分析。 从菜单栏中选择“分析”→“生存函数”→“寿命表”命令,打开图11-1所示的“寿命表”对话框。 “状态”用于选入状态变量。选入状态变量后,

文档评论(0)

南非的朋友 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档