SAS基础知识课件参考.ppt

  1. 1、本文档共103页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
SAS基础知识课件参考

本章小节 R×C表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4类。①双向无序R×C表,R×C表中两个分类变量皆为无序分类变量。若研究目的为多个样本率(或构成比)的比较,可用行×列表资料的?2检验;若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时,可以用行×列表资料的?2检验以及Pearson列联系数进行分析。②单向有序R×C表有两种形式:一种是R×C表中的分组变量是有序的,而指标变量是无序的,此种单向有序R×C表资料可用行×列表资料的?2检验进行分析;另一种情况是R×C表中的分组变量是无序的,而指标变量是有序的,此种单向有序R×C表资料宜用秩和检验进行分析。 本章小节 ③双向有序属性相同的R×C表,R×C表中的两分类变量皆为有序且属性相同,实际上是2×2配对设计的扩展,此时宜用一致性检验(或称Kappa检验);双向有序属性不同的R×C表,R×C表中的两分类变量皆为有序且属性不相同,对于该类资料,需要分析两有序分类变量间是否存在线性变化趋势,宜用有序分组资料的线性趋势检验。 本章针对不同类型的R×C表资料分别予以介绍,并通过实例进行数据分析,并通过SAS程序完成统计分析过程,大家在练习不同类型数据的分析方法时,掌握常用数据分析的SAS程序,并能够灵活运用。 生存分析 SAS应用 蒋红卫 Email: JHWCCC@21CN.COM 学习目标 了解生存分析的应用范围和数据特点; 熟悉常见的生存时间分布规律的函数; 掌握生存率的两种估计方法:乘积极限法和寿命表法; 掌握估计和比较生存函数的SAS程序; Cox回归的形式、数据格式、应用和SAS程序。 生存分析简介 在医学研究中,常常用随访的方式来研究事物发展的规律。例如,了解某药物的疗效,了解某仪器设备的使用寿命,了解手术后的存活时间等等。这种研究的特点是追踪研究的现象都要经过一段时间,统计学上将这段时间称为生存时间。生存分析就是用来研究生存时间的分布规律以及生存时间和相关因素之间关系的一种统计分析方法。 生存分析在医学科学研究中具有广泛而重要的应用价值,它对人群寿命的研究,各种慢性疾病的现场追踪研究,临床疗效试验和动物试验等研究中随访资料的处理起着举足轻重的作用。 生存数据 生存数据,指的是生存时间以及与生存时间有关联的一组独立变量。这里主要解释与生存时间有关的几个概念。 在生存分析中将生存时间定义为从某起始事件起到某终止事件为止所经历的时间跨度。例如,在临床研究中,冠心病患者在两次发作之间的时间间隔;在流行病学研究中,从开始接触危险因素到发病所经历的时间;在动物研究中,从开始给药到发生死亡所经历的时间。所以,生存时间也称为失效时间。 生存数据 生存时间资料与多元线性回归资料很相似,只不过因变量通常为观测对象生存的时间,常用t来表示。当然,生存时间是广义的,可以指在通常意义下生物体的生存时间、也可以指所关心的某现象(如疾病治愈后、合格品使用后)持续的时间。若生存时间是准确观测到的,则称为完全数据,它提供的关于生存时间的信息是完整确切的,也就是说它准确地度量了观察对象实际生存时间。但是生存资料的一个明显特点是:所收集的资料中常常包含不完全数据,也称为截尾数据、删失数据。包括删失数据的资料,称为删失资料(或截尾数据)。它提供的关于生存时间的信息是不完整不确切的,也就是说它没有准确地度量观察对象实际生存的时间。 生存数据 导致数据删失有很多原因,较常见的为失访和研究截止。由随机因素引起的,称为随机删失;若事先就定了截止日期,则称为定时删失;若事先就定了观察完多少例就截止研究,则称为定数删失。 在表达删失数据时, 常在其右上角放一个“+”号;而用SAS软件分析时,常在其前放一个“-”号或产生1个指示变量(例如,C=0表示删失数据、C=1表示完全数据),便于计算时区别对待。为了使数据的表达与计算在形式上统一起来,本章一律用负数表示删失数据,因生存时间不可能为负值,故不会产生混淆。 生存数据 一般地,截尾数据可分为右截尾、左截尾、区间截尾等不同类型。右截尾数据表示观察对象至少存活到时刻t,即生存时间的上界是未知的。右截尾数据一般出现在随访过程中某些观察对象失访或死于其它原因,或在规定的研究过程结束时观察对象的终止事件还未发生。左截尾数据表示观察对象至多存活到时刻t,即生存时间的上界是已知的,但确切的生存时间是未知的。区间截尾数据表示观察对象至少存活到t1时刻且至多存活到t2时刻。 生存数据 对于截尾数据,既不能简单地弃之,需要采取一些技术处理。专门处理这种资料的统计方法,称为生存分析。应为抛弃截尾数据不仅损失了样本量,最重要的是在这些截尾数据中,特别是右截尾数据大部分是生存时间较长者的数据,损失掉这一部分观察对象的信息,分析结果一定是片面或不稳定的

文档评论(0)

2017meng + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档