分类变量的重复测量课件.pptVIP

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
分类变量的重复测量 资料分析 流行病与卫生统计学教研室 沈毅 2005.3.15 分类变量(categorical variable)又称为定性变量(qualitative variable),在工作中应用甚广。根据其不同的取值性质,又可分为3种类型: 第一种是名义刻度(nominal scale)的分类变量,它是按事物属性分类的变量,如性别、职业等。在统计学上为了计算方便,将这些不同的属性进行数量化处理,如男性赋值为1,女性赋值为2。这种数值只是作为属性的代码,其间并无大小之分。 第二种为有序刻度(ordinal scale)的分类变量,它是根据事物呈现出的程度或水平不同进行赋值。如临床化验结果用符号“-、+、++、+++”,文化程度用“文盲、小学、中学、大学、研究生”来划分等级,在进行数量化处理时赋值1、2、3、…。这里需要注意的是,1与2之差不一定等于2与3之差。 第三种是区间刻度(interval scale),如人口学统计中的年龄分组,“0-,10-,20-,…”就是典型的例子。根据资料的性质,区间跨度有等距的,也有不等距的。 把分类变量作为反应变量进行重复观察的情形在工作中应用较广。在本书第九章第五节中介绍了二分类反应变量的重复测量资料分析方法。 本章将介绍分类反应变量重复测量资料的一般分析方法。主要介绍加权最小二乘法分析方法。第一节一个总体的二分类反应重复测量资料的分析。 第一节 二分类反应重复测量 资料的分析 一、资料结构 设有n例受试者,反应变量y,分为 r水平(当r=2时称y为二分类反应变量),有p个观测时间点,每一受试者可能出现的结果共有rp种。当r=2、p=3时的所有可能结果共有8种。当对y用(0,1)赋值方法时,n例受试者在这8种组合情况下出现的边际合计数为n000至n111。详细分配情况见下面示意图图11 .1。 边际合计数n000至n111是每种可能取值结果组合情况下的观察例数。总例数n为边际合计数之和。如果将上述示意图资料按独立观察资料整理各时间点的频数分布时(表11.1),每一时间点的合计数都为n=n1+=n2+=n3+,总例数变成了3n而不是n。但实际是观察例数为n,观察次数为3n。一般统计学方法是以表11 .1的资料类型为出发点进行分析的。而本章介绍的方法是以图11 .1的边际合计数为出发点进行分析的。 二、模型结构 受试者i在时间点j的反应变量为yij ,其取值概率为pj,(j=1,…,p)。单总体重复测量资料的任务为是要分析这p个概率p1,…,pp,是否相等。令反应频数的某种函数即反应函数(response function)F=f(m),建立的线性模型为: 式中X为d×q维的设计矩阵,d=(r-1)p,为反应函数。B为q维未知参数。 由于每一个体在不同时间点的反应变量的取值是相关的,因此,在配合模型时应将这种相关性纳入模型中。对式(11.1)求参数估计值的加权最小二乘解法就是在考虑到这种相关性的基础上建立起来的。模型(11.1)的加权最小二乘解法求参数?的估计值 的计算公式为 例11.1一项药物对风湿性关节炎的治疗效果观察。用一种药物对46名患风湿性关节炎的病人进行治疗,共三个疗程。每个疗程结束后评价其治疗效果。有效者记为yij=1,否则yij=0 i=1,…,46; j=1,2,3。资料列于表11.2中。表中的T1,T2,T3分别代表三个疗程。本项研究的目的是探讨不同疗程的疗差别。 三、配合线性模型的步骤 表11.2为资料的原始记录形式,需要将其整理成边际频数表的格式后再配合模型。计算步骤介绍如下。 1.首先用下列SAS程序计算边际合计数 程序中的subj为受试者号,time1、time2、time3代表3个疗程。 计算出的边际频数列于表11.3中。 从而得到边际频数向量n及其函数边际频率向量m为: n= (6 16 2 4 2 4 6 6)’ M=(6/46 0.3478 0.0435 0.0870 0.0435 0.0870 0.1304 0.1304)’ 用nj及mj表示向量n及m中的元素。 2.给出转换矩阵A 本例的转换矩阵A的结构为 A的作用是将反应频率M转换成反应函数F。 3. 求出反应函数F 它是每一时间点反应变量各个水平的边际概率。但它不包

文档评论(0)

mwk365 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档