- 1、本文档共47页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
如果研究人群中存在一个或多个既与观察结局有关,又与处理因素有关的外来因素,那么就可能会掩盖或夸大所研究的处理因素与观察结局之间的联系。这种影响称之为混杂偏倚(confounding bias)或称混杂(confounding)。这些外来因素称为混杂因素(confounding factors)。 临床随机对照试验(randomized controlled trial ) 传统的控制混杂偏倚的方法包括在研究设计阶段进行配比, 或在数据分析阶段按照混杂因素分层,或采用多因素数学模型进行调整等 倾向指数(propensity score, PS,倾向评分)的概念由Rosenbaum和Rubin在1983年首次提出。2000年之后,这一方法日益受到人们的关注。国际上越来越多的研究者将倾向指数法应用到流行病学、健康服务研究、经济学以及社会科学等许多领域。在流行病学研究中,该方法可以在分析和设计阶段有效平衡非随机对照研究中的混杂偏倚,使研究结果接近随机对照研究的效果。 通过Pub Med检索“propensity score”,2000年之前共有77篇,到2010有1691篇,截止到目前为止有4320篇。 在数据库CNKI中检索“倾向指数”或“倾向评分”,2004年之前没有相关文献,截止到目前为止只检索到相关文献17篇。 倾向指数,它是多个协变量的一个函数,通过倾向指数的变化可以表示多个协变量共同作用的结果,来均衡处理组和对照组间的协变量分布。倾向指数是所有协变量的一个函数,在大样本情况下,经过倾向指数调整的组间个体,除了处理因素和结果变量分布不同外,其他协变量应当均衡可比,相当于“事后随机化”,使观察性数据达到“接近随机分配数据”的效果。 倾向指数的基本原理 倾向指数的理论值,记为E(X),由以下函数模型产生: E(X)=P(Z=1|X=x) (其中分组变量=Z,Z=1代表样本接受处理组,Z=0代表样本接受对照组,X=x代表除处理因素以外的所有已知的混杂因素,即特征变量。)假定分组变量Z和特征变量Xi相互独立,则 P就是所定义的倾向指数,这里倾向指数P是评价两组间特征变量Xi均衡性的近似函数。如果从处理组选出研究对象i,则Pi ( Zi = 1| Xi = xi),再从对照组选出一个研究对象j,那么Pj ( zj = 0| Xj= xj);如果Pi = Pj,则必然有x i = x j,如果我们尽量使Pi≈ Pj,则xi和xj必然十分接近。由此可见,倾向指数Pi最大限度地概括混杂因素xi的作用,因而可以有效地保持处理组和对照组间xi的均衡性,使两组间各个特征变量均衡一致。 多数情况下Zi 均为二分类变量,因此可以运用判别分析或logistic回归的方法,估计出各个研究对象的倾向指数Pi。如果特征变量xi均为正态分布的计量数值,宜于选用判别分析法估计出各个观察对象的倾向指数Pi;在大多数情况下,尤其是医学研究资料,xi中都包含有一些二分类变量或等级变量,多选用非条件logistic回归的方法来估计倾向指数,数学模型如下: 研究步骤 ①根据临床经验和实际要求,以处理因素为应变量,混杂因素为自变量来构建logistic或者probit模型; ②由大量观察性数据拟合模型的参数; ③根据拟合的模型计算每个个体的倾向指数,指数范围为0—1之间,反映个体被分到某组的概率; ④以倾向指数为依据,通过倾向指数匹配或分层等方法来均衡组间协变量的分布; ⑤选择合适的方法来评价倾向指数方法应用前后组间协变量的均衡性,均衡性评价是衡量倾向指数方法应用效果的重要指标; ⑥根据数据类型选择相应的传统统计方法进行分析,估计处理效应,但是要考虑到应用倾向指数方法后样本的配对特征。 在实际工作中,倾向指数法需要在统计软件中实现。常用的统计软SAS,SPSS,STATA均可以进行倾向指数的分析。 倾向指数主要研究方法 匹配 分层 协变量调整 匹配法 倾向指数匹配法在医学研究中应用最为广泛。是指通过模型估计倾向指数后,从对照组中选出与暴露组倾向指数相同或相近的个体进行配对,以达到均衡组问协变量的目的。 从匹配范围上,倾向指数匹配法可分为局部匹配和全局匹配。 局部匹配法也称最近可用匹配,是指暴露组从第一个个体开始,在对照组中寻找倾向指数与其最接近的个体,直到暴露组所有个体都有匹配的个体,其优点在于匹配集的最大化,最大程度保留了研究样本的信息。 全局匹配法是把匹配问题转化为运筹学中网络流(network flows)问题,把暴露组和对照组个体看作节点(node),把匹配转化为求最小化节点间的总距离,不保证每个处理都能找到最优的匹配,也就是说,与暴露组个体匹配的对照组个体倾向指数的差值并不是最小的。但是能保证匹配集倾向
文档评论(0)