- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中国卫生统计年月第卷第期二分类数据缺失多重填补分析及应用山西医科大学公共卫生学院卫生统计教研室张耀陈培翠张翠仙罗天娥刘桂芬提要目的阐明四种填补方法的基本原理实例介绍纵向研究二分类缺失数据多种填补方法的应用方法对比分析简单填补分层填补考虑个体差异的填补及考虑个体抽样的多重填补等四种填补方法模拟证实几种取值的敏感性分析结果进行大样本模拟研究表明简单多重填补分析会降低检验效能不能客观反应两样本的差异考虑先前信息的分层多重填补会扩大型错误若只考虑个体变异仅模拟一个数据集所得结论不稳定在考虑个体抽样和填补
·370· 中国卫生统计2014年6月第31卷第3期
二分类数据缺失多重填补分析及应用
山西医科大学公共卫生学院卫生统计教研室(030001) 张 耀 陈培翠 张翠仙 罗天娥 刘桂芬△
【提 要】 目的 阐明四种填补方法(multipleimputation,MI)的基本原理,实例介绍纵向研究二分类缺失数据多种
填补方法的应用。方法 对比分析简单填补、分层填补、考虑个体差异的填补及考虑个体、抽样的多重填补等四种填补方
法;模拟证实几种OR取值的敏感性分析。结果 进行大样本(N=10000)模拟研究表明:简单多重填补分析会降低检验
效能,不能客观反应两样本的差异;考虑先前信息的分层多重填补会扩大I型错误;若只考虑个体变异,仅模拟一个数据
集,所得结论不稳定;在考虑个体、抽样和填补差异后模拟的多重填补数据集,当OR 2时,所得统计量基本接近真值;实
≈
例验证,经高血压知晓干预后,尚不能认为两区的吸烟率有差别。结论 不考虑前次观察数据以及 OR值的影响,一味地
把缺失值当作该事件发生处理,会加大I型错误;只有综合考虑个体、抽样和填补差异,多重填补数据集的估计结果才更
具稳健性。
【关键词】 多重填补 纵向研究 二分类数据缺失 效果评价
TheMultipleImputationandApplicationinBinaryLongitudinalMissingData
ZhangYao,ChenPeicui,ZhangCuixian,etal(DepartmentofHealthStatistics,SchoolofPublicHealth,ShanxiMedicalUniver
sity(030001),Taiyuan)
【Abstract】 Objective Toclarifythebasicprinciplesofthemultipleimputation(MI),wewillintroduceseveralmethods
withexamples.Methods ComparetheanalysisoffourMImodel,i.e.(1)simpleMI.(2)StratifiedMI.(3)TheMIwhich
considerindividualdifferences.(4)Performthecomprehensiveanalysisconsideringtheindividual,samplingandimputation.Car
ryoutsensitivityanalysisunderdifferentimputationsample,usingSAS92tocompleteMI.Results Largesample(N=10000)
simulationshowthat:simplemultipleimputationanalysiswillreducetheabilityofperformancetest,itcannotresponsethe
differencebetweentwosamples.themultipleimputationanalysiswhichconsideringthepreviousinformationwillexpandtypeI
error.Ifonlyconsideratetheindividualvariabilityandsimulateadataset,theconcludewillbenotstable;consideratetheindi
vidualvariability,sampling,andfillingdifference,whenOR 2,thestatisticsresultareclosetothetruevalue.Wefinallystillcan
≈
notbelievethattherateofsmokingareunequalbetweenthetwoareasthoughtheexampleofhypertensionawarenessinterven
文档评论(0)