- 1、本文档共4页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
任意缺失模式缺失数据不同填补方法效果比较.pdf
生国里生缠盐垫!!生!Q旦笠!Q鲞筮!翅
任意缺失模式缺失数据不同填补方法效果比较术
张桥1 李 宁2 张秋菊1 刘美娜1△
【提要】 目的探讨任意缺失模式下缺失数据的填补方法,并对不同方法填补效果进行比较和评价。方法结合
我国北方绝经期妇女钙需要和膳食评估应用研究课题的数据,调用SAS软件中IML模块产生任意缺失模式模拟数据,通
过MI和MIANALYZE过程实现缺失数据的填补,同时应用准确度和稳定度两个评价指标来评价各方法填补的效果。结
果Ps方法填补3次在本文模拟的任意缺失模式的缺失数据中填补效果最佳,MCMC方法填补效果并不理想。结论
法把数据填补成单调缺失后,再用相同方法进行一次填补也是一种可选择的填补方法。
【关键词】 缺失数据任意缺失模式多重填补数据模拟
数据缺失是实验研究和调查研究中一个普遍存在 已观察到的数据无关也与未观察到的数据无关,则该
的问题…,如何正确的处理、分析所缺失的数据在数 缺失数据类型为MCAR;如果缺失数据的发生概率与
据分析中占有重要地位。缺失数据的类型按照不同的 所观察到的变量是有关的,而与未观察到的数据特征
分类方法可划分不同类别,按缺失机制分类和按缺失 无关,则该缺失数据类型为MAR;若数据既不属于完
模式分类两种划分方法心’31。 全随机缺失也不属于随机缺失,那么该缺失数据类型
按照由Little和Rubin在1976年提出的缺失机制就属于NMAR【5J。按照数据缺失模式可以分为单调
com— 缺失模式和任意缺失模式两类哺。7],为了简单明了可
分类,缺失数据可以分为完全随机缺失(missing
at atran—
random,MCAR)、随机缺失(missing以通过图1来形象的理解,其中是5个变量,1~5是5
pletely
at 个样本,“×”表示数据能观察到,“.”表示数据缺失。
dom,MAR)和非随机缺失(notmissingrandom,
NMAR)三类H】。如果所缺失的数据发生的概率既与
‘ ’ ‘
5 × ×
(b)任意缺失模式
(a1单调缺失模式
图1数据缺失模式
单调缺失模式如图1(a)所示,对数据集进行适当填补(mul卸le
chainmonte
的行列变换后,可以得到这样一个矩阵,它呈现出一种 洛(markov
observa-
层级缺失的模式,矩阵中的元素y,缺失时,则对任意 向数据有时也采用单一填补中的LOCF(1ast
carded
的P≥,,元素Y,也是缺失的;任意缺失模式如图1(b)tionforward)方法㈨。本文将探讨AdHoc法、
所示,数据缺失具有随意性,没有任何规律可循,即使LOCF填补、多重填补中的回归方法、预测均数匹配
通过行列变换也无法看出任何规律。 mean
(predictive
对于任意缺失模式的数据处理,查阅相关文献发 (propensity
现常用的就是把
文档评论(0)