第10章 非抽样误差.ppt

  1. 1、本文档共66页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第10章 非抽样误差

* * * * * * * * * * * * * * * * 2.比率估计调整法。 这种方法以观测值为辅助标志,以子样本复查均值与原调查均值之比作为调整比率。这时总体均值估计量为: = 其中 = , = , = 。 估计量的均方误差为: MSE( )= + ( 2 + ) 其中 为总体真实均值与总体观测均值之比, 为真实值与观测值之间的相关系数。 = , = 。 3.回归估计调整法。 这时的总体均值估计量为: = + ( ) 其中 = 。 估计量的均方误差为: MSE( )= + (1 ) 当然,在实际调整时,以上的 、 、 、 和 等都要由子样本的资料来估计。 * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 插补法 根据插补值是否包括残差,插补法可分为确定性插补和随机性插补。 根据确定插补值时是否使用辅助变量,将插补法分为使用辅助变量插补法和不使用辅助变量插补法。 使用辅助信息的插补法又可根据信息来源分为热卡法和冷卡法。热卡法(Hot-Deck)中的辅助信息来自当前调查,冷卡法(Cold-Deck)中的辅助信息来自以前的同类调查或其它已有的关于无回答单位的相关资料。 根据对每个缺失值的插补值的数,插补法又可分为单一插补法(single imputation)和多重插补法(multiple imputation)。 演绎插补法(Deductive imputation,DI) 通过辅助资料的演绎,找出插补值,也是一种使用辅助变量的插补法。 该辅助资料可能就来自本次调查,也可能来自其余调查或其他资料。冷卡法应用较多。 该方法对辅助信息的要求比较高,使用时要注意演绎方法的正确性。 例如: 没有受到过任何犯罪侵害,因此暴力犯罪受害者一项也应为0。 在纵向调查中,如果一个女人在第1年和第3年访问时都有2个孩子,而第2年的数据是缺失的,那么逻辑上的插补值就应该是2。 均值插补法(Mean imputation,MI) 利用回答单位的项目均值作为无回答项目的插补值。 总均值差补法(Mean imputation overall,MO) 分层均值差补法(Mean imputation within classes,MC) 方便实施,但会破坏分布,低估方差。适于点估计 为了避免尖峰的出现,可以采用随机单元均值插补法。 假设条件为:各单元中的缺失项目为完全随机缺失(MCAR)。 热卡法(Hot-deck imputation) 辅助信息来自同一样本的插补方法 按照辅助变量,将回答单位分成为若干的“插补层”,然后,对每一个无回答单位,依据其辅助变量值,从相对应的“插补层”中寻找一个回答单位,以其变量值对无回答数据集进行插补。 顺序性热卡插补法、最近距离热卡插补 、以及组内随机替代法等 回归法 通过建立y与辅助变量间的回归方程来补入缺失的y值。 优点:方法简单,对无回答的估计效果好,对每个被插补变量,可以利用不同的预测变量 缺点:如果没有随机误差项,可能导致高估;可能造成多重共线性;可能降低方差。 第二节 抽样框误差 抽样框误差 :目标总体与抽样总体不一致 目标总体,即作为调查研究对象的全体 抽样总体,即从中抽选样本的总体 抽样框误差类型: 1.丢失目标总体单元,威胁性较大。 2.包含非目标总体单元。 3.复合联接。这是指抽样框中的单元与目标总体单元不完全是一一对应关系。例如一个门牌号内居住两户或多户家庭,一户拥有两处或多处住房。 4.不正确的辅助信息。 二、抽样框误差的影响 (一)丢失单位的影响 在假定不存在其他原因的抽样框误差时,丢失单位对抽样效果的影响主要取决于两个方面:丢失单位的分布特征和丢失单位数所占的比重。其中,对总体均值的估计只与前者有关,而对总体总值的估计则与两者都有关。 (1)丢失单位是目标总体中的一个随机样本,具有与目标总体相同的期望与方差,则其对总体均值的估计影响不大,但对总体总值的估计会低估。 (2)丢失的单位是特殊群体,不具有与目标总体

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档