网站大量收购闲置独家精品文档,联系QQ:2885784924

第7章 其它抽样方法.ppt

  1. 1、本文档共59页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第7章 其它抽样方法

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 第二节 双重抽样 (二)两阶段抽样的第二阶段抽样单元和第一阶段抽样单元往往是不同的;双重抽样要有一份最终单元的完整名册(总体所有单元的抽样框),而两阶段抽样只是需要第一阶段单元(初级单元)名册,然后在中选的初级单元中构造第二阶段抽样的抽样框。 第二节 双重抽样 三、双重抽样的作用 (一)有助于筛选主调查对象,如对高血压病人的调查、银行对储户存款的调查等; (二)提高抽样效率,因为第二重抽样可利用第一重样本的信息进行分层和比率估计; (四)可用于研究样本轮换中的某些问题; (五)降低无回答偏差,对无回答层进行第二重抽样并对其推断。 第二节 双重抽样 四、双重抽样的应用 (一)为分层的双重抽样 分层抽样如果事先无法知道总体的层权,可以采用双重抽样。具体实施过程如下: 第一步:利用简单随机抽样,从总体的N个单元中随机抽取第一重样本,样本单元数为 ;根据已知的分层标志将第一重样本分层,令 ,则 是总体层权 的无偏估计。 第二节 双重抽样 第二步:利用分层随机抽样,从第一重样本中抽取出第二重样本,样本单元数为n,第h层样本单元数为 , 。 采用双重分层抽样,对总体均值 的无偏估计量为: 的方差为: 第二节 双重抽样 上式可简化为 : 的样本估计量为: 第二节 双重抽样 第一步:从总体的N个单元中随机抽取第一重样本,样本单元数为 ;对于第一重样本,仅观测辅助变量信息,用辅助变量的样本均值 估计总体均值 。 (二)为比率估计的双重抽样 在实际工作中,如果辅助变量的信息未知,可以利用双重抽样进行比率估计。具体实施过程如下: 第二节 双重抽样 双重抽样对总体均值 的比率估计: 第二步:从第一重样本中随机抽取出第二重样本,样本单元数为n;对于第二重样本,观测目标变量与辅助变量,并用获得的 和 ,计算 ,构造比率估计。 双重抽样比率估计的方差为: 第二节 双重抽样 双重抽样比率估计方差的样本估计: 第二节 双重抽样 (三)为回归估计的二重抽样 与比率估计相似,在辅助信息未知时可以采用二重抽样进行回归估计。具体实施过程如下: 第一步:从总体的N个单元中随机抽取第一重样本,样本单元数为 ;对于第一重样本,仅观测辅助变量信息 ,用辅助变量的样本均值 估计其总体均值 。 第二节 双重抽样 第二步:从第一重样本中随机抽取出第二重样本,样本单元数为n;对于第二重样本,观测目标变量 与辅助变量 ,并计算 、 和回归系数b,构造回归估计。 双重抽样对总体均值的回归估计: 双重抽样回归估计的方差为: 第二节 双重抽样 式中 : 为第一重样本残差方差,其均值近似等于总体残差方差 : 因此双重抽样回归估计方差的样本估计: 第二节 双重抽样 (四)二重抽样在无回答调整中的应用 在出现无回答时,可使用二重抽样对无回答样本进行二次抽样调查,并对无回答层进行推断。如果无回答样本得到了完全回答,则基本上可以消除无回答偏差。 具体可见本书10.3节。 第三节 随机化装置 一、敏感性问题调查 所谓敏感性问题(sensitive question)是指所调查的内容涉及私人机密,受访者不愿或不便于向外界透露的问题。 对于这类敏感性问题,必须采取经过特别设计的装置与方法,以消除受访者的顾虑,能够如实回答问题,避免调查出现严重偏误。这种为敏感性问题调查特别设计的技术,称随机化回答技术(Randomized Response Technique)。 第三节 随机化装置 敏感性问题按总体的特征可分为属性特征和数量特征问题两类。属性特征的敏感性问题是指受访者是否具有敏感性问题的特征,一般是估计具有敏感性特征的单位在总体中所占的比例,因此又可称作敏感性比例问题。数量特征的敏感性问题是指受访者具有敏感性问题数额的多少的特征,一般是估计敏感性数额的均值或总和,也可称作敏感性均值问题。 二、沃纳随机化回答模型 使用随机化回答技术的第一个模型是由沃纳(S.L. Warner)首先提出的 。 例如,某大学欲调查学生考试的作弊问题,随机抽取n个学生进行调查,对每位学生显示两个相反的问题,问题可以写在外

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档