抽样技术-第10章.pptx

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十章 调查中的非抽样误差第一节 概述第二节 抽样框误差第三节 无回答误差第四节 计量误差第五节 离群值的检测和处理第一节 概述抽样误差与非抽样误差非抽样误差的特点不随样本量增加而减少造成估计偏差难以测定与识别理论相对薄弱产生渠道:调查设计:调查问卷的设计,抽样底册的不完善数据搜集阶段:调查人员,被调查者,调查工作人员在数据处理阶段:调查数据的编辑,编码、键入、估计分类:抽样框误差、无回答误差、计量误差 第二节 抽样框误差 抽样框误差 :目标总体与抽样总体不一致目标总体,即作为调查研究对象的全体 抽样总体,即从中抽选样本的总体 抽样框误差类型: 1.丢失目标总体单元,威胁性较大. 2.包含非目标总体单元。 3.复合联接。这是指抽样框中的单元与目标总体单元不完全是一一对应关系。例如一个门牌号内居住两户或多户家庭,一户拥有两处或多处住房。 4.不正确的辅助信息。对抽样框误差的基本认识1.有些误差来自构成抽样框资料的本身。2.抽样框的维护,抽样框使用情况的不断总结与研讨,对于经常性的调查项目来说,是十分必要的。3抽样框不完善并不意味着不能使用。4.抽样框误差在有些场合下会被解释为其它类型的非抽样误差。抽样框误差的影响:丢失目标总体单元总量估计N=N1+N0 N1:抽样框中单元,N0:抽样框中丢失的单元, n1:抽样框中抽出的样本容量估计量 :偏差:相对偏差 低估r=1,即丢失单位均值与抽样框单位均值相同,则相对偏倚为-W0 实践中抽样框中的丢失单元往往规模较小,一般r1, 故相对偏倚的绝对值小于W0丢失单元比重 W00.50.91.01.12.00.010.050.100.250.50-0.0050-0.0256-0.0526-0.1429-0.3333-0.0090-0.0452-0.0909-0.2308-0.4737-0.010-0.050-0.100-0.250-0.500-0.0109-0.0547-0.1089-0.2683-0.5238-0.0198-0.0952-0.1818-0.4000-0.6667丢失单元条件下总体总和估计的相对偏倚 均值估计估计量 :偏差:相对偏差 如果丢失单元均值和抽样单元均值相同,即r=1,则估计量是目标变量的无偏估计。如果r≠1,偏倚状况则随r的变化而变化 丢失单元比重W00.50.91.01.12.00.010.050.100.250.500.00500.02560.05260.14290.33330.00100.00500.01010.02560.052600000-0.0009-0.0049-0.0099-0.0244-0.0476-0.0099-0.0476-0.0909-0.2000-0.3333丢失单元条件下总体均值估计的相对偏倚 不完善抽样框的使用 一种是利用核查或其它有关资料,掌握误差情况,对不完善的抽样框进行调整,或对不完善抽样框所得到的估计量进行调整;第二种是事先制定一些规则,对发现的抽样框问题进行现场处理;比如:实行联接(使没有包含在抽样框中的目标单元与包含在抽样框中的单元相联接 )、惟一联接。第三种是使用多个抽样框进行抽样 使用多个抽样框 剔除重迭 ,成本高事后分层估计 NA,NB:两个抽样框的单元数 两个抽样框将目标总体划分为三个区域:a,b,abNa,Nb:仅仅与抽样框A、B有联系的单元数 Nab:与抽样框A、B均有联系的单元数nA,nB:从A、B框中分别抽出的两个样本的容量na,nb nab,:落入区域a,b,ab的样本单位数利用抽样框A的样本利用抽样框B的样本WA+WB=1 总量估计的近似方差: : 重迭部分单元占抽样框单元的比例 总费用给定条件下使方差最小的最优抽样比和权重为 第三节 无回答误差一、无回答的内涵无回答 由于各种原因而没有获得设计时本应获得的信息 在内容上看,可以分为可以分为单元无回答和项目无回答。 从性质上看,可以分为有意无回答和无意无回答。 二、无回答的原因如果把采集数据的过程划分为查找,接触和采访三个阶段,三个阶段都有可能出现无回答:查找阶段、接触阶段、采访阶段。三、无回答的统计影响导致估计量估计偏差 若无回答者与回答者在调查项目的数量特征上存在差异,这种无回答就会导致无回答偏差 降低估计效率 无回答减少了实际调查的样本数量,因而扩大估计量的方差,导致估计效率降低 完全数据统计方法无法使用 一般统计方法都适用于完整的矩阵数据,无回答造成数据缺失,可能导致一些标准的完全数据统计方法不能直接用于数据分析。四、降低无回答的措施可以采用的预防措施主要有:1.问卷设计具有吸引力,容易引起被调查者参与的兴趣,并注意适当的长度。2.在可能的条件下,充分利用调查组织者的权威性和社会影响力,激发被调查者的参与意识。3.确定

您可能关注的文档

文档评论(0)

BLUED + 关注
实名认证
内容提供者

教师资格证持证人

全网 内容最全课件 价格最低 质量最高 不是之一,是唯一。 每个人使用的办公软件版本不一样,如有个别显示不出的文件,建议使用必威体育精装版版。

版权声明书
用户编号:8070063100000015
领域认证该用户于2023年03月20日上传了教师资格证

1亿VIP精品文档

相关文档