- 1、本文档共11页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十一章非抽误差及其控制
PAGE
PAGE 8
第十一章 非抽样误差及其控制
数据的准确性与可靠性是抽样调查的生命力之所在。如前所述,在抽样调查中,除存在抽样误差外,还经常出现一些非抽样误差,主要的非抽样误差产生原因有抽样框不完善、无回答的出现、调查过程的差错以及数据整理登记过程中的差错等。因此,抽样调查中,不仅要控制抽样误差,而且还要控制非抽样误差。如何有效地控制非抽样误差,取得准确可靠的数据资料,以及如何对已经取得的数据进行质量评价,一直是抽样调查理论和实践中所经常关注和着力研究解决的重要问题。
第一节 抽样框误差及其控制
一、抽样框误差的产生
抽样框是有关总体全部单元的名录或地图等的框架,是抽取样本单元的依据。理想的抽样框(也称抽样总体)应该同所研究现象的总体(也即目标总体)一致,但在实践中,抽样总体与目标总体常常不一致,由此产生的误差就是抽样框误差。
考察抽样框误差的成因,大致有以下几个方面:
(1)丢失目标总体单元。在此情形下,抽样框没有能够覆盖全部目标总体单元,也就是使部分目标总体单元没有包括在抽样框中,因而也就没有机会被选入样本。由于存在丢失单元,使得总体总和的估计偏低,总体均值的估计也可能会出现偏差。丢失单元是一种威胁性较大的抽样框误差,具有较强的隐蔽性,不易被发现。
(2)包含非目标总体单元。有时,抽样框中也可能包含了一些不属于研究对象总体即非目标总体的单元,由此容易导致总体总和的估计偏高。但这种类型的抽样框误差一般要比丢失单元的威胁性小。因为在调查中,非目标总体单元往往更容易被发现,并予以剔除。
(3)复合联接。实践中常可能会遇到这种情况:抽样框中的单元与目标总体单元不完全为一一对应,而是一对多或多对一,即存在复合联接。在这种情形下,目标总体中各个单元的入样概率可能会受到相应的影响,从而导致非抽样误差的扩大。但是,有时候采用经过精心设计的有复合联接的抽样框可以提高稀有元素被抽中的概率。
(4)不正确的辅助信息。一般将不包含辅助信息的抽样框称之为简单抽样框,而将包含辅助信息的抽样框称为复杂抽样框。复杂抽样框中的辅助信息可以用于分层抽样、不等概率抽样,以及使用比估计和回归估计等。如果辅助资料不完全或不正确,则不但不能提高抽样估计的效率,反而会降低估计的准确性。
(5)抽样框陈旧。有时由于构成抽样框的抽样单元资料“老化”,抽样框所提供的信息与现实情况差距较大,也会导致抽样框误差。并且这类误差也可能进一步引起前面四类抽样框误差中的一种或几种同时发生。
二、抽样框误差的确定
(一)丢失目标总体单元时的影响
前已指出,丢失目标总体单元是抽样框误差中威胁最为严重的一种。现设目标总体是由NA个抽样总体单元及另外N0个没有包含在抽样框中的单元(即丢失单元)组成,即N=NA+N0,则总体总和应为
其中为抽样总体总和,为丢失单元总和,为第i单元的观测值。现从抽样框的NA个单元中随机抽取nA个单元组成样本,则的无偏估计。当用NAYA来估计Y时,结果就会出现大小为的偏差,即
这表明Y被低估了。如果以r表示丢失单元与抽样框中单元的均值之比,即又以W0表示丢失单元占全部目标总体单元的比重,即,则总和估计量的相对偏差可表示为
当估计总体均值时,用估计的偏差为
;
此时的相对偏差为
表10.1与表10.2分别给出了不同的丢失单元比重W0对总体总和与均值估计的相对偏差。其中关于Y0与N0的值可依有关资料进行估计,对此,后面将专门讨论。
表10.1 丢失单元比重对总体总和估计的相对偏差
丢失单元比重
W0
0.5
0.9
1.0
1.1
2.0
0.01
0.05
0.10
0.25
0.50
-0.0050
-0.0256
-0.0526
-0.1429
-0.3333
-0.0090
-0.0452
-0.0909
-0.2308
-0.4737
-0.010
-0.050
-0.100
-0.250
-0.500
-0.0109
-0.0547
-0.1089
-0.2683
-0.5238
-0.0198
-0.0952
-0.1818
-0.4000
-0.6667
表10.2 丢失单元比重对总体均值估计的相对偏差
丢失单元比重
W0
0.5
0.9
1.0
1.1
2.0
0.01
0.05
0.10
0.25
0.50
-0.0050
-0.0256
-0.0526
-0.1429
-0.3333
-0.0010
-0.0050
-0.0101
-0.0256
-0.0526
0
0
0
0
0
-0.0009
-0.0049
-0.0099
-0.0244
-0.0476
-0.0099
-0.0476
-0.0909
-0.2000
-0.3333
(二)包含非目标总单元时的影响
如果以M0表示抽样
文档评论(0)