- 1、本文档共25页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第七章多阶段抽样 第八章 多阶段抽样 群内单元通常具有相似性(表现为群内相关系数大于零),尤其是当群比较大时,人们自然会想到没有必要对群内所有单元都进行调查,而是对群内单元进行再抽样,对部分被抽中的单元进行调查,这就是实际工作中常用的多阶段抽样。 整群抽样具有样本比较集中的特点,因此它可以节省调查费用,而且便于组织实施,回答率通常也较高。 一、多阶段抽样的定义 先在总体N个单元(初级单元)中抽出n个样本单元,并不对这个样本单元中的所有下一级单元(二级单元)都进行调查,而是在其中再抽出若干个二级单元并进行调查。这种抽样方法称为二阶段抽样。同样的道理,还可以有三阶段抽样、四阶段抽样等。对于二阶段以上的抽样,称为多阶段抽样。 例如,以全国为总体进行某项调查,可以定义全国的县为初级单元,乡镇为二级单元,自然村为三级单元,户为四级单元等。在全国抽取若干样本县,对样本县再抽若干样本乡镇,在样本乡镇中,抽取若干自然村,在自然村中抽取样本户,这是一个四阶段抽样问题。 二、多阶段抽样的优点 1、样本比较集中、便于调查、节省费用。 3、多不需要编制所有小单元的抽样框,从而大大降低编制抽样框的工作量。 2、同时又避免了对小单元过多调查造成的浪费, 抽取初级单元时,只需编制初级单元的抽样框,对被抽中的初级单元,再去编制二级单元抽样框,依此类推,每阶段只需编制该阶段的抽样框, 三、抽选方法与推断原理 多阶段抽样每一个阶段的抽样可以相同,也可以不同,它通常与分层抽样、整群抽样、系统抽样结合使用。一般来说,当初级单元大小相同时,第一阶段的抽样采用简单随机抽样;当初级单元大小不同时,第一阶段的抽样采用不等概抽样。 如果两阶段抽样中所有初级单元都被抽中,在每个初级单元中抽取部分二级单元,则这时的抽样就成为分层抽样。如果对初级单元进行抽样,并且样本初级单元中的所有二级单元都被抽中,则这时的抽样就成为整群抽样。 为在固定初级单元对第二阶抽样求均值和方差; 性质1 为对第一阶抽样求均值和方差。 性质1可以推广到多阶段抽样的情形,例如对于三阶段抽样,有: 8.2 初级单元大小相等的二阶抽样 首先考虑初级单元中二级单元规模相等的情形。对于初级单元大小不等的情形,可以通过分层,将大小近似的初级单元分到一层,则层内的二阶抽样就可以按初级单元大小相等的方式来处理。 第一阶段在总体N个初级单元中,以简单随机抽样抽取n个初级单元,第二阶段在被抽中的初级单元包含的M个二级单元中,以简单随机抽样抽取m个二级单元,即最终接受调查的单元。 第i个初级单元按二级单元的平均值: 按二级单元的平均值: 初级单元间的方差: 初级单元内的方差: 估计量及其性质 (一)总体均值的估计 对于初级单元大小相等的二阶抽样,如果两个阶段都是简单的随机抽样,且对每个初级单元,第二阶抽样是相互独立进行的,则对总体均值的无偏估计为: 其方 差为: 方差的无偏估计为: [例8.1] 欲调查4月份100家企业的某项指标,首先从100家企业中抽取了一个含有5家样本企业的简单随机样本,由于填报一个月的数据需要每天填写流水账,为了减轻样本企业的负担,调查人员对这5家企业分别在调查月内随机抽取3天作为调查日,要求样本企业只填写这3天的流水账。调查的结果如表8.2。 要求根据这些数据推算100家企业该指标的总量,并给出估计的95%置信区间。 解:对这个问题,我们可以利用二阶抽样的思路解决。首先将企业作为初级单元,将每一天看作二级单元,每个企业在调查月内都拥有30天(即拥有30个二级单元)。 在这个问题中,调查人员首先在初级单元中抽取了一个n=5的简单随机样本,然后对每个样本的二级单元分别独立抽取了一个m=3的简单随机样本,这就是初级单元大小相等的二阶抽样问题。 由题意知: 首先计算样本初级单元的均值、方差,如下表: 于是得到: 的标准差为: 的置信区间为: 值得注意的是,如例8.1所示,方差估计式中,第一项是主要的,第二项要小得多,这是因为第二项的分母是第一项的 m倍,而且它还要乘以小于1的 f1,在最终样本量n×m确定条件下,提高 n减少m可以大大提高估计的精度。 第七章多阶段抽样 样本企业 1 60 13 2 43 39 3 58 39 4 50 7 5 57 19
样本企业 第一户 第二户 第三户 第三户 一栋A座 是 是 否 否 二栋C座 否 是 否 否 三栋C座 否 否 否 是 四栋C座 否 否 否 否 五栋B座 是 否 否 否
文档评论(0)