- 1、本文档共40页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 二阶及多阶抽样;9.1 概述;性质l:对于两阶抽样,有;河南财经学院;9.2 初级单元大小相等时的二阶抽样;;河南财经学院;定理:若两阶段的抽样都是简单随机抽样的,则
;
证明:;证明: ;
证明:;河南财经学院;例:文具商店一柜台,上月共用了18本发票,每本发票含发票200张。查帐者随机挑选了4本发票,再在挑中的发票本中随机抽了40张发票,记录其营业额。数据整理如下:
估计该柜台上个月的营业总额及标准差。
;解:; 9.3 初级单元大小不等时的二阶抽样 ;河南财经学院;一、对初级单元进行简单随机抽样时,总体总和Y的估计
第一阶抽样按简单随机抽样从N个初级单元中抽取个,
第二阶抽样按简单随机抽样,在抽中的初级单元中分别独立抽取次级单元。
(1)简单估计:
;
证明:;证明:;河南财经学院;(2)比估计:
;二、对初级单元进行放回不等概率抽样时,总体总和Y的估计
第一阶抽样按放回不等概率抽样(多项抽样)抽取初级元,
第二阶抽样并没有作出特别的规定,只要初级单元指标Yi的估计 是无偏的.
;河南财经学院;自加权情形:
第一阶抽样按放回不等概率抽样抽取初级单元,
第二阶抽样都抽取m个。
;自加权情形:
第一阶抽样按PPS抽样抽取初级单元,
第二阶抽样按简单随机抽样抽取次级单元,都抽取m个。
; 实际工作中,对于各级单元大小不相等时多阶抽样,自加权通常的做法是:
除了最后一阶采用等概率抽样(放回的或不放回的均可),前几阶均采用PPS抽样,并且自第二阶开始,每一阶的样本量都相同(即mi=m,kj=k,…),则样本是自加权的,其估计量的形式非常简单。
总体总和的估计为
的方差估计为;一、初级单元大小相等时,最优样本量m与n的确定:
1.m的确定:
线性费用函数:;河南财经学院;二、各级单元大小不相等时,多阶抽样的总样本量及最
优样本量的配置
二阶自加权情形:
第一阶抽样按PPS抽样抽取初级单元,
第二阶抽样按简单随机抽样抽取次级单元,都抽取m个。
; 实际工作中,对于各级单元大小不相等时多阶抽样,自加权通常的做法是:
除了最后一阶采用等概率抽样(放回的或不放回的均可),前几阶均采用PPS抽样,并且自第二阶开始,每一阶的样本量都相同(即mi=m,kj=k,…),则样本是自加权的,其估计量的形式非常简单。
总体总和的估计为
的方差估计为
;这时,多阶抽样的总样本量可以这样确定:
1.根据简单随机抽样时应抽样本量
2.再乘以设计效应deff获得。
多阶抽样与简单随机抽样相比其效率比较低,deff
应该大于1。实际工作中,可取deff的经验数据。不同项
目的deff不同。;例: 某调查公司接受了一项关于全国城市成年居民人均奶制品消费支出及每天至少喝一杯鲜奶的人数的比例情况的调查。确定抽样范围为全国地级及以上城市中的成年居民。成年居民指年满18周岁以上的居民。
第一步:确定抽样方法。
调查公司决定采用多阶抽样方法进行方案设计,调查的最小单元为成年居民。确定调查的各个阶为城市、街道、居委会、居民户,在居民户中利用二维随机表(Kish随机表的简化)抽取成年居民。
第二步:确定样本量及各阶样本量的配置。
按简单随机抽样时,在95%置信度下,绝对误差为5%,取使方差达到最大时的消费奶制品的居民比例为50%,则全国样本量应为:
;根据以往调查的经验,估计回答率b=80%,因此调整样
本量为:
多阶抽样的效率比简单随机抽样的效率低,这里取设计
效应deff=3.2,则在全国范围内应调查的样本居民为:
各阶的样本量配置为:
初级单元:20个城市;
二级单元:每个样本市内抽4个街道,共80个街道;
三级单元:每个样本街道内抽2个居委会,共160个居委会;
四级单元:每个样本居委会内抽10个居民户,1600个居户。
在样本居民户内,利用二维随机表抽1名成年居民。;第三步:确定抽样方法。
第一阶,在全国城市中按与人口数成比例的放回的不等
概抽样,即PPS抽样。
第二阶和第三阶分别按与人口数成比例的不等概等距抽
样。 以第二阶为例,在某个被抽中的样本城市中,将其所属
的街道编号,搜集各街道的人口数,赋予每个街道与其人口
相同的代码数;根据该市总人口数除以样本量4,确定抽样间
距;然后对代码进行随机起点的等距抽样,则被抽中代码所
在的街道为样本街道。
第四阶,分别在每个样本居委会中,按等距抽样抽出10个
民户。
即根据居委会拥有的居民户数除以样本量10得到抽样距,
然后随机起点等距抽样。 ;在每个样本居民户中,调查员按二维随机表抽取1名成年居民。二
文档评论(0)