网站大量收购独家精品文档,联系QQ:2885784924

第七章(不等概率抽样).ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第七章(不等概率抽样)

第七章 不等概率抽样 §7.1 概述 一、不等概率抽样的提出与含义 二、不等概率抽样的使用和优点 三、不等概率抽样的分类 §7.2 放回不等概率抽样 一、多项抽样与PPS抽样 二、PPS抽样的实施 三、PPS抽样的估计 §7.3 无放回不等概率抽样 一、包含概率与πPS抽样 二、πPS抽样的估计 三、πPS抽样的实施 * copyright?princebf,2006-2007 §7.1 概述 §7.2 放回不等概率抽样 §7.3 不放回不等概率抽样* 一、不等概率抽样的提出与含义 前述概率抽样方式,具有“等概率” 的特点。 ◎简单随机抽样下总体中每一个单元的入样概率均相等 ◎分层随机抽样下,层内每一个单元的入样概率均相等 ◎特别地,按比例分配的分层随机抽样对于总体中每一个单元的入样概率均相等 等概率抽样的基本出发点是将总体(或层)中的每一个单元看作是平等的,不“偏向”也不“疏远”某些特定的单元 如果总体单元差异不大,这种方式既简单也合理 但是如果总体单元相差较大,等概率抽样效果不一定好 ◎例如估计昆明市商业零售总额,大型商场、中型超市和小型商店的差别非常明显,平等对待显然不合理 对这一情况,处理方式有多种: ◎分层抽样:按规模分层,大型抽样比高、小型抽样比低 ◎目录抽样:少数大单元普查而大多数小单元进行抽样 ◎不等概率抽样 不等概率抽样(sampling with unequal probability)是指在抽取样本之前给总体中的每一个单元赋予一定的入样概率,从而保证大的(重要的)单元抽到的概率大,而小的(不重要的)的单元抽到的概率小。这里每个单元被赋予的入样概率通常与某个辅助变量有关(比如单元规模等) 不等概率抽样是抽样理论发展的产物。 ◎代表性抽样:主观、有意识的抽样 ◎等概率的随机抽样:每个单元平等 ◎分层抽样:不同层不等概率,但层内等概率 ◎不等概率抽样:单元具有不等地位 二、不等概率抽样的使用和优点 不等概率抽样通常用于以下三种情况: ◎需要估计总体总量但总体单元规模相差很大的情况 ◎抽样审计 ◎在不能直接对基本的较小单元抽样的情形下,与其它抽样结合,完成对大的单元的抽样 在上述情形下,不等概率抽样的主要优点是可以大大提高估计的精度,较少抽样误差。 一个必要的约束条件是对总体的每一个单元,都要已知一个辅助变量用于确定其入样概率或两个单元同时入样的概率 三、不等概率抽样的分类 不等概率抽样有很多,布鲁尔与哈尼夫在1983年专著《不等概率抽样》中曾列举了50多种方法。不过真正常用的在10种左右 这些方法按其实施方法或特性可以分成许多不同的类型 ◎按抽样过程中被抽到的单元是否被放回总体而分为放回抽样和不放回抽样。常用的是放回抽样。 ◎按单元的入样概率是否严格地与单元大小成比例,还有最终杨本量n是固定还是随机的。 ◎不放回的抽样,按样本单元抽取方式还可以分为逐个抽取法、重抽法、系统抽取法等等。 一、多项抽样与PPS抽样 设总体包含N个单元,对其进行放回抽样。设在每次抽样中, 抽到第i个单元的概率为Zi(i=1,2,…,N), 独立进行n次这种抽样,共抽到n个单元(有可能重复),则称这种不等概率抽样为多项抽样(multinominal sampling) 特别地,当总体中每个单元具有一个说明其“大小”或“规模”的度量Mi时,则可将每个单元的入样概率取为: 此时每个单元在每次抽样中的入样概率与单元大小成比例,称这种特殊的多项抽样为与大小成比例的概率抽样(sampling with probability proportional to size),简称PPS抽样。 二、PPS抽样的实施 1、代码法(累积总和法,汉森-赫维茨法,1943) 设总体有N个单元,其规模度量为Mi,不妨设Mi为整数(否则可以乘以一个常数使其成为整数)。记Mi之和为M0,则可以设置M0个代码,其中第i个单元相应的有Mi个代码。其代码的具体范围可以采用累积方法获得。具体而言:第1个单元拥有代码1-M1,第2个单元拥有代码M1+1-M1+M2,……,第i个单元拥有代码: 每次抽样时在整数1-M0之间产生一个随机数m,则代码m所属的单元即为抽中单元,如此重复n次即可获得n个样本单元。若有的随机数相同或属于同一单元,则该单元被重复抽中 2、拉希里法(二次抽取法,Lahiri,印度) 设总体单元数为N,单元规模为Mi,记: ◎ 在1-N范围内产生一个随机数,设为j; ◎ 在1-M*范围内的随机数m 如果m=Mj,则第j个单元为被抽中的样本单元; 如果mMj,则第j个单元未被抽中。 此时需要重复上述步骤,另行抽取一组【j,m】。直到抽满

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档