- 1、本文档共62页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 分层抽样 §4.1 什么是分层抽样 一、定义 如果抽样之前能将总体分成有限个互不相交的子总体。对每个子总体独立地进行抽样。这种抽样方法称为分层抽样。 其中每个子总体称为层(stratum)。每个总体单元必属于且仅属于某一个层。 获得的样本称为分层样本,由从各层中抽出的单元组成。 二、何时要考虑分层抽样? 不仅需要了解总体目标量,也需要了解各子总体的目标量; 便于实施调查,包括:组织管理、数据汇总等方面;对不同的层可采用不同的抽样方案,比较灵活; 使样本更均匀、更具代表性,因为每层都有单元被抽中,相对SRS来说,避免了出现极端样本的可能性; 若分层恰当,由同样的样本容量可获得比SRS更高的精度。 三、应注意的一些技术问题 如何分层?分成多少层? 根据方便实施的原则。可按现成的类型、行政区划、行业等等标准分层。 根据所需信息的要求分层。 根据有利于提高精度的原则分层。 理论上,分层抽样事先必须明确: 各层是如何分割的,每层的单元数有多少? 总的样本容量是多少? 各层分配到的样本容量是多少? 四、记号 §4.2 估计量及其性质 一、一般的分层抽样 二、分层随机抽样 对每一层都进行SRS的分层抽样称为分层随机抽样,是最常用、最简单的一种分层抽样方法。 二、分层随机抽样 二、分层随机抽样 二、分层随机抽样 二、分层随机抽样 例4.1某市进行家庭收入调查,分为城镇居民及农村居民两部分抽样,在全部城镇23560户中抽取300户,在全部农村148420户中抽取250户(SRS抽样),调查结果是城镇年平均收入为15180元,标准差为2972元,农村年平均收入为9856元,标准差为2546元,求全市年平均收入估计及其90%的置信区间。 P78/例4.2 解: 例4.3 对同一个总体(1930年美国的64个城市),若采用三种不同的抽样方式,抽取相同数量的样本单元(24个城市),比较总人口数 Y 的估计量的精度。 SRS 分层随机抽样,样本容量按层权比例分配(n1=6, n2=18) 分层随机抽样,两层样本容量相等 (n1=n2=12) 问题: 从本例来看,分层随机抽样的精度高于SRS,这是否必然? 同样的分层方式、总样本量也同样,但样本容量在各层的分配方式不同,会导致估计量的精度不同。 §4.3 各层样本容量的分配 分层抽样的方案涉及多个方面: 如何分层? 在分层方式确定之后, 各层分别用什么方式抽样? 总的样本容量取多少? 样本容量在各层中如何分配? 本节在假定 (1)-(3)三个方面都已确定的前提下,针对分层随机抽样,讨论(4)样本容量的分配问题。 从例4.3可知,样本容量的分配方式对估计量的精度有影响。之外,样本容量的分配还影响调查费用、数据处理等方面。 常见的分配方式: 随意配置 比例配置(proportional allocation) 最优配置(optimal allocation) 一、比例配置 一、比例配置 一、比例配置 一、比例配置 二、最优配置 通常抽样方案的设计需要同时兼顾估计精度与费用两个方面。 从前面的讨论我们知道,样本容量的配置对估计精度有影响,而且,在总样本量固定时,理论上我们可以找到使估计精度最高的配置方式。 同时,由于各层每个单元的平均调查费用常常不同,因而样本容量的配置还对费用有影响。 这里,我们讨论的最优配置问题,指的是寻求: 费用给定时,使估计量精度最高的配置 或给定估计量精度要求时,使费用最省的配置。 二、最优配置 分层随机抽样常用的费用函数: 直观解释 对 层权大 方差大 费用低 的层分配较多的样本单元。 二、最优配置 证明: 二、最优配置 二、最优配置 注: 二、最优配置 二、最优配置 §4.4 总样本量的确定 总的原则: 根据估计量的精度要求、或者费用要求来定。 这里仅讨论分层随机抽样的情况。 两种情况: 对各层分别提要求,按SRS方法确定各层的样本容量; 对总体目标量的估计精度提要求,或对总费用提要求。 一、准备工作 总样本量 n 的确定涉及下列信息: 二、给定估计量的最大方差,求 n 二、给定估计量的最大方差,求 n 二、给定估计量的最大方差,求 n 二、给定估计量的最大方差,求 n 三、给定总费用,求 n 例4.1 解: §4.5 分层随机抽样效果分析 在总样本量 n 固定的前提下,比较总体均值估计量的方差大小。 一、分层随机抽样与SRS的比较 一、分层随机抽样与SRS的比较 一、分层随机抽样与SRS的比较 分层原则: 层间差异大,层内差异小。 二、Neyman 配置与比例配置 三、偏离Neyman 配置时对精度的影响 三、偏离Neyman 配置时对精度的影响 三、偏离Neyman 配置时对精度的影
您可能关注的文档
最近下载
- 第1部分 专题05:记叙文阅读之环境描写(练习)-中考语文复习 现代文阅读(全国版)(含答案及解析版).docx
- 人教版2019年初中物理 电能、电路、电功综合专题练习(含答案).doc
- 超星学习通 乡村振兴的实践探索(北京大学)章节测验答案尔雅网课答案.pdf VIP
- 2024年6月第英语六级真题(全3套)及答案解析.pdf
- (完整版)数量关系公式.pdf
- 山东省政府采购专家测评题库800-1000.docx VIP
- 新课标人教版高中英语教材词汇表 1-8册(1).doc
- GB/T 5686.7-2022锰铁、锰硅合金、氮化锰铁和金属锰 硫含量的测定 红外线吸收法和燃烧中和滴定法.pdf
- 河北省石家庄市2024年中考一模语文试卷(含答案).pdf VIP
- 全国卷书面表达说题比赛课件.pptx
文档评论(0)