网站大量收购闲置独家精品文档,联系QQ:2885784924

《3.抽样估计与样本量确定.ppt

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
《3.抽样估计与样本量确定

开篇案例 “百脑汇”调研中的样本计划问题 “百脑汇”在中国华北几个省市经营连锁电脑超市,它希望获得更多关于其现有客户特点方面的信息。接受调研委托的李文博士指派班上的王洪同学为样本计划小组的负责人。 通过与“百脑汇”的市场部经理乔兰的初次会谈,王洪了解到调研的一个主要目的是分别按人口和心理因素来估计“百脑汇”的客户构成和比例。此外,确认总体估计值不超过实际值的±5.0%,可靠度为95%。 为了达到这些要求,王洪和他的小组正努力寻找计算所需样本容量的方法。 10.1 引言 估计就是根据从样本中收集的信息对总体未知量进行推断的过程。 抽样估计涉及的重要问题: 一个样本单元的设计权数问题。 抽样估计,包括总体总量、均值和比例以及抽样误差的估计。 样本量的确定构成抽样设计程序的重要步骤和内容。同时,样本量的确定与样本估计值的精度密不可分。 10.2 加权及权数调整 设计权数 设计权数是指每个样本单元所代表的调查总体的单元数,它是由抽样设计所决定的,通常以wd表示。确定设计权数是估计的第一步。 加权估计 设计权数其实就是样本单元的入样概率的倒数。假如入样概率是1/10,那么每个入选样本代表总体中的10个单元,此时设计权数即为10。 不同样本单元的设计权数可能不同,这取决于抽样设计。因此,加权估计应区分等概率抽样的加权和不等概率抽样的加权。 等概率抽样的加权 当每个单元都有相同的入样概率时,所有样本单元的设计权数都相同,这种抽样就是自加权设计。 SRS抽样和SYS抽样都属于自加权设计,比例分层抽样也是自加权设计。 另外, PPS等也可以设计为一个自加权抽样。 对于自加权抽样设计,如果无需对权数调整,则在计算比例、均值等估计量时可将其忽略,对总值估计也仅需将样本总值乘上某个倍数。(例P215) 不等概率抽样的加权 自加权设计并不总是可行的。如,在使用分层抽样进行一个全国调查时,可能需要采用纽曼分层。 当所采用的抽样设计不是等概率时,正确地使用设计权数就显得尤为重要。 [例10.2] 有关各层总体数和样本数资料见表10-1。对于这项调查,被调查者的设计权数是多少呢? 设计权数的调整 上述等概率抽样的加权和不等概率抽样的加权都是加权的基本形式。 权数估计常会遇到更真实和复杂的情况: 考虑无回答的情况,然后对权数做出调整; 考虑来自其他渠道的、更具权威性的某些辅助信息,将它们合并到权数中。 对无回答的权数调整 单元无回答是指一个样本单元几乎所有的数据都缺失。简单的处理办法是忽略它。然而,如果发现忽略单元无回答是不适当的,则应该对权数进行调整。即, 设计权数×无回答调整因子=无回答的调整权数 无回答调整因子是原样本单元的权数和与给出回答的单元的权数和的比值。对于自加权设计,该比值可用原样本的单元数与给出回答的单元数的比值来表示。 无回答权数调整应区分两种不同情况: 等概率抽样 不等概率抽样 对无回答的权数调整(SRS) [例10.3] 从一个N=100人的总体中抽取一个n=25人的简单随机样本。记回答单元的数量为nr,结果显示只有20个人提供了所需的信息。那么,此时无回答的调整权数是多少? 对无回答的权数调整(STR) [例10.4] 对于一项公共交通系统调查,总体由1100人组成,并按城乡分为两个层。分层及样本数据如表10-2所示。那么,回答者的权数是多少? 使用辅助信息调整权数 为什么要使用辅助信息来调整权数呢? 首先,使调查的估计值与已知总体总值相匹配。例如,使用必威体育精装版的人口普查数据来调整估计值,以确保这些估计值(如年龄、性别分布等)的一致性。 二是为了提高估计值的精度。将辅助信息与抽样设计相结合,将有助于提高估计的精度。 要想在调查设计阶段使用辅助信息,抽样框中的所有单元都必须具备这个辅助信息。否则,就只能在数据收集上来后,在估计阶段利用辅助信息提高估计值的精度。 使用辅助信息调整权数 [例10.5] 为得到某公司职员是否有吸烟习惯的信息,进行了一项调查。从N=780人的名录中抽出了一个n=100人的简单随机样本。 在收集有关吸烟习惯信息时,收集了每个回答者的年龄和性别情况,且100人都做出了回答,由此得到样本数据的分布如表10-3所示: 10.3 抽样分布与抽样误差 抽样调查的目的是要对总体做出推断。 了解统计推断的理论基础,首先注意区分三种不同性质的分布: 总体分布 样本分布 抽样分布 同时,特别注意总体分布与抽样分布的关系。 三种不同性质的分布 总体分布:总体各单位的观察值所形成的频数分布,总体分布通常是未知的。 样本分布:一个样本中各个观察值所形成的频数分布就叫做样本分布。当样本容量n逐渐增大时,样本分布逐渐接近总体的分布。 抽样分布:样本统计量的抽样分布,是指在重复选取容量为n的样本时,由该统计量

文档评论(0)

wendan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档