- 1、本文档共51页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
抽样调查课件2.ppt
本章主要内容 2.1 概述 2.2 简单估计量及其性质 2.3 比率估计量及其性质 2.4 回归估计量及其性质 2.5 简单随机抽样的实施 放回简单随机抽样(SRS with replacement) 放回简单随机抽样在每次抽取样本单元时,都将前一次抽取的样本单元放回总体,因此,总体的结构不变,抽样是相互独立进行的,这一点是它与不放回简单随机抽样的主要不同之处。 放回简单随机抽样的样本量不受总体大小的限制,可以是任意的。 【例2.1】 设总体有5个单元(1、2、3、4、5),按放回简单随机抽样的方式抽取2个单元,则所有可能的样本为25个(考虑样本单元的顺序): 不放回简单随机抽样(SRS without replacement) 当从总体N个抽样单元中依次抽取n个抽样单元时,每个被抽中的单元不再放回总体,而是从总体剩下的单元中进行抽样。 不放回简单随机抽样的样本量要受总体大小的限制。 在实际工作中,更多的采用不放回简单随机抽样。 【例2.2】 设总体有5个单元(1、2、3、4、5),按不放回(无序)简单随机抽样的方式抽取2个单元,则所有可能的样本为10个: 简单随机抽样的缺点: N 很大时难以获得抽样框 样本分散不易实施,调查费用高 总体内部个体之间变量值差异悬殊时误差会增大 简单随机抽样的适用场合: N 不很大的均匀总体 很少单独使用,一般结合其他方法使用 没有其他信息时使用 多变量复杂数据分析 简单随机抽样的抽取原则: (1)按随机原则取样,排除任何主观因素的影响,防止出现系统误差; (2)每个抽样单元被抽中的概率都是已知的或事先确定的; (3)每个抽样单元被抽中的概率都是相等的,即简单随机抽样属于等概率抽样。 定义2.3 从总体的 N 个单元中抽取 n 个单元的所有可能不同的组合构造所有可能的 个样本,从 2.1.4 简单随机抽样中的符号 大写符号表示总体的有关变量 用小写符号表示样本的有关变量 总体指标值上面带符号“^”的表示由样本得到的总体指标的估计。 估计量的方差用大写的V表示, 对 的样本估计,不用 而用 表示。 2.2.1 对总体均值的估计 一、简单估计及其无偏性 在没有其它信息的条件下,对总体均值的简单估计为: 说明: 在不考虑1-f 的情况下,估计量的方差与样本容量n成反比; 当其他条件不变时,估计量的方差与总体未入样率(1-f)成正比。 样本均值的方差与总体方差成正比。 三、估计量的方差估计 【例2.3】 某学院有100名学生,我们从中随机抽出10名学生调查他们每天学习英语的时间(小时),调查资料如下表,根据对这10名学生的调查结果,在95%的置信度下估计全学院学生每天学习英语的平均时间。 因此,可以以95%的概率保证程度估计全学院100名学生平均每天学习英语的时间: 思考题 为调查某地区1960个村新棉收购情况,以简单不重复抽样方式随机抽取49个村进行调查,求得样本均值为7000公斤,样本方差为180公斤。试以99.73%的可靠程度估计该地区平均每村收购棉花多少公斤? 1、成数 2、总体比例(是非标志的均值) 【例2.5】 某超市新开张一段时间之后,为改进销售服务环境,欲调查附近几个小区居民到该超市购物的满意度,该超市与附近几个小区的居委会取得联系,在总体中按简单随机抽样抽取了一个大小为=200人的样本,调查发现对该超市购物环境表示满意或基本满意的居民有130位,要估计对该超市购物环境持肯定态度居民的比例,并在置信度95%下,给出估计的置信区间。假定这时的抽样比可以忽略。 在95%的置信度下,对该超市购物环境持肯定态度居民的比例在 58.38%~71.62% 之间。 例:从5620个中学中抽出一个含有300个学校的简单随机样本,其中有187个学校赞成一项提案,试以95%的置信度估计赞成该提案的比例及总的学校数。 总量估计的置信区间: 因此,可以以95%的概率保证程度估计350个乡的平均粮食产量为: 解: 即:以95%的概率保证程度,估计全学院100名学生平均每天学习英语的时间在2.43~7.57小时之间。 当置信度为95%时,对应的概率度 已知: 解: 当置信度为99.73%时,对应的概率度 以99.73%的可靠程度估计该地区平均每村收购棉花在6994.33~7005.67公斤之间。 2.2.2 对总体比例的估计 一、对总体的描述 总体按所研究标志不同 变量总体 (研究数量标志) 属性总体 (研究品质标志) 在属性总体中,当所研究的标志,其表现只有两种属性,即“是”或“非”
文档评论(0)