- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第四章抽样理论与参数估计
第四章 抽样理论和参数估计知识引入1970 年美国首次进行征兵抽签,组织者将19-25岁的适龄青年按年龄分组,使用编号001-366 的等重量塑料球,001代表1月1日出生者,031代表1月31日…,366代表12月31日。然后将所有塑料球放入滚筒中混合抽取号码,每组抽中号码对应生日的青年依次应征,直到人数足够为止。
之后,有记者指出此次抽签产生了严重的偏差,他们注意到,年末生的人似乎倾向于被抽到较前面的征兵顺序。其结果就是一堆 12 月份生的人去了越南战场。后来,经过统计学家的分析,发现这种“偏差”确实存在;经过分析终于找到了原因,原来代表生日的号码塑料球是一次按一整个月份装入滚筒中混合的,加上又没有均匀混合;于是1 月份的生日容易在滚筒底下,12 月份的是最后才装进去,容易在上面。
在抽样术语中,经常能够听到“随机抽样”、“随机选择”这样的表述,“随机性”原则其实保证了总体中的每个个体被抽中的概率相等,因而被认为是保证各种抽签、选择过程公平、公正的一个基本手段。上述抽样就没有保证这种随机性。
在本章中,我们还会看到,作为推断的基础,我们直接研究的样本是否“得当”对研究总体十分关键,可以通过一定的抽样设计制定科学、合理、公正的抽样方法。如上述随机性原则可以保证抽样可以使得样本和总体有相同的内部结构,也就是说有最大的可能使总体的某些特征在样本中得以再现。本章在介绍必要的抽样概念和抽样方法基础上,重点介绍抽样分布理论,并对参数估计进行简要介绍。抽样和常用抽样方法一、简单随机抽样
抽样(sampling)或取样,在整个研究过程中位于数据收集之前,恰当的抽样设计是保证样本代表性的关键环节,是利用样本对总体进行假设检验或参数估计的基础。抽样涉及到的一些基本概念在绪论中均已介绍。一个合理可行的抽样设计,一方面要求针对调查或实验研究的具体情况选择一种适宜抽样方法;另一方面应该根据调查研究所要求的精确度及经费状况确定样本容量。
一般所说的随机抽样,就是指简单随机抽样,它是最基本的抽样方法,适用范围广,最能体现随机性原则且原理简单。抽取时,总体中每个个体应独立地、等概率地被抽取。常用的实施方法有抽签法和随机数表法。
1、抽签法:是把总体中的每一个个体都编上号并做成签,充分混合后从中随机抽取一部分,这部分签所对应的个体就组成一个样本。
2、随机数表法:所谓随机数表或乱码表,是由一些任意的数毫无规律地排列而的数表。教材附表17即是一万个数字的随机数表。随机数表的用法
许多计算机软件都可以自动生成随机数字。这里介绍教材附录17中乱码表的用法:首先对总体中所有个体依次编号,接着从表中任一位置(任意行列交叉处)开始,依次往下找足你所需要的随机数(均为5位),以这些随机数为编号的个体即组成一个样本。在查找随机数时,有两点要注意,一是总体容量是几位数,就从表中随机数末尾截取相应位数(因而最多可以截取4位数,抽取9999个)。如总体容量为500,则可以看表中数据的末尾三位数,并依次往下找;二是找到的数字若超过总体的容量范围,则跳过,比如总体容量为500,要求抽取30个,则设定任意起始点往下找,找到一个数字末尾三位为678,则跳过,看到一个098,则表示编号098号被抽中,…,直到找满30个为止 。
当然这两种方法都是针对有限总体的,在实际当中的无限总体可以采用其他方法来抽样。
简单随机抽样从理论上说是最符合随机性原则,但是这种方法在实际应用时,存在着一些不足:首先,对大总体进行编号是相当困难的;其次,由于完全采用随机性,实际抽取的那一个样本可能不具备总体本应该有的一些特性。
另外,对于大总体在制签或查表时都是相当困难的。对于已有顺序编号的大总体,实际当中常常采用等距抽样简洁地实现。等距抽样也称系统抽样。顾名思义,它是按照抽样比例(样本容量与总体容量之比)确定抽样间距(抽样比例的倒数),然后从任意起点间隔抽样间距逐个获得样本中的个体。如一总体有5000个,要求抽取一个500人组成样本,即抽样比例为10%,则从任意位置开始(假设总体中所有个体均已编号,且一般地假设从10以内开始),连续抽取a、a+10、a+20、…、a+4990共500个编号个体作为样本。
?
二、分层抽样
分层抽样是事先按总体已有的某些特征,将总体分成几个不同的部分,每一部分叫一层,再分别在每一层中随机抽样。这种方法充分利用了总体的已有信息,因而是一种非常实用的抽样方法。
对于一个总体如何分层,分多少层,要视具体情况而定。一个总的原则是,各层内个体在该特征上的差异要少,而层与层之间的差异要越大越好。比如说,对大学生可以按其学校是一流大学、重点大学、一般大学来分层。对于复杂问题还可以按几个分层标准来分层。如韦克斯勒幼儿智力量表在制定常模时,就按年
文档评论(0)