- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章
随机抽样和抽样分布
在前两章的讨论中,我们知道了随机现象常常通过随机变量及其概率分布和数字特征来描述,然而,在实际问题中,要准确知道概率分布和数字特征,有时是很困难的。例如,我们要以药丸的崩解时间或药片的溶解速度为指标来考察某一批药品的质量。若把这批药品全部进行一下试验,其分布函数及其有关的数字特征都可求出。但是,由于测定这些指标的试验,一般是破坏性的,报废了全部药品即使求出了有关指标也无意义。还有一些检验指标,如蜜丸的重量、体积等,对它们的检验虽不是破坏性的,但要成批逐个检验,无论从人力还是物力上都会受到条件限制。事实上,人们总是通过对部分产品的试验结果作分析,推断出全部产品的情况。这就是数理统计研究的一个主要问题。
本章先讨论样本和统计量等基本概念,然后讨论常见的几种抽样分布,为进一步讨论统计推断方法打下必要的理论基础。
§3-1 随 机 抽 样
3-1.1 总体与样本
总体与样本是数理统计中两个主要概念。总体是指研究对象的全体,组成总体的每个单元称为个体。总体可以包含有限个个体,也可以包含无限多个个体。某个总体是有限的,但在个体相当多的情况下,往往把它作为无限总体来对待。在数理统计中,我们不笼统地研究所关心的对象,只考察它的某一种数值指标,例如,考察某批中成药丸的质量时,可以考察崩解时间、溶解速率、丸重等项指标。这里,如果我们只需注意药丸的重量,当然,每一丸都有一个确定的重量如:6g,6.1g,6.01g,5.9g,…。我们就把所有这些丸重数值当成丸重的总体;每个丸重值就是一个个体。这样,丸重X实际上是一个随机变量,它的取值的全体是一个总体,每一个可能取值就是它的个体。由于随机变量是用其概率分布F(x)(或密度函数)来刻画,所以若X具有分布函数F(X),则称这一总体为具有分布函数F(X)的总体。
为了研究总体,需在总体中抽取若干个个体,这就得出样本的概念。
定义1 在一个总体X中抽取n个个体X1,X2,…,Xn,这n个个体称为总体X的一个容量为n的样本。样本容量n是指样本中含有个体的数目,也称样本的大小。
由于X1,X2,…,Xn是从总体中随机抽出来的,可以看成是n个随机变量。但在一次抽取后,它们都是具体的数值,记作x1,x2,…,xn,称为样本值。由于两次各抽取n个个体的抽样,得到的两批样本值一般是不同的,因此,在不至引起混乱的情况下有时也用x1,x2,…,xn,表示n个随机变量,以此泛指一次抽取后的结果。这样,每当提到一个容量为n的样本时,常有双重含义:一是指某一次抽样的具体数值x1,x2,…,xn;有时是泛指一次抽出的可能结果,就表示n个随机变量。
3-1.2 随机抽样
抽样的目的在于对总体的统计规律进行推断,因而很自然地要研究该怎样从总体中抽取样本,使其尽可能地反映总体的特征。因此在抽样时,既要考虑抽样结果的代表性,又要考虑抽样本身的可行性,简便性。抽样方法很多,对于不同的抽样方法,使用的统计推断方法也将不同,这里主要讨论简单随机抽样。所谓简单随机抽样是指在抽取样本单位时,总体的每一个可能的样本被抽中的概率相同。
定义2 样本X1,X2,…,Xn相互独立且与总体X有相同的分布函数,这样的样本称为简单随机样本。本书主要讨论简单随机样本,以下简称样本。
由以上定义可见,简单随机样本是满足下述两点要求的样本:其一,抽样随机,总体中每个个体被抽到的机会均等。例如,在检查药品质量指标时,有意识地选优,就违反了随机性原则,所得指标必然不能反映总体的质量情况,不具代表性;其二,样本X1,X2,…,Xn具有独立性,即抽取一个个体后,总体成分不变。例如,从一小批产品中,抽样检查合格品,要求有放回地抽样,可满足独立性条件;若无放回地抽样则不满足独立性条件。对于无限总体,由于抽出的一个样品放回与否不改变总体成分,可看作不影响抽样的独立性。但实际应用中,即使总体个数N有限,只要被抽取的个体数n较小,比如不超过总体的5%,也可看作近似满足独立性条件,按无放回抽样,这样做可简化计算。
§3-2 样本的数字特征
3-2.1 统计量
数理统计的主要任务,是以样本的特性去推测总体的特性。为此,需要根据样本构造出某种函数(样本函数)作为推测的基础。如当随机变量的某些总体数字特征未知时,就需要通过样本构造相应的函数。不含任何未知参数的样本函数称为统计量,是统计推断中最常使用的工具。定义1设X1,X2,…,Xn为总体X的一个样本,g(X1,X2,…,Xn)为一个样本函数。如果g中不含有任何未知参数,则称g为一个统计量。
例
文档评论(0)