- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
样本及抽样分布-概率论与数理统计
第五章 样本及抽样分布
内容
提要 本章主要讲述样本,总体,参数与参数空间;直方图与经验分布函数;统计量,分布,分布和分布;分位数;正态总体的抽样分布等内容. 重点
分析 理解总体、个体、样本和统计量的概念。
了解直方图的作法。
掌握样本均值、样本方差的计算。
了解分布、分布、分布的定义,并会查表计算。
了解分位数的概念,并会查表计算。
了解正态总体的某些常用统计量的分布。 难点
分析 统计量、分位数的概念
分布、分布、分布的定义与性质。
正态总体的抽样分布。
教 学 内 容 ( Contents )
第五章 样本及抽样分布
(Chapter Five Sample and Sample distribution)
5.1 样本和总体(Sample and Collectivity)
1. 样本(Sample)
数理统计的研究对象是受随机性影响的数据,这些通过观察或试验得到的数据称为样本或子样(Sample),这些观察或试验过程称为抽样(Sample)。
例如用同一架天平称某重物次,得到一组个数据
(5.1)
就称它们是一个样本,其中称为样本容量。每个容量为的样本都可称为维空间的一个点,样本所有可能的取值构成了维空间的一个子集,称为样本空间(Sample space),记作。
注意“数据”一词在这里是广义的。它可以是实数值,例如表示称得某重物的重量;也可以是事物的属性,例如=“正品”,(或“废品”)等等,通常为了方便研究,也常将这些属性数量化,例如用“1”表示“废品”,“0”表示“正品”,当然这不是本质的问题。
有时数据也可以是一组向量,例如武器试验中给出一组弹着点的坐标
即为二维向量的一组样本,在多元统计分析中,将专门研究这种情形。
对于样本需要强调两点:
1) 样本并非一堆杂乱无章无规律可循的数据,它是受随机性影响的一组数据,因此,用概率论的话说,就是每个样本既可以视为一组数据,又可视为一组随机变量,这就是所谓样本的二重性。
当通过一次具体的试验,得到一组观测值,这时样本表现为一组数据;但这组数据的出现并非是必然的,它只能以一定的概率(或概率密度)出现,这就是说,当考察一个统计方法是否具有某种普遍意义下的效果时,又需要将其样本视为随机变量,而一次具体试验得到的数据,则可视为随机变量的一个实现值。今后为行文方便,我们常交替使用上述两种观点来看待样本,而不去每次声明此处样本是指随机变量还是其实现值,同时一律采用记号(5.1)来表示它。
2) 样本(5.1)也不是任意一组随机变量,我们要求它是一组独立同分布的随机变量。同分布就是要求样本具有代表性,独立是要求样本中各数据的出现互不影响,就是说,抽取样本时应该是在相同条件下独立重复地进行。
Example 5.1 设一组抽奖券共10000张,其中有5张有奖。问连续抽取3张均有奖的概率为多少?
为了讨论这个问题,不妨设
要求该事件的概率,实际上即是求联合概率分布
在处的值。但题中没有说明“连续抽取”是“有放回的”还是“无放回的”,我们不妨都计算一下:
(i) 无放回时:
(ii) 有放回时:
显然(i)中的抽样方式不是独立的,每次抽样的结果都将影响下一次抽样的分布,这种抽样不是我们通常研究的抽样。而(ii)中的抽样,则是多次独立的抽样,它们是同分布的,即我们通常称为的随机抽样(Random sample)。这样得到的数据,即是我们常研究的简单随机样本(Simple random sample),或就直接称为样本。由此可以看出,对于样本(5.1),如果每个的共同分布为,则样本(5.1)的分布为
(5.2)
相应地,若有共同概率密度,则(5.1)的概率密度为
(5.3)
2. 总体(Collectivity)
总体(Collectivity)或母体在许多教科书上通常被定义为研究对象全体的集合。其含义是,我们观察到的样本总是由某个具体事物产生,并反映该事物的特征,这时,可以把样本视为一些被抽取的该事物的个体,而将该事物本身视为所有个体的集合即总体。
但这样说多少有点模糊。如在例5.1中,我们自然可以将10000张抽奖券视为总体,但如果是用一架天平去重复称同一重物,得到重物的重量,在这种事中,什么是研究对象的全体呢?因此,我们宁愿采用另一种说法,即总体是一个随机变量,它的分布即为(5.1)中每个的共同分布,或者可以看作样本容量时的样本的分布。用这个观点叙述一些问题就显得很方便,例如样本(5.1)就可视为由总体独立“拷贝”出来的同分布的
文档评论(0)