- 1、本文档共19页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中南大学研究生应用统计课件.
数理统计的基本概念与抽样分布
§1.1 引言
什么是数理统计学?它的研究内容有哪些?这是每位初学者所关心的问题。
我们先看一个这样的例子:
某钢筋厂每天可以生产某型号钢筋10000根,钢筋厂每天需要对生产过程进行控制,对产品的质量进行检验。如果把钢筋的强度作为钢筋质量的重有指标,于是质量管理人员需要做如下方面的工作
第一,对生产出来的钢筋的强度进行检测,获得必要的数据。这里有两种获得数据的方法,⑴ 对10000根钢筋的强度均进行检测,可得到10000个强度数据,这种检测方式称为全面试验,全面地进行试验一般是不可取的,它费时、费力、甚至于不可能。 ⑵从10000根钢筋中抽取一部分钢筋进行检测,得到部分强度数据。这里抽取部分钢筋进行检测的方式称为抽样。抽取的方式也有很多种方法,它是数理统计的一个重要内容,形成了试验设计与抽样理论。
第二,对通过抽样获取的部分数据进行整理、分析并推断出这10000根钢筋的质量是否合乎要求。由于抽取的数据不全面,并且检测过程中每个数据还有测量误差(我们称为随机误差)。含有随机误差的数据会给我们带来一定影响,并且难以获得准确的结论。概率论就是解决这些问题主要数学工具。为解决这些问题所发展起来的理论和方法就构成了数理统计的内容。一般说来,数理统计是以概率论为主要的数学工具,研究如何有效地收集、整理和分析受随机影响的数据,并对所考虑的问题作出推断和预测,为决策和行动提供依据和建议的一门数学学科。
数理统计方法的应用十分广泛,几乎在人类活动的一切领域都能不同程度地找到它的应用。英国著名的统计学家费歇(R.A.Fisher)和皮尔逊(K.Pearson)是数理统计的奠基人,在20世纪初从事大量的数理统计方法的研究,就是出于在生物学、数量遗传学、优生学和农业科学的需要。
数理统计的内容十分丰富,一般可分为两大类:一类是抽样理论与试验设计;另一类是统计推断,其中包括估计理与假设检验等。回归分析、方差分析、Bayes分析,聚类分析,主成分分析等是数理统计的应用分支。
§1.2 总体、个体、样本
1.21 总体与个体
我们把所研究对象的全体称为总体或母体。组成总体的每个单元称为个体。例如:在研究某批灯泡的质量时,该批灯泡的全体就是问题的总体,而其中每个灯泡就是个体。又如:在研究某校男大学生的身高与体重的分布时,该校的每个男大学生就是一个个体,所有这些个体就构成了问题的总体。
在实际问题中,我们关心的常常是总体的某项或几项数量指标X(可以是向量)。例如,在研究灯泡的质量时,我们关心的是灯泡的使用寿命X,而不是它的外观。在研究某校男大学生的身高与体重时,我们关心的是它们的身高和体重,而不是其它特征。而数量指标X对不同的个体,其指标值是不同的,因而X可看作一个随机变量。(或随机向量),X的概率分布就完全描述了总体中指标X的取值情况。称X的概率分布为总体分布,称X的数字特征称为总体的数字特征。当X为离散型随机变量时称总体为离散总体;当X为连续型随机变量时,称总体为连续总体。当总体分布为正态分布时,称总体为正态总体,当总体分布为指数分布时,称总体为指数分布总体等。对总体进行研究就是对总体的分布或对总体的数字特征进行研究。
样本
从总体中抽取的一部分个体称为样本或者子样,其中所含个体的个数称为样本容量。从总体中抽取样本的过程称为抽样。样本和总体一样也是考虑其数量指标,如果记为样本中第个个体的数量指标,则表示样本容量为n的样本,它可以看作是对总体X作n次观测的结果,它的值随着从总体中抽取的对象的不同而不同。因此,它是随机变量,然而,一旦确定抽取对象后,我们就得到一组具体的数值,它可以看作是随机变量的一组观测值,有时也称为样本。因此,从某种意义上来说,样本具有二重性:随机性和确定性。注意样本的这种二重性非常重要。对理论工作者而言,他更多注意的是它的随机性,他所得到的统计方法应有一定的普遍性,不单纯针对某些具体样本观测值。而对应用工作者而言,他们虽然习惯把样本看成具体数字,但仍不能忘记样本的随机性,要不然对那些杂乱无章的数据无法进行统计处理。
数理统计的实质就是利用样本的信息去研究总体,去研究总体的某种性能。样本的“好”与“不好”对推断总体影响很大。怎样才是“好”的样本?
定义1.1 设总体X的样本满足
⑴ 独立性:每次观测结果既不影响其它结果,也不受其它结果的影响;即相互独立;
⑵ 代表性:中每一个个体都与总体X有相同分布。
则称此样本为简单随机样本。
例如,在N根钢筋中抽取n根钢筋进行检测,如果进行有放回抽样即每次随机地从N根钢筋中抽取一根钢筋,检测后放回并混匀,然后再从中抽取。这样得到的样本就是简单随机样本。如果采取无放回抽样即每次抽取一根钢筋,检测后
文档评论(0)