- 1、本文档共5页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第三节 统计
一、基本知识概要:
1.三种常用抽样方法:
(1)简单随机抽样:设一个总体的个数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。
简单随机抽样的常用方法:①抽签法,②随机数表法
用随机数表进行抽样的步骤:①将总体中的个体编号;②选定开始号码;③获取样本号码。
(2)系统抽样(也称为机械抽样):当总体的个数较多时,采用简单随机抽样较为费事。这时可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。
系统抽样的步骤:①采用随机的方式将总体中的个体编号;②整个的编号分段(即分成几个部分),要确定分段的间隔k。当N/n(N为总体中的个体的个数,n为样本容量)是整数时,k=N/n;当N/n不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N‘能被n整除,这时k=N′/n;③在第一段用简单随机抽样确定起始的个体编号1;④按照事先确定的规则抽取样本(通常是将1加上间隔k得到第2个编号1+k,第3个编号1+2k,这样继续下去,直到获取整个样本)。
(3)分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。
三种抽样方法的比较
类别
共同点
各自特点
相互联系
适用范围
简单随机抽样
抽样过程中每个个体被抽取的概率相等
从总体中逐个抽取
总体中的个数较少
系统抽样
将总体均分成几部分,按事先确定的规则分别在各部分中抽取
在起始部分抽样时采用简单随机抽样
总体中的个数较多
分层抽样
将总体分成几层,分层进行抽取
各层抽样时采用简单随机抽样或系统抽样
总体由差异明显的几部分组成
2、总体分布的估计:随着试验次数的不断增加,试验结果的频率值在相应的概率值附近摆动.当试验次数无限增大时,频率值就变成相应的概率了.此时随着样本容量无限增大其频率分布也就会排除抽样误差,精确地反映总体取的概率分布规律,通常称为总体分布.
用样本的频率分布去估计总体分布:由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体分布,一般地,样本容量越大,估计越精确.
总体分布的估计的两种方式(1)频率分布表 (2)频率分布直方图。
3、正态分布的概念及主要性质:
①正态分布的概念:如果连续型随机变量ξ的概率密度曲线为,其中为常数,并且,则称ξ服从正态分布,简记为。
②正态分布的期望与方差:若,则。
③正态分布的主要性质:Ⅰ)曲线在x轴上方,并且关于直线x=μ对称;Ⅱ)曲线在x=μ时处于最高点,由这一点向左右延伸时,曲线逐渐降低;Ⅲ)曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越:“矮胖”;反之曲线越“高瘦”。
④标准正态分布:当μ=0,σ=1时,可以写成,这时称ξ服从标准正态分布,简记为。
⑤标准正态分布的函数表:
由于标准正态分布应用十分广泛,已制成专门的标准正态函数表,供人们查阅。在标准正态分布表中,相应于每一个的函数值Φ是指总体取小于的值的概率(函数Φ实际上是正态总体N(0,1)的累积分布函数),即Φ=。φ
⑥若,则①,②
4、线性回归:
(1)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。注:与函数关系不同,相关关系是一种非确定性关系。
(2)回归分析:对具有相关关系的两个变量进行统计分析的方法。
(3)散点图:表示具有相关关系的两个变量的一组数据的图形。
(4)回归直线方程:,其中, 。相应的直线叫回归直线,对两个变量所进行的上述统计叫做回归分析。
(5)相关系数:
相关系数的性质:
(1)|r|≤1。
(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小
二、例题:
例1:某批零件共160个,其中一级品有48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样、分层抽样法抽取时总体中的每个个体被取到的概率相同.
解:(1)简单随机抽样法:可采用抽签法,将160个零件按1~160编号,相应地制做1~160号的160个签,从中随机抽20个。显然每个个体被抽到的概率为。
(2)系统抽样法:将160个零件按1~160编号,按编号顺序分成20组,每组8个。先在第一组用抽签法抽得号,则在其余组中分别抽得第号,此时每个个体被抽到的概率为。
(3)分层抽样法:按比例,分别在一级品,二级品,三级品,等外品,是抽取个,个,个,个。每个个体被抽到的概率分别为,,,,即都是。
综上所述,无论采取哪种抽样,总体和每个个体被抽到的概率都是。
说明:三种抽样方法
文档评论(0)