网站大量收购闲置独家精品文档,联系QQ:2885784924

专题05 概率与统计(思维导图+知识串讲+12题型+过关检测)(解析版).docx

专题05 概率与统计(思维导图+知识串讲+12题型+过关检测)(解析版).docx

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

专题05概率与统计

知识点1:简单随机抽样

1、简单随机抽样

(1)放回简单随机抽样:一般地,设一个总体含有N(N为正整数)个个体,从中逐个抽取n(1≤n

(2)不放回简单随机抽样:如果抽取是不放回的,且每次抽取时总体内未进入样本的各个个体被抽到的概率都相等,我们把这样的抽样方法叫做不放回简单随机抽样.

2、抽签法

(1)定义:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个样本容量为n的样本.

(2)抽签法的操作步骤:

第一步,编号:将N个个体编号(号码可以从1到N,也可以使用已有的号码).

第二步,写签:将N个号码写到大小、形状相同的号签上.

第三步,抽签:将号签搅拌均匀,每次从中抽取一个号签,连续不放回地抽取n次,并记录其编号.

第四部,定样:从总体中找出与号签上的号码对应的个体,组成样本.

3、随机数法

(1)定义:利用随机试验或信息技术(即计算器、电子表格软件和R统计软件)生成的随机数进行抽样.

(2)随机数表法步骤:

=1\*GB3①把总体中的每个个体编号.

=2\*GB3②用随机数工具产生编号范围内的整数随机数.

=3\*GB3③把产生的随机数作为抽中的编号,使与编号对应的个体进入样本。重复上述过程,知道抽足样本所需要的数量.

知识点2:分层随机抽样

1、分层随机抽样的定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层.

2、比例分配:在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配.

3、分层随机抽样的步骤

(1)分层:按某种特征将总体分成若干部分(层);

(2)计算抽样比:抽样比k=

(3)定数:按抽样比确定每层抽取的个体数;

(4)抽样:每层分贝按简单随机抽样的方法抽取样本

(5)成样:综合各层抽样,组成样本.

4、分层随机抽样的相关计算关系:

(1)eq\f(样本容量n,总体的个数N)=eq\f(该层抽取的个体数,该层的个体数);

(2)总体中某两层的个体数之比等于样本中这两层抽取的个体数之比.

(3)样本的平均数和各层的样本平均数的关系为:eq\x\to(ω)=eq\f(m,m+n)+eq\f(n,m+n)=eq\f(M,M+N)+eq\f(N,M+N)..

知识点3:用样本估计总体

1、频率分布直方图

(1)列出样本数据的频率分布表和频率分布直方图的步骤:

①计算极差:找出数据的最大值与最小值,计算它们的差;

②决定组距与组数:当样本容量不超过100时,按照数据的多少分成5~12组,且;

③将数据分组:通常对组内数值所在区间区左闭右开区间,最后一组取闭区间;也可以将样本数据多取一位小数分组.

④列频率分布表:对落入各小组的数据累计,算出各小数的频数,除以样本容量,得到各小组的频率.

⑤绘制频率分布直方图:以数据的值为横坐标,以的值为纵坐标绘制直方图.

(2)频率分布直方图的特点:

①,

②所有小长方形的面积和等于1,

③.

2、总体百分位数的估计

(1)第p百分位数的定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.

(2)计算一组n个数据的第p百分位数的步骤

第1步,按从小到大排列原始数据.

第2步,计算i=n×p%.

第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;

若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.

3、总体集中趋势的估计

(1)众数:在样本数据中,出现次数最多的那个数据;

(2)中位数:将样本数据按大小顺序排列,若数据的个数为奇数,则最中间的数据为中位数,

若样本数据个数为偶数,则取中间两个数据的平均数作为中位数.

(3)平均数:设样本的数据为,则样本的算术平均数为;

4、总体离散程度的估计

用样本的标准差估计总体的标准差

(1)数据的离散程度可以用极差、方差或标准差来描述;

(2)极差(又叫全距)是一组数据的最大值和最小值之差,反映一组数据的变动幅度;

(3)样本方差描述了一组数据围绕平均数波动的大小;

一般地,设样本的数据为,样本的平均数为,

定义样本方差为;

简化公式:

(方差等于原数据平方的平均数减去平均数的平方)

(4)样本的标准差是方差的算术平方根.

样本标准差.

标准差越大数据离散程度越大,数据越分散;标准差越小,数据集中在平均数周围.

知识点4:随机事件与概率

1、有限样本空间与随机事件

(1)

您可能关注的文档

文档评论(0)

182****0427 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档