网站大量收购独家精品文档,联系QQ:2885784924

新高考数学二轮复习核心专题讲练第1讲 统计和统计案例(解析版).docVIP

新高考数学二轮复习核心专题讲练第1讲 统计和统计案例(解析版).doc

  1. 1、本文档共68页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第1讲统计和统计案例

目录

第一部分:知识强化

第二部分:重难点题型突破

突破一:随机数表法

突破二:分层抽样

突破三:频率分布直方图

突破四:平均数,众数,中位数,方差,标准差

突破五:总体百分位数

突破六:回归直线方程

突破七:相关系数

突破八:残差

突破九:非线性回归

突破十:独立性检验

第三部分:冲刺重难点特训

第一部分:知识强化

1、总体平均数与样本平均数

(1)总体平均数

一般地,总体中有个个体,它们的变量值分别为,,…,

则称为总体均值,又称总体平均数.

(2)加权平均数

如果总体的个变量值中,不同的值共有()个,不妨记为,,…,,其中出现的频数(),则总体均值还可以写成加权平均数的形式:.

(3)样本平均数

如果从总体中抽取一个容量为的样本,它们的变量值分别为,,…,

则称为样本均值,又称样本平均数.

2、分层随机抽样的步骤

①根据己经掌握的信息,将总体分成互不相交的层;

②根据总体中的个体数和样本量计算抽样比;

③确定第层应该抽取的个体数目(为第层所包含的个体数),使得各之和为;

④在各个层中,按步骤③中确定的数目在各层中随机抽取个体,合在一起得到容量为的样本.

3、绘制频率分布直方图的步骤及频率分布直方图的性质

①求极差,即一组数据中的最大值与最小值的差.

②决定组距与组数.组距与组数的确定没有固定的标准,一般数据的个数越多,所分组数越多.当样本容量不超过100时,常分成5~12组.为方便起见,一般取等长组距,并且组距应力求“取整”.

③将数据分组.

④列频率分布表.计算各小组的频率,第组的频率是eq\f(第i组频数,样本容量).

⑤画频率分布直方图.其中横轴表示分组,纵轴表示eq\f(频率,组距).eq\f(频率,组距)实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度.

4、第百分位数

(1)第百分位数的概念

一般地,一组数据的第百分位数是这样一个值,它使得这组数据中至少有的数据小于或等于这个值,且至少有的数据大于或等于这个值.

(2)计算第p百分位数的步骤

第1步,按从小到大排列原始数据.

第2步,计算.

第3步,若不是整数,而大于的比邻整数为,则第百分位数为第项数据;

若是整数,则第百分位数为第项与第项数据的平均数.

5、总体集中趋势的估计

(1)平均数

①定义:一组数据的和与这组数据的个数的商.数据,,的平均数为.

②特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时的可靠性降低.

(2)众数

①定义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这组数据的众数。

②特征:一组数据的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.

(3)中位数

①定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位数.

②特征:一组数据的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.

6、在频率分布直方图中平均数,中位数,众数的估计值

(1)平均数:在频率分布直方图中,样本平均数可以用每个小矩形底边中点的横坐标与小矩形的面积的乘积之和近似代替.

(2)中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.

(3)众数:众数是最高小矩形底边的中点所对应的数据.

7、总体离散程度的估计

(1)极差

一组数据中的最大值与最小值的差称为极差.

(2)方差与标准差

一组数据,,,,用表示这组数据的平均数,

则这组数据的方差:;

标准差:

(3)总体方差和标准差

如果总体中所有个体的变量值分别为,,总体平均数为,则称

为总体方差,为总体标准差.

(4)样本方差和标准差

如果一个样本中个体的变量值分别为,,,样本平均数为,则称

为样本方差,为样本标准差.

(5)加权方差

如果总体的个变量值中,不同的值共有()个,记为,,,其中出现的频数为(),则总体方差为.

8、相关关系的强弱

(1)样本相关系数

现实生活中的数据,由于度量对象和单位的不同等,数值会有大有小,为了去除这些因素的影响,统计学里一般用来衡量与的线性相关性强弱,我们称为变量和变量的样本相关系数.

(2)相关系数的性质

①当时,称成对样本数据正相关;当时,成对样本数据负相关;当时,成对样本数据间没有线性相关关系.

②样本相关系数的取值范围为

当越接近1时,成对样本数据的线性相关程度越强;

当越接近0时,成对样本数据的线性相

您可能关注的文档

文档评论(0)

131****2939 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档