- 1、本文档共17页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三讲 统计与统计案例
知识要点:
三种抽样方法:
(1)简单随机抽样:设一个总体的个体数为N.如果通过逐个抽取的方法从中抽取一个容量为n的样本,且每次抽取时各个个体被抽到的概率都相等,就称这样的抽样为简单随机抽样。每个个体被抽到的概率都等于
(2)系统抽样:当总体的个数较多时,采用简单随机抽样显得较为费事。这时可将总分成均衡的几个部分,然后按照预先定出的规则从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。
注:有时要剔除部分个体。
(3)分层抽样:当总体由明显差异的几部分组成时,为了使样本更充分反映总体的情况,常将总体分成几部分,按照各部分所占的比例抽样,这种抽样叫做分层抽样。
(4)三种抽样方法的比较:
类别
共同点
各自特点
相互联系
适用范围
简单
随机
抽样
抽样过程
中每个个
体被抽到
的概率都
相等
从总体中
逐个抽取
总体的个体数
较少
系统
抽样
将总分成均衡的几个部分,按事先确定的规则在各部分抽取
在起始部分抽样时采用简单随机抽样
总体中的个体数较多
分层
抽样
将总体分成几层,分层进行抽取
分层抽样时采用简单随机抽样或系统抽样
总体由明显差异的几部分组成
2.用样本估计总体
用样本估计总体是研究统计问题的一个基本思想方法,而对于总体分布,总是用样本的频率分布去估计。
作频率分布直方图的步骤
(i)求极差 (ii)决定组距与组数 (iii)将数据分组 (iv)列频率分布表 (v)画频率分布直方图
频率分布折线图和总体密度曲线
标准差和方差():样本
样本平均数
样本标准差
样本方差
茎叶图刻画数据有两个优点:
所有数据信息都可以从图中看到;
茎叶图便于记录和表示,能够展示数据的分布情况。
3.变量间的相互关系:
相关关系:自变量取值一定时,因变量的取值带有一定的随机性的两个变量之间的关系叫做相关关系。
散点图:表示具有相关关系的两个变量的一组数据的图形,叫做散点图.
(1)两个变量的线性相关 (i)正相关 (ii)负相关 (iii)线性相关关系、回归直线
(2) 最小二乘法:求回归直线使样本数据的点到回归直线的距离的平方和最小的方法。
(2)线性回归方程: 散点图近视的为一条直线 ,这条直线叫做回归直线。
4.统计案例
(1)回归分析:对具有相关关系的两个变量进行统计分析的方法叫做回归分析。
(i)回归直线:一组具有线性相关关系的数据其回归直线的方程为
其中
(ii)相关系数
,越大相关性越好;越小相关性越差。
(iii)刻画回归效果:
的值越大,线性模拟的效果越好。
典型例题
1.某校高三年级有男生500人,女生400人,为了解该年级学生的健康情况,从男生中任意抽取25人,从女生中任意抽取20人进行调查.这种抽样方法是
(A)简单随机抽样法 (B)抽签法 (C)随机数表法 (D)分层抽样法
2.(10重庆)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为 (A)7 (B)15 (C)25 (D)35
3.(10四川)一个单位有职工800人,期中具有高级职称的160人,具有中级职称的320人,具有初级职称的200人,其余人员120人.为了解职工收入情况,决定采用分层抽样的方法,从中抽取容量为40的样本.则从上述各层中依次抽取的人数分别是
(A)12,24,15,9 (B)9,12,12,7 (C)8,15,12,5 (D)8,16,10,6
4.(10福建)若某校高一年级8个班参加合唱比赛的得分如茎叶图所示,则这组数据的中位数和平均数分别是
A.91.5和91.5 B.91.5和92
C.91和91.5 D.92和92
5.(10山东)在某项体育比赛中,七位裁判为一选手打出的分数如下:
90 89 90 95 93 94 93
去掉一个最高分和一个最低分后,所剩数据的平均值和方差分别为
(A)92 , 2 (B) 92 , 2.8 (C) 93 , 2 (D) 93 , 2.8
6.(10陕西)如图,样本A和B分别取自两个不同的总体,它们的样本平均数分别为,样本标准差分别为sA和sB,则 [B]
(A) >,sA>sB (B) <,sA>sB (C) >,sA<sB (D) <,sA<sB
7.(10湖南) 某商品销售量y(件)与销售价格x(元/件
文档评论(0)