列联表与独立性检验高二下学期数学人教A版(2019)选择性必修三.pptxVIP

列联表与独立性检验高二下学期数学人教A版(2019)选择性必修三.pptx

  1. 1、本文档共10页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

§8.3列联表与独立性检验

第八章成对数据的统计分析

学习目标

1.理解独立性检验的基本思想及其实施步骤.

2.能利用等高堆积条形图、2×2列联表探讨两个分类变量的关联.

3.了解随机变量χ2的含义及作用.

4.通过对数据的处理,提高解决实际问题的能力.

在实践中,由于保存原始数据的成本较高,人们经常按研究问题的需要,将数据分类统计,并做成2×2列联表加以保存.

问题背景:全校学生的普查数据如下:523名女生中有331名经常锻炼;601名男生中有473名经常锻炼.你能利用这些数据,说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗?

性别

锻炼

合计

不经常(Y=0)

经常(Y=1)

女生(X=0)

331

523

男生(X=1)

473

601

合计

2×2列联表

192

128

1124

320

804

列联表给出了成对分类变量数据的交叉分类频数.

性别对体育锻炼的经常性有影响:

性别对体育锻炼的经常性无影响:

频率稳定于概率

X

Y

合计

Y=0

Y=1

X=0

a

b

a+b

X=1

c

d

c+d

合计

a+c

b+d

a+b+c+d

(样本容量n)

若不相等,则推断两个分类变量有关联或存在明显差异.

若相等,则推断两个分类变量无关联或没有明显差异.

1、2×2列联表

例1在研究某种药物对“H1N1”病毒的治疗效果时,进行了动物试验,得到以下数据:对150只动物进行药物治疗,其中132只动物存活,18只动物死亡,对150只动物进行常规治疗,其中114只动物存活,36只动物死亡.请根据以上数据建立一个2×2列联表.

2×2列联表如表所示:

治疗方法

治疗效果

合计

存活

死亡

药物治疗

132

18

150

常规治疗

114

36

150

合计

246

54

300

跟踪训练1为了解对某班学生经常打篮球和性别是否有关,对该班40名学生进行了问卷调查,得到如下的2×2列联表.

性别

打篮球

合计

经常

不经常

男生

m

4

20

女生

8

20

合计

n

40

则m=_____,n=_____.

16

16

等高条形图展示可列联表数据的频率特征,依据频率稳定与概率的原理,

我们可以推断结果.

①和表格相比,等高条形图更能直观地反映出两个分类变量间是否相互影响.

②比较同色的条形图高度差,若高度差明显,则判断两个分类变量有关系或存在明显差异.

两个分类变量x,y之间关系最强的是()

吸烟与患肺病有关联

D

2、等高条形图

对于大多数实际问题,我们无法获得所关心的全部对象的数据,但可利用随机抽样获得一定数量的样本数据,再利用随机事件发生的频率稳定于概率的原理作出推断.

例1.为比较甲、乙两所学校学生的数学水平,采用简单随机抽样的方法抽取88名学生.通过测试得到了如下数据:甲校43名学生中有10名数学成绩优秀;乙校45名学生中有7名数学成绩优秀.试分析两校学生中数学成绩优秀率之间是否存在差异.

性别

锻炼

合计

不优秀(Y=0)

优秀(Y=1)

甲校(X=0)

33

10

43

乙校(X=1)

38

7

45

合计

71

17

88

甲校学生中数学成绩优秀的频率为:

乙校学生中数学成绩优秀的频率为:

依据频率稳定于概率的原理,可推断

P(Y=1|X=0)P(Y=1|X=1).

故可认为两校学生的数学成绩优秀率存在差异,

甲校学生的数学成绩优秀率比乙校学生的高.

1.等高堆积条形图和表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高堆积条形图展示列联表数据的频率特征,依据频率稳定于概率的原理,我们可以推断结果.

[例2]为考察甲、乙两种药物预防某疾病的效果,进行动物实验,分别得到如下等高堆积条形图.根据图中信息,在下列各项中,说法最佳的一项是()

A.药物乙的预防效果优于药物甲的预防效果

B.药物甲的预防效果优于药物乙的预防效果

C.药物甲、乙对该疾病均有显著的预防效果

D.药物甲、乙对该疾病均没有预防效果

思考2:你认为“两校学生的数学成绩优秀率存在差异”这一结论是否有可能是错误的?

“两校学生的数学成绩优秀率存在差异”这个结论是根据两个频率间存在差异推断出来的.但有可能在随机抽取的样本中,两个频率间确实存在差异,但两校学生的数学成绩优秀率实际上是没有差别的.

导致推断放错误的原因:

①样本容量较小,导致频率与概率的误差较大;

②样本具有随机性,因而频率有随机性,频率和概率之间存在误差;

思考3:有多大的把握推断“学校与优秀率有关”?这个推断犯错误的可能性多大?

在这种情况下,我们推断出的结论就是错误的.

接下来我们将讨论犯这种错误的概率的大小问题.

当我们要比较两组或者多组均值有没有显著性差异的时候,我们可以用方差分析。请注意,想一下什么类型的数据可以求均值、方差呢?这就

您可能关注的文档

文档评论(0)

逐梦高考 + 关注
实名认证
服务提供商

教师资格证持证人

我是一名长期耕耘在湖南湘西地区基层高中的教师,已带过5届高三毕业班,多年的高中班主任,备课组组长,我想把我们自己制作的教学课件和高考研习心得收获分享给大家,为大家提供高考相关资料和高中各学科的自制教学课件,助力更多的孩子们一起成长!

领域认证该用户于2023年04月10日上传了教师资格证

1亿VIP精品文档

相关文档