- 1、本文档共12页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
8.3.2独立性检验导学案
班级:姓名:
学习目标
通过实例,理解2×2列联表的统计意义.2.通过实例,了解2×2列联表独立性检验及其应用.
重点难点
重点:2×2列联表,独立性检验的思想和方法.
难点:卡方统计量的导出和意义,独立性检验的思想和方法.
课前预习自主梳理
知识点一分类变量
为了表述方便,我们经常会使用一种特殊的随机变量,以区别不同的现象或性质,这类随机变量称为分类变量.分类变量的取值可以用实数表示.
知识点二2×2列联表
1.2×2列联表给出了成对分类变量数据的交叉分类频数.
2.定义一对分类变量X和Y,我们整理数据如下表所示:
X
Y
合计
Y=0
Y=1
X=0
a
b
X=1
c
d
c+d
合计
a+c
n=
像这种形式的数据统计表称为2×2列联表.
知识点三独立性检验
1.定义:利用χ2的取值推断分类变量X和Y的方法称为χ2独立性检验,读作“卡方独立性检验”.简称独立性检验.
2.χ2=,其中n=a+b+c+d.
3.独立性检验解决实际问题的主要环节
(1)提出零假设H0:X和Y相互独立,并给出在问题中的解释.
(2)根据抽样数据整理出2×2列联表,计算χ2的值,并与临界值xα比较.
(3)根据检验规则得出推断结论.
(4)在X和Y不独立的情况下,根据需要,通过比较相应的频率,分析X和Y间的影响规律.
自主检测
1.判断正误,正确的画“√”,错误的画“×”.
分类变量中的变量与函数的变量是同一概念.()
等高堆积条形图可初步分析两分类变量是否有关系,而独立性检验中χ2取值则可通过统计表从数据上说明两分类变量的相关性的大小.()
事件A与B的独立性检验无关,即两个事件互不影响.()
χ2的大小是判断事件A与B是否相关的统计量.()
概率值α越小,临界值xα越大.()
独立性检验的思想类似于反证法.()
独立性检验的结论是有多大的把握认为两个分类变量有关系.(√)
2.某校为了研究学生的性别和对待某一活动的态度(支持与不支持)的关系,运用列联表进行独立性检验,经计算,则所得到的统计学结论是:有__________的把握认为“学生性别与支持该活动有关系”(????)
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
A. B. C. D.
3.通过随机询问110名性别不同的大学生是否爱好体育,
男
女
总计
爱好
40
20
60
不爱好
20
30
50
总计
60
50
110
得到上表:参照附表,得到的正确结论是(????)
附:由公式算得:
附表:
0.25
0.15
0.10
0.05
0.025
0.010
0.005
1.323
2.702
2.706
3.841
5.024
6.635
7.879
A.有以上的把握认为“爱好体育运动与性别有关”
B.有以上的把握认为“爱好体育运动与性别无关”
C.在犯错误的概率不超过的前提下,认为“爱好体育运动与性别有关”
D.在犯错误的概率不超过的前提下,认为“爱好体育运动与性别无关”
4.为了丰富教职工业余文化生活,某校计划在假期组织70名老师外出旅游,并给出了两种方案(方案一和方案二),每位老师均选择且只选择一种方案,其中有50%的男老师选择方案一,有75%的女老师选择方案二,且选择方案一的老师中女老师占40%,则参照附表,得到的正确结论是(????)
附:
()
0.10
0.05
0.025
2.706
3.841
5.024
,.
A.在犯错误的概率不超过2.5%的前提下,认为“选择方案与性别有关”
B.在犯错误的概率不超过2.5%的前提下,认为“选择方案与性别无关”
C.有95%以上的把握认为“选择方案与性别有关”
D.有95%以上的把握认为“选择方案与性别无关”
5.对分类变量和进行独立性检验的零假设为(????)
A.:分类变量和独立
B.:分类变量和不独立
C.:
D.:分类变量和相关联
新课导学
学习探究
环节一创设情境,引入课题
(1)旧知回顾:在上一节课,我们学习了列联表,由随机事件的稳定性,了解并作出判断两个分类变量是否有关联,请同学们思考:用频率推断两个分类变量是否独立有什么缺点?
前面我们通过列联表整理成对分类变量的样本观测数据,并根据随机事件频率的稳定性推断两个分类变量之间是否有关联.
(2)问题激发:有没有更合理的推断方法,同时也希望对出现的错误推断的概率一定的控制或估算?由概率知识分析,如果两个事件的独立,它们的充要条件是什么?
我们需要更好的方法弥补因频率的随机性带来判断两个分类变量的不可靠性,
文档评论(0)