网站大量收购独家精品文档,联系QQ:2885784924

【选修】8.3.1分类变量与列联表(第二版).pptx

【选修】8.3.1分类变量与列联表(第二版).pptx

  1. 1、本文档共16页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【选择性必修第三册】8.3.1 分类变量与列联表湛江市第五中学 钟景荣学习目标1.通过实例, 理解2×2列联表的统计意义.2.通过实例, 了解2×2列联表与独立性检验及其应用.重点: 理解独立性检验的基本思想及实施步骤.难点:χ2的含义、独立性检验及其应用.核心素养:数学分析、数学运算、数学推理.分类变量—在一定范围内具有两种现象或性质的随机变量叫做分类变量. 分类变量的取值可以用实数表示, 例如, 学生所在的班级可以用A, B等表示, 性别分男性、女性, 可以用1, 0表示, 等等. 在很多时候, 这些数值只作为编号使用, 并没有通常的大小和运算意义.一、分类变量的关联性1. 应用比率判断关联性 如何利用统计数据判断一对分类变量之间是否具有关联性呢? 对于这样的统计问题, 有时可以利用普查数据, 通过比较相关的比率给出问题的准确回答, 但大多数情况下, 需要借助概率的观点和方法. 问题 为了有针对性地提高学生体育锻炼的积极性, 某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响, 为此对学生是否经常锻炼的情况进行了普查. 全校学生的普查数据如下:523名女生中有331名经常锻炼; 601名男生中有473名经常锻炼. 你能利用这些数据, 说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗? 用比较经常锻炼的学生在女生和男生中的比率来回答. 经常锻炼的女生数f0=女生总数经常锻炼的男生数f1=男生总数由f1-f0=0.787-0.633=0.154. 可知, 男生经常锻炼的比率比女生高出15.4个百分点, 所以该校的女生和男生在体育锻炼的经常性方面有差异, 且男生更经常锻炼.2. 应用条件概率判断关联性 上面的问题还可以通过建立一个古典概型, 使用条件概率的语言, 给出另外一种解答方法. 用Ω表示该校全体学生构成的集合, 这是我们所关心的对象的总体. 考虑以Ω为样本空间的古典概型, 并定义一对分类变量X和Y如下:对于Ω中的每一名学生, 分别令0, 该生为女生, 0, 该生不经常锻炼, X=Y=1, 该生为男生, 1, 该生经常锻炼. 比较条件概率P(Y=1|X=0)和P(Y=1|X=1)的大小.在X=0的条件下Y=1的概率在X=1的条件下Y=1的概率 “性别对体育锻炼的经常性没有影响”可描述为:P(Y=1|X=0)=P(Y=1|X=1);“性别对体育锻炼的经常性有影响”可描述为:P(Y=1|X=0)≠P(Y=1|X=1).为了清楚起见, 我们用表格整理数据, 如表8.3-1所示. 表8.3-1 用{X=0, Y=1}表示事件{X=0}和{Y=1}的积事件, 用{X=1, Y=1}表示事件{X=1}和{Y=1}性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计3208041124的积事件. 根据古典概型和条件概率的计算公式, 有 因为P(Y=1|X=1)P(Y=1|X=0), 所以性别对体育锻炼的经常性有影响, 即该校男生和女生在体育锻炼的经常性方面存在差异, 且男生更经常锻炼. 二、2×2列联表 将两个分类汇总统计, 并做成表格加以保存的数据统计表称为2×2列联表. 每个分类变量只取两个值.性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计3208041124表8.3-1 2×2列联表给出了成对分类变量数据的交叉分类频数. 以表8.3-1为例, 它包含了X和Y的如下信息:事件{Y=0}和{Y=1}中样本点的个数; 事件{X=0}和{X=1}中样本点的个数;表格的核心部分, 给出了事件{X=x, Y=y}(x, y=0, 1)中样本点的个数;样本空间中样本点的总数.三、统计案例常用方法 在上面问题的两种解答中, 使用了学校全部学生的调查数据, 利用这些数据能够完全确定解答问题所需的比率和条件概率. 然而, 对于大多数实际问题, 不可能获得所关心的全部对象的数据, 因此无法准确地计算出有关的比率和条件概率. 在这种情况下, 上述古典概型和条件概率的观点为我们提供了一个解决问题的思路. 有限性、等可能性 将所关心的对象的全体看成古典概型的样本空间, 就可以用概率的语言刻画相关的问题, 进而用频率稳定于概率的原理推断问题的答案. 很多统计方法都是基于这种思想建立起来的. 比较简单的做法是利用随机抽样获得一定数量的样本数据, 再利用随机事件发生的频率稳定于概率的原理对问题答案作出推断.例1 为比较甲、乙两所学校的学生的数学水平, 采用简单随机抽样的方法抽取88名学生. 通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀; 乙校45名学生中有7名数学成绩优秀. 试分析两校学生中数学成绩优秀率之间是否存

文档评论(0)

akhzjr + 关注
实名认证
内容提供者

中学数学高级教师,曾多年担任数学科组长,熟悉整个高中数学教学内容。

1亿VIP精品文档

相关文档