- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【选择性必修第三册】8.3.1 分类变量与列联表湛江市第五中学 钟景荣学习目标1.通过实例, 理解2×2列联表的统计意义.2.通过实例, 了解2×2列联表与独立性检验及其应用.重点: 理解独立性检验的基本思想及实施步骤.难点:χ2的含义、独立性检验及其应用.核心素养:数学分析、数学运算、数学推理.分类变量—在一定范围内具有两种现象或性质的随机变量叫做分类变量. 分类变量的取值可以用实数表示, 例如, 学生所在的班级可以用A, B等表示, 性别分男性、女性, 可以用1, 0表示, 等等. 在很多时候, 这些数值只作为编号使用, 并没有通常的大小和运算意义.一、分类变量的关联性1. 应用比率判断关联性 如何利用统计数据判断一对分类变量之间是否具有关联性呢? 对于这样的统计问题, 有时可以利用普查数据, 通过比较相关的比率给出问题的准确回答, 但大多数情况下, 需要借助概率的观点和方法. 问题 为了有针对性地提高学生体育锻炼的积极性, 某中学需要了解性别因素是否对本校学生体育锻炼的经常性有影响, 为此对学生是否经常锻炼的情况进行了普查. 全校学生的普查数据如下:523名女生中有331名经常锻炼; 601名男生中有473名经常锻炼. 你能利用这些数据, 说明该校女生和男生在体育锻炼的经常性方面是否存在差异吗? 用比较经常锻炼的学生在女生和男生中的比率来回答. 经常锻炼的女生数f0=女生总数经常锻炼的男生数f1=男生总数由f1-f0=0.787-0.633=0.154. 可知, 男生经常锻炼的比率比女生高出15.4个百分点, 所以该校的女生和男生在体育锻炼的经常性方面有差异, 且男生更经常锻炼.2. 应用条件概率判断关联性 上面的问题还可以通过建立一个古典概型, 使用条件概率的语言, 给出另外一种解答方法. 用Ω表示该校全体学生构成的集合, 这是我们所关心的对象的总体. 考虑以Ω为样本空间的古典概型, 并定义一对分类变量X和Y如下:对于Ω中的每一名学生, 分别令0, 该生为女生, 0, 该生不经常锻炼, X=Y=1, 该生为男生, 1, 该生经常锻炼. 比较条件概率P(Y=1|X=0)和P(Y=1|X=1)的大小.在X=0的条件下Y=1的概率在X=1的条件下Y=1的概率 “性别对体育锻炼的经常性没有影响”可描述为:P(Y=1|X=0)=P(Y=1|X=1);“性别对体育锻炼的经常性有影响”可描述为:P(Y=1|X=0)≠P(Y=1|X=1).为了清楚起见, 我们用表格整理数据, 如表8.3-1所示. 表8.3-1 用{X=0, Y=1}表示事件{X=0}和{Y=1}的积事件, 用{X=1, Y=1}表示事件{X=1}和{Y=1}性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计3208041124的积事件. 根据古典概型和条件概率的计算公式, 有 因为P(Y=1|X=1)P(Y=1|X=0), 所以性别对体育锻炼的经常性有影响, 即该校男生和女生在体育锻炼的经常性方面存在差异, 且男生更经常锻炼. 二、2×2列联表 将两个分类汇总统计, 并做成表格加以保存的数据统计表称为2×2列联表. 每个分类变量只取两个值.性别锻炼合计不经常(Y=0)经常(Y=1)女生(X=0)192331523男生(X=1)128473601合计3208041124表8.3-1 2×2列联表给出了成对分类变量数据的交叉分类频数. 以表8.3-1为例, 它包含了X和Y的如下信息:事件{Y=0}和{Y=1}中样本点的个数; 事件{X=0}和{X=1}中样本点的个数;表格的核心部分, 给出了事件{X=x, Y=y}(x, y=0, 1)中样本点的个数;样本空间中样本点的总数.三、统计案例常用方法 在上面问题的两种解答中, 使用了学校全部学生的调查数据, 利用这些数据能够完全确定解答问题所需的比率和条件概率. 然而, 对于大多数实际问题, 不可能获得所关心的全部对象的数据, 因此无法准确地计算出有关的比率和条件概率. 在这种情况下, 上述古典概型和条件概率的观点为我们提供了一个解决问题的思路. 有限性、等可能性 将所关心的对象的全体看成古典概型的样本空间, 就可以用概率的语言刻画相关的问题, 进而用频率稳定于概率的原理推断问题的答案. 很多统计方法都是基于这种思想建立起来的. 比较简单的做法是利用随机抽样获得一定数量的样本数据, 再利用随机事件发生的频率稳定于概率的原理对问题答案作出推断.例1 为比较甲、乙两所学校的学生的数学水平, 采用简单随机抽样的方法抽取88名学生. 通过测验得到了如下数据:甲校43名学生中有10名数学成绩优秀; 乙校45名学生中有7名数学成绩优秀. 试分析两校学生中数学成绩优秀率之间是否存
您可能关注的文档
- 【选修】1.1.1空间向量及其线性运算(2)(第二版).pptx
- 【选修】1.4.2用空间向量研究距离、夹角问题(1)(第二版).pptx
- 【选修】1.4.2用空间向量研究距离、夹角问题(2)(第二版).pptx
- 【选修】2.1.1倾斜角与斜率(第二版).pptx
- 【选修】2.1.2两条直线平行和垂直的判定(第二版).pptx
- 【选修】2.2.3直线的一般式方程(第二版).pptx
- 【选修】2.3.1 两条直线的交点坐标(第二版).pptx
- 【选修】2.3.2两点间的距离公式(第二版).pptx
- 【选修】2.3.3点到直线的距离公式(第二版).pptx
- 【选修】2.3.4两条平行直线间的距离(第二版).pptx
- DeepSeek培训课件入门宝典:第2册 开发实战篇 .pptx
- 全面认识全过程人民民主-2024春形势与政策课件.pptx
- 2024春形势与政策-全面认识全过程人民民主.pptx
- 2025年春季学期形势与政策第二讲-中国经济行稳致远讲稿.docx
- 2024春形势与政策-铸牢中华民族共同体意识课件.pdf
- 2024春形势与政策-走好新时代科技自立自强之路课件 (2).pptx
- 2024春形势与政策-走好新时代科技自立自强之路课件.pptx
- 形势与政策学习指导教学-整套课件.pdf
- 2023年春季形势与政策讲稿第三讲-开创高质量发展新局面.pdf
- DeepSeek培训课件-清华大学-DeepSeek模型本地部署与应用构建.pptx
最近下载
- 球墨铸铁铸件生产技术 球墨铸铁冒口的分类 冒口设计(2019).docx
- 区发展和改革局党组书记、局长任期内经济责任审计中反映问题的整改情况报告.docx VIP
- 医疗器械出海专题:出海水到渠成,空间大有可为.pdf VIP
- 辽宁专升本电气工程及其自动化技能历年真题(1).pdf
- [中央]2024年全国市长研修学院(住房和城乡建设部干部学院)招聘应届生笔试上岸历年典型考题与考点剖析附带答案详解.docx VIP
- 雨课堂学堂在线《内科学(白城医学高等专科学校)》学堂云单元测试考核答案.pdf
- 2025年烟花爆竹储存证考试题库.docx
- 2024高考英语考点887个核心词汇 .pdf VIP
- 部编人教版二年级语文下册教案(全册).doc VIP
- 亚马逊运营合规考试试卷.docx
文档评论(0)