- 1、本文档共34页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(新课标人教A版)选修1-2《1.2独立性检验基本思想及其初步应用》
1.2 独立性检验的基本思想 及其初步应用 我们经常听到这些说法: 吸烟对患肺癌有影响; 数学好的人物理一般也很好; 性别与是否喜欢数学课程之间有关系; 人的血型会决定人的性格; 星座与人的命运之间有某种联系; 这些说法都有道理吗? 1.理解独立性检验的基本思想.(重点) 2.会从列联表、条形图直观判断吸烟与患肺癌 有关.(难点) 3.了解随机变量K2的含义,理解独立性检验的 基本思想及实施步骤.(难点) 【探究点1】 独立性检验的基本思想 对于性别变量,其取值为男和女两种.这种变量 的不同“值”表示个体所属的不同类别,这样的变 量称为 . 分类变量在现实生活中是大量存在的,如是否吸烟,是否患肺癌,宗教信仰,国别,年龄,出生月份等. 分类变量 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 问题:为了调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 在吸烟者中患肺癌的比重是_______. 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大. 0.54% 2.28% 在不吸烟者中患肺癌的比重是_______, 通过图形直观判断两个分类变量是否相关: 患肺癌 比例 不患肺癌 比例 等高条形图 通过数据和图表分析,得到结论是:吸烟与患肺癌有关,那么这种判断是否可靠呢?我们可以通过统计分析回答这个问题. 假设H0: 吸烟与患肺癌之间没有关系, 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 如果“吸烟与患肺癌没有关系”,那么吸烟样本中不患肺癌的比例应该与不吸烟样本中相应的比例差不多. 即 引入一个随机变量 它是检验在多大程度上可以认为“两个变量有关系”的标准. ︱ad-bc︱越小,说明吸烟与患肺癌之间的关系越弱, ︱ad-bc︱越大,说明吸烟与患肺癌之间的关系越强. 其中n=a+b+c+d为样本容量. 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 通过公式计算 已知在 成立的情况下, 即在 成立的情况下,K2的观测值大于6.635 的概率非常小,近似为0.010,是一个小概率事件. 思考:这个值到底告诉我们什么呢? 现在K2的观测值k≈56.632,远远大于6.635,所以有理由断定H0不成立,即认为“吸烟与患肺癌有关系”. 独立性检验的定义 利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验. 独立性检验的一般步骤 (1)假设两个分类变量X与Y没有关系; (2)计算出K2的观测值k; (3)把k的值与临界值比较确定X与Y有关的程度或无 关系. 设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 如P(k010.828)= 0.001表示在犯错误的概率不超过0.001的前提下,认为“X与Y有关系”. 如P(k06.635)= 0.01表示在犯错误的概率不超过0.01的前提下,认为“X与Y有关系”. 临界值表: 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 独立性检验的基本思想类似反证法 (1)假设结论不成立,即“两个分类变量没有关系”. (2)在此假设下随机变量K2应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理. (3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,如由实际计算出的k10.828.说明假设不合理的程度为99.9%,即“两个分类变量有关系”这一结论成立的可信度为约为99.9%. 【探究点2】 独立性检验的初步应用 例1.在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中,有175人秃顶.利用图形判断秃顶与患心脏病是否有关系?能否在犯错误的概率不超过0.010的前提下认为秃顶与患心脏病有关系? 解:
您可能关注的文档
- 风笑天社会学方法笔记.doc
- (外研版)4 Module 6 Unexplained Mysteries of the Natural World.ppt
- (外研版)必修5 Module 2 A Job Worth Doing.ppt
- 风管风速参数.doc
- (小抄)心理咨询师(三级)技能考试重点难点(2010版).doc
- (全国二)2016届Unit 2 The Olympic Games 课件.pptx
- 颈椎与腰椎的康复训练.ppt
- (四)第1课时 在关爱中成长.ppt
- (人教版)中考英语总复习夯实基础:(七下)Units 1~6(96页).ppt
- (山东)《龙门亮剑》2011高三英语一轮课件 Unit 1 新人教版选修8.ppt
- 信息技术-通信行业:OpenAI发布o1模型,有望驱动推理算力需求再上新台阶.pdf
- 信息技术-电子行业华为2024全连接大会前瞻:聚焦华为全连接,共赢行业智能化.pdf
- 信息服务-AI Agent(智能体):从技术概念到场景落地.pdf
- 通信-OpenAI发布o1新模型,光博会新技术精彩纷呈.pdf
- 通信-“合成数据+强化学习”:大模型进化的新范式.pdf
- 宏观专题研究:降息的预期和现实如何博弈?.pdf
- 宏观深度报告:美联储历次开启降息:经济与资产.pdf
- 宏观经济专题研究:从货币、财政政策力度指数到宏观政策力度综合指数.pdf
- 储能专题系列(1):装机高增,价格底部,盈利分化.pdf
- 智慧园区-福清市光电科技产业园音西片区-产业园区服务设施园区服务中心智慧管理平台系统项目.docx
文档评论(0)