- 1、本文档共21页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
* * 第三章 统计案例 3.2 独立性检验的基本思想及其 初步应用 独立性检验 本节研究的是两个分类变量的独立性检验问题。 在日常生活中,我们常常关心分类变量之间是否有关系: 例如,吸烟是否与患肺癌有关系? 性别是否对于喜欢数学课程有影响?等等。 9965 91 9874 总计 2148 49 2099 吸烟 7817 42 7775 不吸烟 总计 患肺癌 不患肺癌 吸烟与肺癌列联表 为了调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 列联表 在不吸烟者中患肺癌的比重是 在吸烟者中患肺癌的比重是 说明:吸烟者和不吸烟者患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。 0.54% 2.28% 探究 9965 91 9874 总计 2148 49 2099 吸烟 7817 42 7775 不吸烟 总计 患肺癌 不患肺癌 1、列联表 2、三维柱形图 3、二维条形图 不患肺癌 患肺癌 吸烟 不吸烟 不患肺癌 患肺癌 吸烟 不吸烟 0 8000 7000 6000 5000 4000 3000 2000 1000 从三维柱形图能清晰看出 各个频数的相对大小。 从二维条形图能看出,吸烟者中 患肺癌的比例高于不患肺癌的比例。 通过图形直观判断两个分类变量是否相关: 不吸烟 吸烟 患肺癌 比例 不患肺癌 比例 4、等高条形图 等高条形图更清晰地表达了两种情况下患肺癌的比例。 上面我们通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否真的如此呢?这需要用统计观点来考察这个问题。 现在想要知道能够以多大的把握认为“吸烟与患肺癌有关”, 为此先假设 H0:吸烟与患肺癌没有关系. a+b+c+d b+d a+c 总计 c+d d c 吸烟 a+b b a 不吸烟 总计 患肺癌 不患肺癌 把表中的数字用字母代替,得到如下用字母表示的列联表 用A表示不吸烟,B表示不患肺癌,则“吸烟与患肺癌没有关系”等价于“吸烟与患肺癌独立”,即假设H0等价于 P(AB)=P(A)P(B). 因此|ad-bc|越小,说明吸烟与患肺癌之间关系越弱; |ad-bc|越大,说明吸烟与患肺癌之间关系越强。 a+b+c+d b+d a+c 总计 c+d d c 吸烟 a+b b a 不吸烟 总计 患肺癌 不患肺癌 在表中,a恰好为事件AB发生的频数;a+b和a+c恰好分别为事件A和B发生的频数。由于频率接近于概率,所以在H0成立的条件下应该有 为了使不同样本容量的数据有统一的评判标准,基于上述分析,我们构造一个随机变量-----卡方统计量 (1) 若 H0成立,即“吸烟与患肺癌没有关系”,则K2应很小。 根据表3-7中的数据,利用公式(1)计算得到K2的观测值为: 那么这个值到底能告诉我们什么呢? (2) 独立性检验 在H0成立的情况下,统计学家估算出如下的概率 即在H0成立的情况下,K2的值大于6.635的概率非常小,近似于0.01。 也就是说,在H0成立的情况下,对随机变量K2进行多次观测,观测值超过6.635的频率约为0.01。 思考 答:判断出错的概率为0.01。 判断 是否成立的规则 如果 ,就判断 不成立,即认为吸烟与患肺癌有关系;否则,就判断 成立,即认为吸烟与患肺癌有关系。 独立性检验的定义 上面这种利用随机变量K2来判断“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。 在该规则下,把结论“ 成立”错判成“ 不成立”的概率不会差过 即有99%的把握认为 不成立。 独立性检验的基本思想(类似反证法) (1)假设结论不成立,即 “两个分类变量没有关系”. (2)在此假设下我们所构造的随机变量 K2 应该很小,如果由观测数据计算得到K2的观测值k很大,则在一定可信程度上说明 不成立.即在一定可信程度上认为“两个分类变量有关系”;如果k的值很小,则说明由样本观测数据没有发现反对 的充分证据。 (3)根据随机变量K2的含义,可以通过评价该假设不合理的程度,由实际计算出的,说明假设不合理的程度为1%,即“两个分
您可能关注的文档
- 【志鸿优化设计-赢在课堂】(人教版)2015高中物理选修3-1配套课件:2.1 电源和电流讲义.ppt
- 【志鸿优化设计-赢在课堂】(人教版)2014-2015高中物理选修3-5课件16.4碰撞讲义.ppt
- 【志鸿优化设计】2015高中历史(人教版)选修二课件 课后习题 2.1 第1课 英国议会与王权矛盾的激化讲义.ppt
- 【志鸿优化设计】(教师用书)2015高中历史(人教版)选修二课件 课后习题 2.2 第2课 民主与专制的反复较量讲义.ppt
- 【志鸿赢在高考】(新课标)2016届高考生物二轮复习高考仿真测试5(含解析)讲义.doc
- 【志鸿 赢在高考】(新课标)2016届高考物理二轮复习 专题八 电磁感应与力学、电学的综合课件讲义.ppt
- 【招聘工具】万科集团校园招聘指导手册-必威体育精装版版(操作样板)讲义.ppt
- 【掌控中考】(云南专版)2016中考英语第一篇教材系统复习考点精讲1七上课件人教新目标版讲义.ppt
- 【掌控中考】2015版人教版中考生物复习考点梳理:第五单元生物圈中的其他生物(共50张PPT)讲义.ppt
- 【招聘】超级面试官速成:结构化面试设计与操作技巧讲义.ppt
- 2025年重庆市攀枝花市单招(计算机)测试题库附答案.docx
- 2025年顺德职业技术学院单招计算机测试题库及答案1套.docx
- 探索数字阅读新时代-学生阅读行为的数字化转型.pptx
- 揭秘物态变化-理解并掌握物质三态变化.pptx
- 2025年陕西服装工程学院单招(计算机)测试题库必考题.docx
- 2025年长沙文创艺术职业学院单招(计算机)测试模拟题库及答案1套.docx
- 2025年青海卫生职业技术学院单招计算机测试题库推荐.docx
- 2025年黑龙江省哈尔滨市单招计算机测试题库推荐.docx
- 2025年重庆海联职业技术学院单招计算机测试题库必威体育精装版.docx
- 2025年重庆城市管理职业学院单招计算机测试题库附答案.docx
最近下载
- 05G514-4(12m实腹式钢吊车梁-重级工作制-A6 A7 Q345钢).pdf VIP
- 露酒生产基础知识与品评-更改后.ppt
- 2025年中国链条行业市场全景评估及投资前景展望报告.docx
- (word)MBTI 性格测试.doc VIP
- 2025年中国烟草总公司福建省公司人员招聘笔试备考题库及答案解析.docx
- 财务报表分析和证-券估值 ,第五版 答案 Financial Statement Analysis and Security Valuation solution SOLUTIONS_MANUAL ,5e.doc
- 2024年全国高中数学联赛初赛试题【16省市】含答案.pdf
- 《《婴幼儿配方乳粉及调制乳粉中7种母乳低聚糖的测定》》.pdf VIP
- 《核电厂工程的设计与设计管理》推荐.ppt
- 水池维修改造施工方案.doc
文档评论(0)