独立性检验 - 杨清孟数学网.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
独立性检验 - 杨清孟数学网

* 独立性检验 江门市杜阮华侨中学 杨清孟 独立性检验 分类变量:变量的不同”值”表示个体所属的不同 类别. 如:性别,是否吸烟,宗教信仰,国籍等 日常生活中我们关心这样一些问题: 吸烟与患肺癌之间有无关系? 秃顶与心脏病之间有无关系? 性别与喜欢数学课之间有无关系? 以上问题能否用回归分析的知识来解决?为什么? 例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的调查了9965人,得到如下结果: 2.28% 0.54% 比例 9965 2148 7817 总计 91 49 42 患肺癌 9874 2099 7775 不患肺癌 不吸烟 总计 吸烟 问:吸烟是否对患肺癌有影响? 解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可能存在差异,我们再通过不同的图表来分析 列联表:两个分类变量的频数表 患肺癌 三维柱形图 9965 91 9874 总计 2148 49 2099 吸烟 7817 42 7775 不吸烟 总计 患肺癌 不患肺癌 二维条形图 等高条形图 上面我们通过图形的分析,初步判断吸烟与患肺癌有关系。那么,事实是否如此呢?我们需要用统计的观点来考察这个问题 我们首先设基本事件为: H0:吸烟与患肺癌没有关系 我们下面就一般关系做一个推断 a+b+c+d c+d a+b 总计 b+d d b 患肺癌 a+c c a 不患肺癌 不吸烟 总计 吸烟 如果吸烟与患肺癌没有关系,则: a(c+d)≈c(a+b) ad-bc≈0 因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。 a+b+c+d c+d a+b 总计 b+d d b 患肺癌 a+c c a 不患肺癌 不吸烟 总计 吸烟 为了使样本空间有一定的代表性,我们引入一个随机变量 (n=a+b+c+d(样本容量)) 若,H0成立,(吸烟与患肺癌无关)则K应该很小,通过计算我们可以得到K的观测值: k=K2=56.632 总计的四项 说明:根据统计学家的分析: P(K2≥10.828)≈0.001 10.828 0.001 7.879 0.005 6.635 0.010 5.024 0.025 3.841 0.05 2.706 0.10 2.072 0.15 1.323 0.25 0.708 0.40 0.455 0.50 K。 P(K2≥k) 表1-12 10.828 7.879 6.635 5.024 3.841 2.706 2.072 1.323 0.708 0.455 0.001 0.005 0.010 0.025 0.05 0.10 0.15 0.25 0.40 0.50 上面的利用K2来检验“两个变量有关系”的方法成为:独立性检验 说明: 两个变量X与Y独立性检验的一般方法: 1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数列联表 a+b+c+d c+d a+b 总计 b+d d b y2 a+c c a y1 x1 总计 x2 4.利用统计概率表1-12查阅发生的概率 3.计算变量X与Y的评判标准K2的观测值 5.得出概率结论 2.假设“X与Y无关” 例1.在研究某种新药对小白兔的防治效果时,得到下表 数据: 288 58 230 总计 149 20 129 用新药 139 38 101 未用新药 总计 死亡数 存活数 试分析新药对防治小白兔是否有效? 99.5%的把握判定新药对防治小白兔是有效的. 解:假设“新药对防治小白兔无效” 根据列联表中的数据,得到的 观测值k为 例2.某心脏病医院为了研究秃顶是否与心脏病有关,对665名男性心脏和772名其他病人做了研究,是否可以以99%的把握认为秃顶与心脏病有关? 1437 1048 389 总计 772 597 175 不患心脏病 665 451 214 患心脏病 总计 不秃顶 秃顶 智慧的闪光! 1437 772 665 总计 1048 597 451 不秃顶 389 175 214 秃顶 总计 患其他病 患心脏病 所以有99%的把握认为”秃顶与患心脏病有关” 解:假设“秃顶与患心脏病无关” 研究人员表示,掉头发在很大程度上是由日渐增大的工作压力、不能充分休息、不正确饮食和睡眠不足等因素引起的。在接受调查的人群中,有41%的受秃头威胁的人表示,他们一日睡觉时间不足4小时 秃顶=心脏病 ? a+b+c+d b+d a+c 总计 c+d d c a+b b a 总计 若要推断的结论为H1:”X与Y有关系”,可如下操作: 1.通过三维柱形图和二维条形图,可以粗略地判断两个 变量是否有关系,但是这种判断不精确. a+b+c+d b+d a+c 总计 c+d d c a+b b a 总计 a+b+c+d b+d a+

文档评论(0)

wujianz + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档