- 1、本文档共20页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
1.2独立性检验的基本思想和其初步应用
2、 * 台山市李谭更开纪念中学数学组 台山市李谭更开纪念中学数学组 杨义清 前面我们讨论了两个变量之间的关系——回归分析,以及对分析了解释变量和随机误差对预报变量的影响的强弱分析——相关指数R2分析 事实上,对于同一个总体而言,通过对比更能得出哪一种方法或哪个变量对总体效果有较大的影响,分类变量间的关系就是我们今天要研究的 变量属于不同的类别 例1.为了调查吸烟是否对患肺癌有影响,某肿瘤研究院随机的调查了9965人,得到如下结果: 2.28% 0.54% 比例 9965 2148 7817 总计 91 49 42 患肺癌 9874 2099 7775 不患肺癌 不吸烟 总计 吸烟 问:吸烟是否对患肺癌有影响? 解 从图表的比例可以看出:吸烟与不吸烟可能对患肺癌的可能存在差异,我们再通过不同的图表来分析 患肺癌 三维柱形图 不吸烟 二维条形图 等高条形图 不吸烟 上面我们通过图形的分析,初步判断吸烟与患肺癌有关系。那么,事实是否如此呢?我们需要用统计的观点来考察这个问题 我们首先设基本事件为: H0:吸烟与患肺癌没有关系 我们下面就一般关系做一个推断 a+b+c+d c+d a+b 总计 b+d d b 患肺癌 a+c c a 不患肺癌 不吸烟 总计 吸烟 如果吸烟与患肺癌没有关系,则: a(c+d)≈c(a+b) ad-bc≈0 因此,| ad-bc |越小,说明吸烟与患肺炎之间没有关系。 为了使样本空间有一定的代表性,我们引入一个随机变量 (n=a+b+c+d(样本容量)) 若,H0成立,(吸烟与患肺癌无关)则K2应该很小,通过计算我们可以得到K的观测值: K2≈56.632 总计的四项 H0:吸烟与患肺癌没有关系 说明:根据统计学家的分析: P(K2≥6.635)≈0.01 10.83 0.001 7.879 0.005 6.635 0.010 5.024 0.025 3.841 0.05 2.706 0.10 2.072 0.15 1.323 0.25 0.708 0.40 0.455 0.50 k0 P(K2≥k0) 表1-11 k22.706,就有90%的把握认为X与Y之间存在关系 有统计规律可以看出: K2=6.635的概率非常小,近似于0.01,也就是说,在H0成立的概率为1%,即H0不成立的概率为99%,因此我们认为吸烟与患肺癌有关 上面的利用K2来检验“两个变量有关系”的方法称为:独立性检验 说明: 两个变量X与Y独立性检验的一般方法: 1.设两个变量的值域分别为{x1,x2}{y1.,y2},列频数关联表 a+b+c+d c+d a+b 总计 b+d d b y2 a+c c a y1 x1 总计 x2 3.利用统计概率表1-11查阅发生的概率 2.计算变量X与Y的评判标准K2 4.得出概率结论: K2≥k0,则有关系,否则没有关系。 例1.某心脏病医院为了研究秃顶是否与心脏病有关,对665名男性心脏和772名其他病人做了研究,如图所示: 1437 1048 389 总计 772 597 175 不患心脏病 665 451 214 患心脏病 总计 不秃顶 秃顶 智慧的闪光!
文档评论(0)