- 1、本文档共24页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
吸烟与患肺癌列联表
为考察高中生性别与是否喜欢数学课程之间的关系,在某城市的某校高中生中随机抽取300名学生,得到如下列联表: 喜欢数学课程 不喜欢数学课程 总计 男 37 85 122 女 35 143 178 总计 72 228 300 由表中数据计算得K2≈4.513.高中生的性别与是否喜欢数学课程之间是否有关系?为什么? 解 认为“性别与喜欢数学课之间有关系”. 利用独立性检验的基本思想 P(K2≥k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 假设该结论不成 由观测数据计算K2的观测值k 通过概率评价该假设不合理的程度 作业 课本习题3.2 题1,2 实习作业 1.我校学生的体重与身高之间的关系可以用什么模型刻画? 2.中学生喜欢文科还是理科与性别有关吗?是否喜欢看足球比赛与性别有关吗?是否喜欢音乐与性别有关吗? 对于性别变量,其取值为男和女两种. 这种变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量. 生活中的分类变量 是否吸烟,宗教信仰,国籍… 两个分类变量之间是否有关系 性别 是否喜欢数学课程 吸烟 患肺癌 为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人) 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 那么吸烟是否对肺癌有影响? 吸烟与患肺癌列联表 列出两个分类变量的频数表,称为列联表 不患肺癌 患肺癌 总计 不吸烟 7775 42 7817 吸烟 2099 49 2148 总计 9874 91 9965 吸烟者与不吸烟者患肺癌的可能性存在差异 从上面数据和图形可以看出吸烟和患肺癌有关 从上面数据和图形可以看出吸烟和患肺癌有关 我们能够有多大的把握认为“吸烟与患肺癌有关”? 吸烟 患肺癌 吸烟与患肺癌列联表 不患肺癌 患肺癌 总计 不吸烟 a b a+b 吸烟 c d c+d 总计 a+c b+d a+b+c+d 假设 H0:吸烟与患肺癌没有关系 A:不吸烟 B:吸烟 P(AB)=P(A)(B) a:事件AB发生的频数 a+b:事件A发生的频数 a+c:事件B发生的频数 H0成立时 (n=a+b+c+d) (a+b+c+d)a≈(a+b)(a+c) ad-bc≈0 |ad-bc|越小 吸烟与患肺癌之间的关系越弱 |ad-bc|越大 吸烟与患肺癌之间的关系越强 构造一个随机变量 建立统一标准 (n=a+b+c+d) 若H0成立 K2应该很小 根据前面数据 K2的观察值 在“吸烟与患肺癌没有关系”成立的条件下可以估算出 k≈56.632 6.635 远大于 99%的把握认为“吸烟与患肺癌有关系” 利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验. 确认“两个分类变量有关系”成立的可信程度 假设该结论不成 由观测数据计算K2的观测值k 通过概率评价该假设不合理的程度 k6.635,假设不合理程度约为99% y1 y2 总计 x1 a b a+b x1 c d c+d 总计 a+c b+d a+b+c+d 假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表 2×2列联表 若要推断的论述为 H1:“X与Y有关系” 可以按如下步骤判断结论H1成立的可能性 1.通过等高条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠度 2.可以利用独立性检验来考察两个分类变量是否有关系并且能较精确地给出这种判断的可靠程度. 根据观测数据计算检验随机变量K2的观察值k P(K2≥k) 0.50 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 k 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.828 当得到的观测数据a,b,c,d都不于5时,可以通过查阅下表来确定其可信程度 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶,而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶.分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效? 患心脏病 患其他病 总计 秃顶 214 175 389 不秃顶 451 597 1048 总计 665 772 1437 解 根据数据得到如下列联表 秃顶与患心脏病列联表 认为“秃顶与患心脏病有关” 这组
文档评论(0)