- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
1.2《独立性检验的基本思想及其初步应用》 教学目标 1理解独立性检验的基本思想 2、会从列联表、柱形图、条形图直观判断吸烟与患癌有关。 3、了解随机变量K2的含义。 理解独立性检验的基本思想及实施步骤。 教学重点:理解独立性检验的基本思想。独立性检验的步骤。 教学难点;1、理解独立性检验的基本思想;2、了解随机变量K2的含义;独立性检验的步骤。 有一个颠扑不破的真理,那就是当我们不能确定什么是真的时,我们就应该去探求什么是最可能的。 问题的数学表述 “患呼吸道疾病与吸烟有关”这句话是什么意思? “某成年人吸烟”记为事件A, “某成年人患病”记为事件B 这句话的意思是:事件A与事件B有关。 问题的另一面是:事件A与事件B独立。 解决问题的思路 思路:反证法思想 (1)假设:H0:患病与吸烟无关 即 P(A)P(B)= P(AB) (2)在 H0成立的条件下进行推理 (3)如果实际观测值与由(2)推出的值相差不大,则可以认为这些差异是由随机误差造成的,假设H0不能被否定;否则,假设H0不能被接受 * 看到这个课题,你能想到什么? 案 例:某医疗机构为了了解呼吸道疾病与吸烟是否有关,进行了一次抽样调查,共调查了515个成年人,其中吸烟者220人,不吸烟者295人。 调查结果:吸烟的220人中有37人患呼吸道疾病,183人未患呼吸道疾病;不吸烟的295人中有21人患病,274人未患病。 根据这些数据,能否断定:患呼吸道疾病与吸烟有关? 数据整理 合计 不吸烟 吸烟 合计 未患病 患病 37 21 58 183 274 457 220 295 515 问题:判断的标准是什么? 吸烟与不吸烟,患病的可能性的大小是否有差异? 频率估计概率 100%(295) 92.88% 7.12% 不吸烟 100%(220) 83.18% 16.82% 吸 烟 合 计(n) 未患病 患 病 通过图形直观判断 不患病 比例 患病 比例 解决问题:直观方法 吸烟的患病率 不吸烟的患病率 37/220 ?16.82% 21/295 ?7.12% 根据统计分析的思想,用频率估计概率可知,吸烟者与不吸烟者患病的可能性存在差异。 你能有多大把握认为“患病与吸烟有关”呢? 笛卡尔 能否用数量来刻画“有关”程度 合计 不吸烟 吸烟 合计 未患病 患病 37 21 58 183 274 457 220 295 515 一般化: P(A)、P(B)不知道,怎么办? 频率估计概率 P(A) ? P(B) ? P(AB) ? ? 同理,吸烟但不患病的人数约为 n ? ? 由此估计: 吸烟且患病的人数约为 n ? ? 不吸烟但患病的人数约为 n ? ? 不吸烟也不患病的人数约为 n ? ? 怎样估计实际观测值与理论估计值的误差? 采用如下的量(称为χ2 统计量)来刻画这个差异: + + + 化简得 = ?2 ?2统计量 ?2 =11.8634 反证法原理与假设检验原理 反证法原理: 在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立。 假设检验原理:在一个已知假设下,如果推出一个小概率事件发生,则推断这个假设不成立的可能性很大。 一般地,对于两个研究对象Ⅰ和Ⅱ,Ⅰ有两类 取值,即类A和B(如吸烟与不吸烟);Ⅱ也有两类 取值,即类1和2(如患病与不患病)。于是得到 下列联表所示的抽样数据: a+b+c+d b+d a+c 总计 c+d d c 类B a+b b a 类A 总计 类2 类1 要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行: (1)提出假设H0 :Ⅰ和Ⅱ没有关系; (3)查对临界值,作出判断。 (2)根据2× 2列联表与公式计算 的值; 由于抽样的随机性,由样本得到的推断有可能正确,也有可能错误。利用 进行独立性检验,可以对推断的正确性的概率作出估计,样本量n越大,估计越准确。 10.828 7.879 6.635 5.024 3.841 2.706 2.072 1.323 0.708 0.455 xo 0.001 0.005 0.01 0.025 0.05 0.1 0.15 0.25 0.4 0.5 卡方临界值表: 则有99.9%的把握认为“Ⅰ与Ⅱ有关系”; (1)若观测值χ2>10.828. (3)若观测值χ2>2.706,则 (4)若观测值χ2<2.706,则 (2)若观测值χ2>6.635, 则有99%的把握认为“Ⅰ与Ⅱ有关系”; 则有90%的把握认为“Ⅰ与Ⅱ有关系”; 则没有充分的证据显示“Ⅰ与Ⅱ有
文档评论(0)