统计学-两个率或多个率的比较.ppt

  1. 1、本文档共25页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
率的抽样误差与可信区间 一、 率的抽样误差与标准误 标准误的计算 二、 总体率的可信区间 率的统计学推断 一、样本率与总体率比较的u检验 二、两个独立样本率比较的u检验 卡方检验 一、卡方检验的基本思想(1) 一、卡方检验的基本思想(2) χ2分布(chi-square distribution) χ2检验的基本公式 二、四格表专用公式(1) 二、四格表专用公式(2) 三、连续性校正公式(1) 三、连续性校正公式(2) 四、配对四格表资料的χ2检验 配对四格表资料的χ2检验也称McNemar检验(McNemars test) 五、行×列(R×C)表资料的χ2检验 R×C表的χ2检验通用公式 几种R×C表的检验假设H0 R×C表的计算举例 R×C表χ2检验的应用注意事项 R×C表χ2检验的应用注意事项 * 计数资料的统计推断 浙江大学流行病与卫生统计学教研室 李秀央 Email: lixiuyang@ 一、率的抽样误差与标准误 二、总体率的可信区间 样本率(p)和总体率(π)的差异称为率的抽样误差(sampling error of rate) ,用率的标准误(standard error of rate)度量。 如果总体率π未知,用样本率p估计 总体率的可信区间 (confidence interval of rate):根据样本率推算总体率可能所在的范围 一、样本率与总体率比较u检验 二、两个样本率的比较u检验 u检验的条件:n p 和n(1- p)均大于5时 表5-1 两种疗法的心血管病病死率比较 10.45 (pc) 268 240 28 合 计 3.13 (p2) 64(n2) 62 2 (X2) 安慰剂 12.75 (p1) 204(n1) 178 26 (X1) 盐酸苯乙双胍 病死率(%) 合计 生存 死亡 疗法 u检验的条件: n1p1 和n1(1- p1)与 n2p2 和n2(1- p2)均 5 χ2检验(Chi-square test)是现代统计学的创始人之一,英国人K . Pearson(1857-1936)于1900年提出的一种具有广泛用途的统计方法,可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。 本章仅限于介绍两个和多个率或构成比比较的χ2检验。 10.45 (pc) 268(a+b+c+d=n) 240(b+d.) 28 (a+c.) 合 计 3.13 (p2) 64(c+d) 62 (d) 2 (c) 安慰剂 12.75 (p1) 204(a+b) 178 (b) 26 (a) 盐酸苯乙双胍 病死率(%) 合计 生存 死亡 疗法 表5-1 两种疗法的心血管病病死率的比较 2×2表或四格表(fourfold table) 实际频数A (actual frequency) ( a、b、c、d)的 理论频数T( theoretical frequency)(H0:π1=π2=π): a的理论频数= (a+b)×pc= (a+b)×[(a+c.)/ n]=nRnC/n =21.3 b的理论频数= (a+b)×(1-pc)= (a+b)×[(b+d.)/ n] =nRnC/n =182.7 c的理论频数= (c+d)×pc= (c+d)×[(a+c)/ n] =nRnC/n =6.7 d的理论频数= (c+d)×(1-pc)= (c+d)×[(b+d.)/ n] =nRnC/n =57.3 各种情形下,理论与实际偏离的总和即为卡方值(chi-square value),它服从自由度为ν的卡方分布。 3.84 7.81 12.59 P=0.05的临界值 上述基本公式由Pearson提出,因此软件上常称这种检验为Peareson卡方检验,下面将要介绍的其他卡方检验公式都是在此基础上发展起来的。它不仅适用于四格表资料,也适用于其它的“行×列表”。 为了不计算理论频数T, 可由基本公式推导出,直接由各格子的实际频数(a、b、c、d)计算卡方值的公式: ?2(1) ~ u2 =2.19492=4.82(n40,所有T?5时) χ2分布是一连续型分布,而行×列表资料属离散型分布,对其进行校正称为连续性校正(correction for continuity),又称Yates校正(Yates correction)。 ⑴当n≥40,而1≤T<5时,用连续性校正公式 ⑵当n<40或T<1时,用Fisher精确检

文档评论(0)

wangjie111 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档