9.第十章 卡方检验.ppt

  1. 1、本文档共44页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
9.第十章 卡方检验

多个样本率间的多重比较 Bonferroni法 基本思想:为保证犯第I类错误的概率总和不超过ALPHA,调整每一两两比较的检验水准 P159:例10-9 R ×C表 检验的条件 1.行列表中的各格T≥1,并且1≤T<5的格子数不宜超过1/5格子总数,否则可能产生偏性。处理方法有三种: 增大样本含量以达到增大理论频数的目的,属首选方法,只是有些研究无法增大样本含量 根据专业知识,删去理论频数太小的行或列,或将理论频数太小的行或列与性质相近的邻行或邻列合并。这样做会损失信息及损害样本的随机性。 注意:不同年龄组可以合并,但不同血型就不能合并。 改用双向无序R×C表的Fisher确切概率法(可用SAS软件实现)。 关联性分析 2 ×2表的关联 P154:例10-3 关联性分析 配对四格表的关联 P156:例10-5 关联性分析 行×列表的关联 P157:例10-8 R × C表资料Chi-Square检验 应注意的问题 应用条件; 多重比较问题 关联性分析问题 等级资料分析问题 双向无序单资料的分析 单向有序资料的分析 双向有序、属性不同资料的分析 双向有序、属性相同资料的分析 四格表资料的确切概率法 检验 第十章 ?????? 本章教学目的: 推断: 两个总体率或构成比之间有无差别 多个总体率或构成比之间有无差别 两个分类变量之间有无关联性 频数分布拟合优度的检验 检验的基本思想 四格表资料的基本形式 基本思想:可通过 检验的基本公式来理解。 式中,A为实际频数(actual frequency), T为理论频数(theoretical frequency)。 检验统计量 值反映了实际频数与理论频数的吻合程度。 若检验假设H0:π1=π2成立,四个格子的实际频数A 与理论频数T 相差不应该很大,即统计量 不应该很大。 如果 值很大,即相对应的P 值很小,若 ,则反过来推断A与T相差太大,超出了抽样误差允许的范围,从而怀疑H0的正确性,继而拒绝H0,接受其对立假设H1,即π1≠π2 。 由公式还可以看出: 值的大小还取决于 个数的多少(严格地说是自由度ν的大小)。由于各 皆是正值,故自由度ν愈大, 值也会愈大;所以只有考虑了自由度ν的影响, 值才能正确地反映实际频数A和理论频数T 的吻合程度。 检验的自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。 样本率与总体率比较 例: 全国高血压病调查结果:城市人口高血压病患病率19.6%; 某调查获得有高血压病家族史者358人,其中高血压病者127人(P=35.47%) 问:有高血压病家族史者患病率是否高于一般人群? + - 合计 实际(A) 127 231 358 理论(T) 70.168 287.832 358 Chi-Square =57.252 第一节 2× 2表 检验 目的:推断两个总体率(构成比)是 否有差别 (和u检验等价) 资料:两样本的两分类个体数排列成四 格表资料 四格表资料检验的专用公式 分布是一连续型分布,而四格表资料属离散型分布,由此计算得的 统计量的抽样分布亦呈离散性质。为改善 统计量分布的连续性,则进行连续性校正。 四格表资料 检验公式选择条件: ,不校正的理论或专用公式; ,校正公式 ,直接计算概率。 连续性校正仅用于 的四格表资料,当 时,一般不作校正。 四格表资料检验的校正公式 P151:例10-1 P153:例10-2 两相关样本率检验

文档评论(0)

saa9099 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档