第十章分类变量资料的统计分析.pptVIP

  1. 1、本文档共71页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第十章分类变量资料的统计分析

第一节 分类变量资料的统计描述 常用相对数 应用相对数时的注意事项 率的标准化法 相对数 相对数:是两个有关联的数值或指标之比。 常用的相对数有: 率 构成比 相对比 率(rate) 构成比(constituent ratio) 相对比 应用相对数的注意事项 计算相对数时分母不宜过小 正确区分构成比和率,不能以构成比代替率 正确计算平均率 对率和构成比进行比较时,应注意资料的可比性 率的标准化 样本率或构成比进行比较时要作假设检验 直接法 间接法 第二节 分类变量资料的统计推断 率的抽样分布 率的抽样误差与标准误 总体率的区间估计 率比较的u检验 率的抽样分布 从某个二项分类总体中随机抽取含量一定的样本,其样本率的分布概率是有规律的,这种规律为服从二项分布(binomial distribution),即样本中阳性数或样本阳性率的分布概率等于二项式展开后各项。若总体阳性率为π、样本含量为n,阳性数为X,则样本中出现X个阳性事件的概率可由下式求得。 率的抽样分布特征 1.为离散型分布; 2.当π =1-π时,呈对称分布; 3.当n增大时,逐渐逼近正态分布。 一般认为,当nπ和n(1-π)≥5时, 可近似看作正态分布。 率的抽样误差和标准误 由于抽样所引起的样本率和总体率或各样本率之间存在着差异,这种差异称为率的抽样误差。用率的标准误表示 。 总体率的区间估计 总体率的估计: 点估计 区间估计 正态近似法 查表法 正态近似法 查表法 当n较小,如n?50,特别是p接近于0或1时,按二项分布原理估计总体率的可信区间。 因其计算比较复杂,统计学家已经编制了总体率可信区间估计用表,可根据样本含量n和阳性数x查阅统计学专著中的附表 。 u 检验 样本率与总体率的比较 两个样本率的比较 第三节 ?2检验 基本思想 四格表资料的卡方检验 配对设计分类变量资料的卡方检验 行×列表资料的卡方检验 基本思想 ?2检验的自由度 指可以自由取值的基本格子数 自由度一定时,其?2值的概率分布也就确定。根据自由度?和检验水准?查表10-13 可得?2界值,若?2值≥?20.05(?),则可按?=0.05的检验水准拒绝H0;若?2值<?20.05(?),则还不能拒绝H0。 四格表资料的卡方检验 在实际工作中,对于四格表资料,通常规定 (1)T≥5,且N≥40时,直接计算值,不用校正;  (2)1≤T5, 且N≥40时,用连续性校正检验; (3)T1或N40,不能用卡方检验,用直接计算概率的方法。 配对设计分类变量资料的?2检验 注意事项 由于该检验只考虑了不一致的情况(b与c),而未考虑样本含量n及一致结果(a与d),因此,当n很大而且两法一致率较高(即a与d数值较大),b与c的数值相对较小时,即使检验结果有统计学意义,但实际意义并不大。 行×列表资料的卡方检验 例10-13 某研究者欲了解白内障发病是否与ABO血型有关,收集有关资料见表10-11,问白内障组与对照组ABO血型分布有无差别? H0 :白内障组与对照组ABO血型分布相同 H1 :白内障组与对照组ABO血型分布不同或不全相同 ?=0.05 查表得,?20.05(3)=7.81, ?2?20.05(3),P0.05, 按?=0.05的检验水准,不拒绝检验假设,尚不能认为白内障组与对照组ABO血型分布不同。 (1) (2) (3) ? =(2-1)(4-1)=3 理论数不宜太小。(不能有1/5以上格子的理论频数小于5或者有一个格子的理论频数小于1)。处理方法 如假设检验的结果是拒绝无效假设,只能认为各总体率或构成比之间总的来说有差别。若要进一步了解哪两者之间有差别,可用卡方分割法,或者调整检验水准。 对于单向有序行列表,在比较各处理组的效应有无差别时,应该用秩和检验。 行×列表卡方检验的注意事项: 如:用某药治疗某病患者,5例中有3例治愈,计算治愈率为3/5×100%=60.0%,如果有4例治愈,则其治愈率为80%。显然,这个结果是不稳定的。 在分母例数很少的情况下,个别的偶然因素会导致结果的变化,只有分母例数较大时,计算的相对数才比较稳定。在例数较少时,通常直接用绝对数表示。如果要用相对数表示,则需列出其总体率的置信区间。 某产院拟分析当地畸形儿与母亲分娩年龄的关系,检查了新生儿4470例,得以下资料,据此得出结论:“母亲年龄在24—29岁时,畸形儿最多,占总数的92.2%,表明该年龄段易发生畸形儿,符合一般规律”。试分析该结论是否合理? 某地畸形儿与母亲分娩年龄的关系 100.00 3.33 111 3338 合 计 50.45 3.58 56 1563 高中生 44.14 4.39 49 1115 初中生 5.41 0.91 6 660

文档评论(0)

118books + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档