- 1、本文档共36页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第八章 分类变量资料的统计推断
第八章 分类变量资料的统计推断 统计推断 用样本信息推论总体特征的过程。 包括: 参数估计: 运用统计学原理,用从样本计算出来的统计指标量,对总体统计指标量进行估计。 假设检验:又称显著性检验,是指由样本间存在的差别对样本所代表的总体间是否存在着差别做出判断。 主要内容 一、率(或构成比)的抽样误差和标准误 二、总体率(或构成比)的估计:点估计、区间估计 三、总体率(或构成比)的假设检验 1.率(或构成比)的 u 检验 2. x2检验? 第一节 率(或构成比)的抽样误差和总体率的估计 均数的标准差和标准误(复习)。 抽样误差产生的原因、概念 标准误的计算公式 与样本量的关系:成反比。 例题 答:该地5岁儿童龋齿患病率标准误为2.52% 二、总体率(或构成比)的估计 点估计:将样本率直接作为总体率的估计值. 区间估计(对照总体均数的区间估计) 按一定的概率,以样本信息估计总统率所在的范围。 方法有:1、正态近似法 2、查表法 第二节 总体率(或构成比)的假设检验 当两个样本率不同时,有两种可能: 1. P1 , P2所代表的总体率相同,由于抽样误差的存在,造成的不同,这种差别在统计上叫差别无统计学意义。 2. P1 , P2所代表的总体率不同,即两个样本来不同的总体,其差别有统计学意义。 现在就是要用统计学的方法进行判断到底属于那种情况。 适用条件:已知:n较大、 nP5, n(1-P)5 样本率(或构成比)与总体率(或构成比)比较的u检验 目的: 公式: 例: 建立假设:H0:π= π0 H1: π π0 α=0.05 单侧 选择检验方法,计算统计量 确定P值得出结论 两样本率比较的u检验 条件: 公式: 例 第三节 x2检验 一、概述 二、四格表资料 三、配对资料 四、行列表资料 五、行列表的分割 六、四格表的确切概率法 Chi-square test χ 是一种假设检验的方法,当样本量不大,或几个率进行比较时可用x2检验。 某医生想观察一种新药对流感的预防效果,进行了如下的研究,问此药是否有效? 一、概述 x2检验的基本公式 x2 =?(A-T)2/T A:表示实际频数,即实际观察到的例数。 T:理论频数,即如果假设检验成立,应该观察到的例数。 ? :求和符号 自由度:?=(R-1)×(C-1) R行数 row, C列数 column 注意:是格子数,而不是例数。 基本原理 x2 =?(A-T)2/T 如果假设检验成立,A与T不应该相差太大。理论上可以证明 ?(A-T)2/T服从x2分布,计算出x2值后,查表判断这么大的x2是否为小概率事件,以判断建设检验是否成立。 二、四格表资料的x2检验 什么是四格表资料?凡是两个率或构成比资料都可以看做四格表资料。举例。 四格表的一般形式 理论频数与自由度的计算:A是实际频数,T是根据假设检验来确定的,当H0成立时,计算出的格子中的数。每个格子中的理论频数计算公式为: NR所在的行合计,NC所在的列合计,代入公式中求x2值。 (求上例的4个T值) ν=(行-1)(列-1) 求例题的理论值 四格表资料的专用公式 该公式从基本公式推导而来,结果相同。计算较为简单。 适用条件: N40且 T ? 5 当不满足时用校正公式。 x2 =?(|A-T|-0.5)2/T 或 x2 =(|ad-bc|-n/2)2 xN? (a+b)(c+d)(a+c)(b+d) 见62页。 四格表资料专用公式: n≥40 且某一理论数1≤T5时的连续性校正公式: n 40或T 1时 Fisher 确切概率法公式: 例题 上例:问此药是否有效。 第一步:建立假设 H0 : ?1=?2 =20% H1 : ?1 ? ?2 第二步:确定显著性水平 ?=0.05 第三步:计算统计量: n =20040,每格的T值大于5,可选用公式??(计算过程) 第四步:确定P值 第五步:判断结果 基本公式:X2=4.125 专用公式:X2= 4.125 三、配对计数资料的x2检验 什么是配对资料? 两种方法检测RF比较 ITA LTA 合计 + - + 31(a) 12(b) 43 - 1(c) 11(d) 12 合计 32 23 55 例:问两种方法检测效果是否不同 第一步:建立假设 H0 : B=C=b+c/2 H1 : B?C 第二步:确定显著性水平 ?=0.05 第三
文档评论(0)