- 1、本文档共34页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十二章 卡方检验(一) 用于检验: 1)两组或几组率或构成比的差异有无显著性 2)各行的平均分间有无差异 3)行与列两个顺序分类变量之间是否相关 4)拟合优度检验 第一节 四格表资料的?2检验 以P153例12-1为例 1、四格表:将资料列成表格,表格中四个数字是基本的:63、17、31、68,称四格表fourfold table 2、实际数:表内各格数字为实际资料的数字,称observed value, actual frequency,记为O或A 两样本率不同的原因:抽样误差、总体率确实不同 两种类型胃溃疡病内科疗法治疗结果 为检验是否为第二种情况,无效假设为两种治愈率本无不同,差别仅由抽样误差所致。 3、理论治愈率: 根据两组治愈率相同的假设,合计治疗179人,总治愈94人,得理论治愈率为 94/179=52.51% 4、理论数: 一般溃疡患者80,按理论治愈率应治愈80×52.51%=42.01,称theoretical value, theoretical frequency. 记为T。同理可得其余理论数。亦可由减法求得 Trc=(nrnc)/n:理论数为行合计乘列合计除总合计 理论数有两个特征:1)理论频数表的构成比相同,即不但各行构成比相同,而且各列亦相同;2)各个基本格子实际数与理论数的差别(绝对值)相同 5、样本率的差别演绎为实际数与理论数的差别: 两样本率相差愈大,则实际数与理论数的差别就愈大。若无效假设成立,实际数与理论数之差就不会很大。 1)实际数与理论数之间的差别等价于两样本率的差别 2)检验假设H0:四格表的构成比相同,等价于H0:两总体率相等 3)对实际数与理论数差值的假设检验,等价于对两样本率差值的假设检验 6、?2检验的基本思想(及计算步骤) 1)假设两总体率相等(构成比相同) HO:?1=?2,即两总体阳性率相等 H1:?1??2,即两总体阳性率不等 ?=0.05 不妨把H0看作:?1=?2=两样本合并的阳性率 2)实际数与理论数的差值服从?2分布,又称pearson ?2 : ?2值是以理论数为基数的相对误差,它反映了实际数与理论数吻合的程度(差别的程度)。若检验假设成立,则实际数与理论数的差别不会很大,出现大的?2值的概率是很小的,若P??,就怀疑假设,因而拒绝它;若P?,则尚无理由拒绝它 ?2值的大小随着格子数的增加而变大,即?2分布与自由度有关。因而考虑?2值大小的意义时,要考虑到格子数。当周边合计数固定的情况下,四个基本数据当中只有一个可以自由取值,即自由度为1。 ?=(R-1)(C-1) R行C列时,R行中有一行数据受到列合计的限制而不能自由变动,C列中亦有一列数据在行合计的限制下不能自由取值 3)查?2分布界值表确定P值并作出推论 ?2 =39.93,自由度为1,查附表6-7 ?2 0.05(1)=3.84; ?2 0.01(1) =6.63; ?2 0.001(1) =10.83 一般类型的治愈率高于特殊类型(结合样本率作实际推论) P0.001, 按?=0.05水准,拒绝H0接受H1,因而认为两总体的阳性率有差别(统计学推论)。结果说明,两组胃溃疡病人治愈率的差别有高度统计意义, 7、 ?2值的校正、四格表?2检验的条件 实际上?2值是根据正态分布中?2 =?[(xi-?) /?]2的定义计算出来的,用前述公式算得的值只能说近似于?2分布,在自由度大于1,理论数皆大于5时,这种近似较好;自由度为1,当有理论数小于5时,需进行(连续性)校正 ?2检验条件:(四格表) 1、当n?40且所有T?5时,用普通的?2 检验;若所得P? ? ,改用确切概率法。 2、当n?40但有1?T5时,用校正?2检验 3、当n40或有T1时,不能用?2检验,改用确切概率法。 8、四格表专用公式 为方便起见,当基本格子的实际数命名为a,b,c,d;行合计写为a+b、c+d,列合计写为a+c、b+d,n为总观察数 第二节 行×列表的?2检验 当行或列超过2组时通称为行×列表,或R×C表,亦称列联表contingency table。可用于 1、多个率的比较 可用以下简化公式(无相应校正公式) 适用条件:不能有理论数小于1,并且1?T?5的格子数不超过总格子数1/5。 条件不足时的三种处理方法: 1)增大样本例数使理论数变大 2)删除理论数太小的行或列 3)将理论数太小的行或列与性质相近的邻行或邻列合并,使重新计算的理论数增大。但是此处理可能损失信息,也会损害样本的随机性,不同的合并方式所得的结果也不一样,因而在不得已时慎用 2、多个构成比比较 3、双向有序分类资料的关联性检验 表格是按两个变量从小到大顺序分类整理出来的,目的是研究两变量间有无关联性。从左上角往右下角看,频数有无集中在此对角
文档评论(0)