- 1、本文档共52页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
卡方检验;卡方检验基础
四格表卡方检验
配对卡方检验与一致性检验
两分类变量间关联程度的度量
分层卡方检验
小结; ?2检验是以?2分布为基础的一种假设检验方法,主要用于分类变量,根据样本数据推断总体的分布与期望分布是否有显著差异,或推断两个分类变量是否相关或相互独立。其原假设为:
H0:观察频数与期望频数没有差别; 首先假设H0成立,计算出?2值,它表示观察值与理论值之间的偏离程度。根据?2分布,?2统计量以及自由度可以确定在H0成立的情况下获得当前统计量及更极端情况的概率P。如果P 很小,说明观察值和理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著性差异;否则就不能拒绝原假设,尚不能认为样本所代表的实际情况与理论假设有差别。;?2值的计算:; 当n比较大时, ?2 统计量近似服从k -1个自由度的?2分布。在自由度固定时,每个?2值与一个概率值(P 值)相对应,此概率值即为在H0成立的前提下,出现这样一个样本或偏离假设总体更远的样本的概率。如果P 值小于或等于显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不一致。如果P 值大于显著性水准,则不拒绝H0,认为观察频数与期望频数无显著性差异。P 值越小,说明H0假设正确的可能性越小;P 值越大,说明H0假设正确的可能性越大。; 检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布,Possion分布等
检验某个分类变量各类的出现概率是否等于指定概率
检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关
检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关
检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断结果是否一致; 例1 某种药物加化疗与单用某种药物治疗的两种处理方法,观察对某种癌症的疗效,结果见下表。(数据见cancer.sav);首先建立数据文件,如下。; 注意:由于上表给出的不是原始数据,而是频数表数据,应该进行预处理。;;;;;;结果分析;结果分析;连续性校正?2检验:
仅???用于四格表资料,在n40,所有期望频数均大于1,只有1/5单元格的期望频数大于1小于5时;
Fisher精确概率法:
在样本含量40或有格子的期望频数1的列联表,应该采用该法;
似然比?2检验:
当n40,最小期望频数5时,结论与Pearson ?2基本一致;;配对卡方检验;配对卡方检验; 例2 某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结果见下表,问两种方法的检测结果有无差别?(数据见McNemar.sav);首先建立数据文件,如下。;配对卡方检验;在此选入频数变量即可进行下一步的分析。;配对卡方检验;;配对卡方检验;;在Pearson 卡方检验中,对行变量和列变量的相关性作检验,其中行变量和列变量是一个事物的两个不同属性。
在实际中,还有一种列联表,其行变量和列变量反映的是一个事物的同一属性的相同水平,只是对该属性各水平的区分方法不同。其特征是:行的数目和列的数目总是相同的。如果希望检验这两种区分同一属性的方法给出的结果是否一致,则不应当使用Pearson ?2检验,而应该采用Kappa一致性检验对两种方法一致程度进行评价。;; 一般认为,
当Kappa≥0.75时,表明两者一致性较好;
0.75Kappa ≥0.4时,表明一致性一般;
Kappa0.4时,表明两者一致性较差。; 注意:
Kappa检验会利用列联表的全部信息,而McNemar 检验只会利用非主对角线单元格上的信息。因此,对于一致性较好,即绝大多数数据都在主对角线的大样本列联表,McNemar检验可能会失去实用价值。;两分类变量间关联程度的度量;两分类变量间关联程度的度量;两分类变量间关联程度的度量;;两分类变量间关联程度的度量;选中可得到RR值;两分类变量间关联程度的度量;两分类变量间关联程度的度量;两分类变量间关联程度的度量; 例4 某研究人员对3家医院的卫生服务情况进行了调查,现希望分析寻求就诊和性别之间有无联系。(数据见cmh.sav);分层卡方检验;;分层卡方检验;分层卡方检验;; 1.卡方检验是以?2 分布为基础的一种常用假设检验方法,常用作计数资料的显著性检验。
其基本思想是:首先假设观察频数与期望频数没有差别。而统计量?2 值表示观察值与理论值之间的偏离程度。当n 比较大时,?2 统计量近似服从k-1个自由度的?2 分布。在自由度固定时,每个?2 值与一个概率值相对应,此概率即为在H0假设成立的
文档评论(0)