卡方检验.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
卡方检验

第16章 无序分类变量的统计推断——卡方检验 通过前面的介绍可以知道,变量可以被分为连续性变量(定距、定比)和分类变量,后者又被细分为有序、无序变量两种。对于各组所在总体的定量变量(即连续性变量)的平均水平,可以使用t检验和方差分析方法进行比较,秩和检验则用于比较各组所在总体为有序分类变量的 分布情况是否相同。这里将要介绍的卡方检验主要用于无序分类变量的统计推断,是在应用的程度上可以和t检验相媲美的另一种常用检验方法。 连续变量 两组 t检验 多组 方差分析 分类变量 有序 秩和检验 无序 卡方检验 16.1 卡方检验概述 16.1.1 卡方检验的基本原理 1. 卡方检验的基本思想 卡方检验是以χ2分布为基础的一种常用假设检验方法, 它的无效假设为H0是:观察频数与期望频数没有差异。 卡方检验的基本思想是:首先假设H0成立,基于此前提计算出χ2值,它表示观察值与理论值之间的偏离程度。根据χ2分布及自由度可以确H0假设成立的情况下获得当前统计量及更极端情况的概率P。如果P值很小,说明观察值与理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著差异;否则不能拒绝无效假设,尚不能认为样本所代表的实际情况和理论假设有差别。 2.卡方值的计算与意义 见复印资料 柯惠新等人编著《调查研究中的统计分析法》 卡方统计量,由于它最初是由英国统计学家Karl Pearson 在1900年首次提出的,因此也称之为Pearson χ2。 由卡方的计算公式可知,当观察频数与期望频数完全一致时,χ2值为0;观察频数与期望频数越接近,两者之间的差异越小,χ2值越小;反之,观察频数与期望频数差别越大,两者之间的差异越大,χ2值越大。换言之,大的χ2值表明观察频数远离期望频数,即表明远离假设。 3.卡方检验的样本量要求 一般认为,对于卡方检验中的每一个单元格,要求其最小期望频数均大于1,且至少有4/5的单元格期望频数大于5,此时使用卡方分布计算出的概率值才是准确的。 16.1.2 卡方检验的用途 卡方检验最常间的用途就是考察无序分类变量各水平在两组或多组之间的分布是否一致。实际上,除了这个用途之外,卡方检验还有更广泛的应用。具体而言,其用途主要包括以下几个方面。 (1)检验某个连续变量的分布是否与某种理论分布相一致。如是否符合正态分布、是否服从均匀分布、是否服从Poisson分布等。 (2)检验某个分类变量出现的概率是否等于指定概率。如在36选7的彩票抽奖中,每个数字出现的概率是否各为1/36;掷硬币时,正反两面出现的概率是否均为0.5。 (3)检验某两个分类变量是否相互独立。如吸烟(二分类变量:是、否)是否与呼吸道疾病(二分类变量:是、否)有关;产品原料种类(多分类变量)是否与产品合格(二分类变量)有关。 (4)检验控制某种或某几种分类因素的作用以后,另两个分类变量是否相互独立。如在上例中,控制性别、年龄因素影响以后,吸烟是否和呼吸道疾病有关;控制产品加工工艺的影响后,产品原料类别是否与产品合格有关。 (5)检验某两种方法的结果是否一致。如采用两种诊断方法对同一批人进行诊断,其诊断结果是否一致;采用两种方法对客户进行价值类别预测,预测结果是否一致。 16.1.3 SPSS中的相应功能 1. 非参数分布检验中的卡方检验 准确地说,这里提供的就是检验某个分类变量各类的出现概率是否等于指定概率的分布检验。 2. 交叉表过程 主要用于针对两个/多个分类变量的交叉表进行其关联程度的卡方检验,并可进一步计算出关联程度指标等,上面提到的卡方检验用途中的后三项都可以在该过程中实现,而人们一般所说的卡方检验也就是指该过程中的相应功能。 --单样本案例:考察抽样数据的性别分布 --两样本案例:不同收入级别家庭的轿车拥有率比较 --两分类变量间的关联程度的度量 --一致性检验与配对卡方检验 --分层卡方检验 16.2 单样本案例:考察抽样数据的性别分布 从已知的样本数据出发,来判断总体各取值水平出现的概率是否与已知概率相符,即该样本是否的确来自已知总体的分布。这就是本节所说的单样本概率与总体率的比较,也有人称它为拟合问题,在统计学中可以利用(单样本)卡方检验来回答此问题。 在实践工作中,有许多单样本率与总体率进行比较的例子。如骰子是否公平,检验各面出现的概率是否各等于1/6;检验彩票中奖号码的分布是否均匀分布,以检验彩票开奖是否作弊;国家人口老龄化问题是否更严重了;某产品的市场占有份额是否较以前更大;某病的发病率是否较前降低等。 16.2.1 案例分析 例16.1 以卡方检验考察2007年4月的性别分布是否均衡。 “分析”——“非参数检验”——“卡方”菜单项 卡方检验 S2. 性别 观察数 期望数 残差

文档评论(0)

allap + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档