- 1、本文档共27页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
卡方检验 什么是卡方检验 对样本的频数分布所来自的总体分布是否服从某种理论分布或某种假设分布所作的假设检验,即根据样本的频数分布来推断总体的分布。 什么是卡方检验 卡方检验——研究变异的检验 对分类数据的频数进行分析的统计方法 对观测频数和理论的期望频数之间的比较 1.方差的卡方检验 关于单一方差的假设检验 检验一个随机样本是否来自一个具有特定方差的总体 假设总体近似服从正态分布 原假设为 检验统计量: 2.拟合优度检验 A.依据总体分布状况,计算出分类变量中各类别的期望频数,与分布的观察频数进行对比,判断期望频数与观察频数是否有显著差异。 2.拟合优度检验 卡方统计量形式为: 其中Oi是观测频数,Ei是期望频数,k是变量分组数。描述Oi与Ei的接近程度。二者越接近,卡方值越小;二者差异越大,卡方值越大。给定显著性水平时,将卡方值与临界值比较,做出是否拒绝原假设的决策。 2.拟合优度检验 B.表征实验分布,即用卡方统计量检验实验分布是否服从某一理论分布(正态、二项等) 步骤:1.将总体X的取值范围分成k个互不重迭的小区间 2.计算落入第i个小区间的样本值的观测频数 3. 根据所假设的理论分布, 算出总体X的值落入每个小区间的概率p,于是np就是落入该区间的样本值的理论频数 4.计算卡方统计量 5.与临界值进行比较,进行决策 2.拟合优度检验 H0:实验分布服从某一理论分布 检验统计量为: 其中自由度为v=k-1-c,k是分组数,c是按样本数据所算出的总体参数估计值的数目 一般进行右侧检验,即拒绝条件为: 3.比率的卡方检验 按照公式8.16可以推出: 用于两组比率差的比较 检验统计量为: 其中期望频数利用两个样本的合并概率计算出 卡方统计量的连续性矫正 当自由度为1时,由样本数据计算的卡方值存在偏大的趋势,此时要对卡方统计量进行连续性矫正 矫正规则: 1. 0(Oi-Ei)≤0.5,则舍弃小数部分 2. (Oi-Ei)0.5或者(Oi-Ei)=0,则将小数部分减小至0.5 4.列联表 交叉分类的频数分布表 列联表是把一组事物按两个标准排列而编制,一个为横行Row,一个为纵列Column,每个标准又可分为若干类 卡方检验可以用于检验这两个标准是否存在某种关系,又称列联检验 检验统计量: 一个2×2的列联表的结构 例8.18 是否接种疫苗与患病程度是否相关 5.多组观测值方差齐性的卡方检验——Bartlett检验 方差齐性——检验多组总体的方差的差异是否不显著 检验统计量: 其中:v为总自由度, 为合并方差,vi为第i组观测值的自由度(vi2),Si为第i组观测值的标准差 拒绝原假设的条件为: F检验 检验两组观测值的方差的齐性 原假设: 检验统计量: 拒绝条件: 二、χ2检验与连续型资料假设检验的区别 对总体参数或几个总体参数之差 不是对总体参数的检验,而是对总体分布的假设检验 正态分布 总体分布是未知的 连续型资料 离散型资料 检验对象 总体 数据资料 连续型资料假设检验 χ2 检验 适合性检验 是指对样本的理论数先通过一定的理论分布推算出来,然后用实际观测值与理论数相比较,从而得出实际观测值与理论数之间是否吻合。 三、χ2 检验的用途 是指研究两个或两个以上的计数资料或属性资料之间是相互独立的或者是相互联系的假设检验,通过假设所观测的各属性之间没有关联,然后证明这种无关联的假设是否成立。 独立性检验 三、χ2 检验的用途 样本方差 假设的总体方差 红花豌豆与白花豌豆杂交F2花色分离数据 929 929 合计 696.75 232.25 705 224 红色 白色 理论值(E) 观察值(O) 花色 要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度;然后判断这一偏离程度是否属于抽样误差,即进行显著性检验。 判断实际观测值与理论值偏离的程度,最简单的办法是求出实际观测值与理论值的差数。 929 929 合计 +8.25 -8.25 696.75 232.25 705 224 红色 白色 O-E 理论值(E) 观察值(O) 花色 红花豌豆与白花豌豆杂交F2花色分离数据 由于差数之和正负相消,并不能反映实际观测值与理论值相差的大小。 0 为了避免正、负相抵消的问题,可将实际观测值与理论值的差数平方后再相加,也就是计算: ∑(O-E)2 O--实际观察的频数 E--无效假设下的期望频数 红花豌豆与白花豌豆杂交F2花色分离数据 0 929 929 合计 68.0625 68.0625 +8.25 -8.25 696.75 232.25 705 224 红色 白
文档评论(0)