第十章卡方检验.doc

下载文档 降价啦

194
0
约6.79千字
约 13页
2017-02-08 发布于重庆
举报
版权申诉
保障服务

第十章卡方检验.doc

1、本文档共13页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第十章卡方检验

第十章检验第一节检验的原理一、检验的假设（一）分类相互排斥，互不包容检验中的分类必须相互排斥，这样每一个观测值就会被划分到一个类别或另一个类别之中。此外，分类必须互不包容，这样，就不会出现某一观测值同时划分到更多的类别当中去的情况。（二）观测值相互独立各个被试的观测值之间彼此独立，这是最基本的一个假定。如一个被试对某一品牌的选择对另一个被试的选择没有影响。当同一被试被划分到一个以上的类别中时，常常会违反这个假定。当讨论列联表时，独立性假定是指变量之间的相互独立。这种情况下，这种变量的独立性正在被检测。而观测值的独立性则是预先的一个假定。（三）期望次数的大小每一个单元格中的期望次数应该至少在5以上。一些更加谨慎的统计学家提出了更严格的标准，当自由度等于1时，在进行检验时，每一个单元格的期望次数至少不应低于10，这样才能保证检验的准确性。另外，在许多分类研究中会存在这样一种情况，如自由度很大，有几个类别的理论次数虽然很小，但在给以接受的标准范围内，只有一个类别的理论次数低于1。此时，一个简单的处理原则是设法使每一个类别的理论次数都不要低于1，分类中不超过20%的类别的理论次数可以小于5。在理论次数较小的特殊的四格表中，应运用一个精确的多项检验来避免使用近似的检验。二、检验的类别（一）配合度检验配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近，这种检验方法有时也称为无差假说检验。当对连续数据的正态性进行检验时，这种检验又可称为正态吻合性检验。（二）独立性检验独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是否具有独立性的问题。这种类型的检验适用于探讨两个变量之间是否具有关联（非独立）或无关（独立），如果再加入另一个变量的影响，即探讨三个变量之间关系时，就必须使用多维列联表分析方法。（三）同质性检验同质性检验的主要目的在于检定不同人群母总体在某一个变量的反应是否具有显著差异。当用同质性检验检测双样本在单一变量的分布情形，如果两样本没有差异，就可以说两个母总体是同质的，反之，则说这两个母总体是异质的。三、检验的基本公式是表示实测次数与理论次数（即期望次数）之间差异程度的指标，其基本数学定义是实测次数与期望次数之差的平方与期望次数的比率。检验就是检验实测次数与期望次数是否一致的统计方法。基本公式如下：其中表示实际观察次数，表示某理论次数。要求：5 四、小期望次数的连续性校正第一，单元格合并法。若有一格或多个单元格的期望次数小于5时，在配合研究目的情况下，可适当调整变量的分类方式，将部分单元格予以合并。第二，增加样本数。如果研究者无法改变变量的分类方式，又想获得有效样本，最佳的方法是直接增加样本数来提高期望次数。第三，去除样本法。如果样本无法增加，次数偏低的类别又不具有分析与研究价值时，可以将该类被试除去，但研究的结论不能推论到这些被除去的母总体中。第四，使用校正公式。在2×2的列联表检验中，若单元格的期望次数低于10但高于5，可使用耶茨校正(Yates’ correction for continuity)公式来加以校正。若期望次数低于5时，或样本总人数低于20时，则应使用费舍精确概率检验法(Fisher’s exact probability test)。当单元格内容牵涉到重复测量设计时（例如前后测设计），则可使用麦内玛检验（McNemar test)。第二节配合度检验配合度检验（goodness of fit test）主要用于检验单一变量的实际观察次数分布与某理论次数是否有差别。由于它检验的内容仅涉及一个因素多项分类的计数资料，故可以说是一种单因素检验（One-way test)。一、配合度检验的一般问题 1．建立假设：：在检验中，理论（或期望）次数的确定就取决于这种比例的假设。的临界值是在成立的条件下导出理论分布，并由公式计算出来的。若实际计算出的值大于理论上的临界值，即＞则说在的显著水平上拒绝。 2．自由度的确定原则自由度确定的一般原则是：以相互独立的类别数（或）减去所受的限制数，即在各种适合性检验中，如果理论次数只受到总和的限制，即受的限制，则自由度为在正态分布的适合性检验，因其除了受的限制以外，还受理论分布的均数和标准差两个未知参数的限制，即受到三个条件的限制，其自由度为 3．理论次数的计算规则一是数据分布有其理论概率为依据，这时的理论次数等于总次数乘以某种属性出现的概率（），即理论次数的计算，一般是根据某种理论，按一定的概率通过样本即实际观察次数计算。某种理论有经验概率，也有理论概率，如二项分布、正态分布等理论概率。二、配合度检验的应用