[理学]SPSS的非参数检验2.ppt

  1. 1、本文档共36页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[理学]SPSS的非参数检验2

第七章 非参数检验 7.1 关于非参数的一些常识 经典统计的多数检验都假定了总体的背景分布。 但在总体未知时,如果假定的总体和真实总体不符,那么就不适宜用通常的检验。 这时如果利用传统的假定分布已知的检验,就会产生错误甚至灾难。 非参数检验(nonparametric testing)是在总体分布未知或知之甚少的情况下,利用样本数据对总体分布形态等进行推断的方法。 非参数检验在总体分布未知时有很大的优越性。它总是比传统检验安全。 在总体分布形式已知时,非参数检验不如传统方法效率高。这是因为非参数方法利用的信息要少些。往往在传统方法可以拒绝零假设的情况,非参数检验无法拒绝。 但非参数统计在总体未知时效率要比传统方法要高,有时要高很多。是否用非参数统计方法,要根据对总体分布的了解程度来确定。? 7.2单样本的非参数检验 7.2.1总体分布的卡方检验 卡方检验可以根据样本数据,推断总体分布与期望分布或某一理论分布是否存在显著差异,通常适于多项分类值总体分布的分析。 H0: 样本来自的总体分布与期望分布或某一理论分布无显著差异。 理论依据 如果从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在X的k个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k趋于无穷时近似服从卡方分布。 7.2.2二项分布检验 现实中很多数据的取值是二值的,例如产品分为合格和不合格等等。 将这样的二值分别用0和1表示,如进行n次相同的实验,则出现两类(1或0)的次数可以用离散型随机变量X表示。如X值为1的概率为p,则X为0的概率q为1-p,形成二项分布。 通过样本数据检验样本来自的总体是否服从指定的概率值为p的二项分布。 H0: 样本来自的总体与指定的二项分布无显著差异。 7.2.3单样本K-S检验 利用样本数据推断样本来自的总体是否服从某一理论分布。适用于探索连续型随机变量的分布。 H0: 样本来自的总体与指定的理论分布(正态分布、均匀分布、指数分布和泊松分布等)无显著差异。 例子 收集储户调查的样本数据,分析储户总体一次存(取)款金额的分布是否服从正态分布。 警告 经常有人在Kolmogorov-Smirnov检验中,当检验不能拒绝总体分布为某分布时,来“接受”或“证明”该样本来自该分布。这是错误的。 比如我们有由1、2、3、4、5五个数目组成的数据,我们分别检验该数据是否是正态分布、均匀分布、Poisson分布或指数分布。结果归纳为下表 7.2.4 关于随机性的游程检验(run test) 游程检验方法是检验一个取两个值的变量的这两个值的出现是否是随机的。假定下面是由0和1组成的一个这种变量的样本: 0 0 0 0 1 1 1 1 1 1 0 0 1 0 1 1 1 0 0 0 0 0 0 0 0 其中相同的0(或相同的1)在一起称为一个游程(单独的0或1也算)。 这个数据中有4个0组成的游程和3个1组成的游程。一共是R=7个游程。其中0的个数为m=15,而1的个数为n=10。 关于随机性的游程检验(run test) 出现0和1的的这样一个过程可以看成是参数为某未知p的Bernoulli试验。但在给定了m和n之后,在0和1的出现是随机的零假设之下,R的条件分布就和这个参数无关了。根据初等概率论,R的分布可以写成(令N=m+n) 关于随机性的游程检验(run test) 于是就可以算出在零假设下有关R的概率,以及进行有关的检验了。利用上面公式可进行精确检验;也可以利用大样本的渐近分布和利用Monte Carlo方法进行检验。 当然,游程检验并不仅仅用于只取两个值的变量,它还可以用于某个连续变量的取值小于某个值及大于该值的个数(类似于0和1的个数)是否随机的问题。看下面例子。 关于随机性的游程检验(run test) 例 (run2.sav): 从某装瓶机出来的30盒化妆品的重量如下(单位克) 71.6 71.0 71.8 70.3 70.5 72.9 71.0 71.0 70.1 71.8 71.9 70.3 70.9 69.3 71.2 67.3 67.6 67.7 67.6 68.1 68.0 67.5 69.8 67.5 69.7 70.0 69.1 70.4 71.0 69.9 为了看该装瓶机是否工作正常,首先需要验证是否大于和小于中位数的个数是否是随机的(零假设为这种个数的出现是随机的)。 如果把小于中位数的记为0,否则记为1,上面数据变成下面的0-1序列 1 1 1 1 1 1 1 1 0 1 1 1 1 0 1 0 0 0 0 0 0 0

文档评论(0)

skvdnd51 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档