- 1、本文档共8页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
符号检验和Wilcoxon符号秩检验
在统计推断和假设检验中,传统的检验统计量都叫做参数检验,因为它们都依赖于确定的概率分布,这个分布带有一组自由的参数。参数检验被认为是依赖于分布假定的。通常情况下,我们对数据进行分析时,总是假定误差项服从正态分布,这是人们易于接受的事实,因为正态分布的原始出发点就是来自于误差分布,至于当样本相当大时,数据的正态近似,这是由于大样本理论所保证的。但有些资料不一定满足上述要求,或不能测量具体数值,其观察结果往往只有程度上的区别,如颜色的深浅、反应的强弱等,此时就不适用参数检验的方法,而只能用非参数统计方法(non-parametric statistical analysis)来处理。这种方法对数据来自的总体不作任何假设或仅作极少的假设,因此在实用中颇有价值,适用面很广。
单样本的符号检验
符号检验(sign test)是一种最简单的非参数检验方法。它是根据正、负号的个数来假设检验。首先需要将原始观察值按设定的规则,转换成正、负号,然后计数正、负号的个数作出检验。该检验可用于样本中位数和总体中位数的比较,数据的升降趋势的检验,特别适用于总体分布不服从正态分布或分布不明的配对资料,有时当配对比较的结果只能定性的表示,如试验前后比较结果为颜色从深变浅、程度从强变弱,成绩从一般变优秀,即不能获得具体数字,也可用符号检验,例如用正号表示颜色从深变浅,用负号表示颜色从浅变深。
用于配对资料时,符号检验的计算步骤为:首先定义成对数据指定正号或负号的规则,然后计数正号的个数及负号的个数,由于在具体比较配对资料时,可能存在配对资料的前后没有变化,或等于假设中的中位数,此时仅需要将这些观察值从资料中剔除,当然样本大小也随之减少,故修正样本大小。当样本较小时,应使用二项分布确切概率计算法,当样本较大时,常利用二项分布的正态近似。
小样本时的二项分布概率计算
当时,或的检验值由精确计算尺度二项分布的卷积获得。在比较配对资料试验前后有否变化,或增加或减小的假设检验时,如果我们定义试验后比试验前增加为正号,反之为负号,那么对于原假设:试验前后无变化来说,正号的个数和负号的个数可能性应当相等,即正号出现的概率=0.5,于是与均服从二项分布,对于太大的相应太小的,或者太大的相应太小的,都将拒绝接受原假设;对于原假设:试验后比试验前有增加来说,正号的个数大于负号的个数的可能性应该大,即正号出现的概率,对于太小的相应太大的,将拒绝接受原假设;对于原假设:试验后比试验前减小来说,正号的个数小于等于负号的个数的可能性应该大,即正号出现的概率,对于太大的相应太小的,将拒绝接受原假设。
例27.1有一种提高学生某种素质的训练,有人说它是无效的,有人说它是有效的,那么真实情况究竟应该是怎样的呢?随机地选取15名学生作为试验样本,在训练开始前做了一次测验,每个学生的素质按优、良、中、及、差打分,经过三个月训练后,再做一次测试对每个学生打分。数据见表27.1所示。我们将素质提高用正号表示,反之用负号表示,没有变化用0表示。显著性水平取0.1。
表27.1 训练前后的素质比较
学生编号 训练之前 训练之后 差异符号 1 中 优 + 2 及 良 + 3 良 中 - 4 差 中 + 5 良 良 0 6 中 优 + 7 差 及 + 8 良 优 + 9 中 差 - 10 差 中 + 11 中 优 + 12 及 良 + 13 中 及 - 14 中 优 + 15 差 中 + 从表27.1中15名学生训练前后的差异分析可得出:有14名学生有差异,其中=11,=3。1名学生无差异(学生编号为5),应该从分析中去掉,所以=15-1=14。假设检验为:
即训练之后学生素质没有提高。
即训练之后学生素质有提高。
由于试验的结果只有两种可能,正号或负号,对每一个学生试验出现正号的假定概率为=0.5,负号为1—=0.5,这样整个试验的概率是相同的,并且每一个试验是相互独立的。因此在=14次独立的试验中,正号出现的次数服从二项分布,见表27.2所示。
表27.2 二项分布的概率和累计概率n=14,p=0.5
正号出现的次数 正号出现的概率 累计概率 0 0.0001 0.0001 1 0.0009 0.0009 2 0.0056 0.0065 3 0.0222 0.0287 4 0.0611 0.0898 5 0.1222 0.2120 6 0.1833 0.3953 7 0.2095 0.6047 8 0.1833 0.7880 9 0.1222 0.9102 10 0.0611 0.9713 11 0.0222 0.9935 12 0.0056 0.9991 13 0.0009 0.9999 14
文档评论(0)