《非参数假设检验》第四次课.ppt

  1. 1、本文档共83页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
非参数假设检验; 非参数检验是相对于参数检验而言的,这两种检验方法在实际中都有广泛的应用,但它们有着不同的数理统计原理和应用场合。 在统计学的发展过程中,最先出现的推断统计方法都对样本所属总体的性质作出若干假设,即对总体的分布形状作某些限定,例如Z检验、t检验,假设样本的总体分布加以某些限定,把所要推断的总体数字特征看作未知的“参数”进行推断,称之为参数统计方法(Parameter statistical methods)或限定分布统计方法(distribution-specified statistical methods),基于此所做的假设检验就称为参数检验(Parametric test)。常用的检验如t检验、Z检验、F检验等都是参数检验。;参数检验只有在关于总体分布的假设成立时,所得出的结论才是正确的,所以它在很多场合不便应用,于是统计学家发展了许多对总体不作太多或严格限定的统计推断方法,这些方法一般不涉及总体参数的假设,与之相对应的统计方法通常称为非参数统计(Nonparametric statistics)或自由分布统计方法(Distribution-free statiscal methods),基于此所做的假设检验则称为非参数检验(Nonparametric test)或自由分布统计检验(Distribution-free statistical test)。非参数检验的前提假设比参数检验方法少很多,也容易满足,适用于已知信息相对较少的数据资料,而且它的计算方法也简便易行。 ;对于多数参数检验方法,都有一种或几种相对应的非参数检验方法,如下表所示。 参数检验与非参数检验方法的对应表;非参数检验的缺点 ;与参数检验方法对比,非参数检验方法具有以下优点: 检验条件宽松,适应性强。参数检验假定总体分布为正态、近似正态或以正态分布为基础而构造的t分布或 分布;非参数检验不受这些条件的限制,弥补了参数检验的不足,对于非正态的、方差不等的以及分布形状未知的数据都适用。 检验方法灵活,用途广泛。非参数检验不但可以应用与定距、定比等连续变量的检验,而且适用于定类、定序等分类变量的检验。对于那些不能直接进行四则运算的定类数据和定序数据,运用符号检验、符号秩检验都能起到好的效果。 非参数检验的计算相对简单,易于理解。由于非参数检验更多地采用计数的方法,其过程及结果都可以被直观地理解,为使用者所接受。 ;一个总体分布的非参数假设检验 ;配对样本非参数检验;一个总体分布的检验; P-P正态概率分布图(Graphs P-P);半正态分布(Half-normal);Blom’s方法:使用公式:; 若与某个概率分布的统计图一致,即被检验的数据符合所指定的分布,则代表个案的点簇在一条直线上。; 总体分布的卡方检验的原理:如果从一个随机变量X中随机抽取若干个观察样本,这些观察样本落在X的K个互不相交的子集中的观察频数服从一个多项分布,该多项分布当K趋于无穷时,就近似服从X的总体分布。; 例题:某地一周内每日患忧郁症的人数如表所示,请检验一周内每日人们忧郁的数是否满足1:1:2:2:1:1:1。; 用于选择计算非参数检验统计量对应的P值的方法。SPSS提供了3种计算P值的方法: Asymptotic only:渐进性的显著性检验,适合于样本服从渐进分布或较大样本。 Monte Carlo:不依赖渐进性方法估测精确显著性,这种方法在数据不满足渐进性分布,而且样本数据过大以致不能计算精确显著性时特别有效。 Exact:精确计算法,即准确计算观测结果的统计概率。计算量较大,适用于小样本。; 卡方检验要求样本量是充分大的,使用时建议样本容量应该不小于30,同时每个单元中的期望频数不能太小,如果有类别的频数小于5,则建议将它与相邻的类别合并,如果有20%的单元期望频数都小于5,就不能再使用卡方检验了。; 练习:赛马比赛时,任一马的起点位置是起跑线上所指定的标杆位置。现有8匹马的比赛,位置1是内侧最靠近栏杆的跑道,位置8是外侧离栏杆最远的跑道,下表是某赛马在一个月内某特定圆形跑道上的纪录,并且按照起点的标杆位置分类。试检验起点标杆位置对赛马结果的影响。; 二项分布检验的基本思想:根据搜集到的样本数据,推断总体分布是否服从某个指定的二项分布。; 练习:某地某一时期内出生35名婴儿,其中女孩儿19名(Sex=0),男孩儿16名(Sex=1)。问,该地区出生婴儿的性别比例与通常的男女性别比例(总体概率约为0.5)是否不同?数据如下表所示: ;;;单样本变量值的随机性检验(游程检验);例题:某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为“1”,对非发病的住

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档