你真的会做方差分析?.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
你真的会做方差分析?

你真的会做方差分析? 如何快速简易判断数据的正态性? 冯国双小白学统计 数据的正态性始终是困扰临床医生的一个问题,对于定量资料而言,几乎所有方法的选择都跟正态性有关。很多临床医生都很崩溃:我想直接用t检验行不行啊?可惜,正态性检验就像一个绕不过去的门槛,你恨或愤怒,它都在那里,不声不响,不悲不喜。 不少人对正态性检验都有一定疑问,比如看下面这个图: 你觉得这个是正态分布吗?非常接近,遗憾的是,正态性检验结果显示,不能认为是正态分布(P=0.015)。为什么会这样?明明看起来很接近了,为什么正态性检验还提示说不能认为是正态分布? 首先要明确,正态性检验的原假设是“数据服从正态分布”,如果Plt;0.05,拒绝原假设,即不能认为“数据服从正态分布”。也就是说,它检验的是偏离正态的程度。跟普通检验一样,这种检验也是,数据越多,越容易拒绝原假设。也 就是说,同样的均值和标准差,当你有20个数据,可能是Pgt;0.05,而200个数据时,就成了Plt;0.05。 听起来有点不可思议,不是说,样本量越大,越容易将它看做是正态的吗?怎么现在反而颠倒过来了,样本量越大,越不满足正态分布了。 因为正态性检验中,看的是你的数据是不是完全正态的,只要有偏离,在样本量小的时候检验不出来,而样本量大的时候,轻微偏离就会检验出来。 所以,很多统计学家其实并不是很看重正态性检验,因为,太敏感了。容不得数据有一丁点的偏离,否则就要给你显著性结果。 那么我们实际中应该怎么办?其实正常情况下,很多统计学方法,比如t检验、方差分析,虽然说前提条件是满足正态性,但并不是非常苛刻。其实所谓的满足正态,不如说是“只要不是过于偏态”更合适。也就是说,只要数据不是偏态严重,正常情况下是可以用这些方法的。 下面给临床医生介绍几种简易的判断正态性的方法(统计专业人士请绕行): (1)根据均值和标准差。首先,分别计算均值和标准差,然后看一下数据中有百分之多少的人在均值±1个标准差、均值±2个标准差、均值±3个标准差之内。如果分别大概是68%、95%、99%左右,说明差不多是正态的。 比如,我有10个数: 均值为0.16,标准差是1.3,那么均值±1个标准差的范围大概是-1.14和 1.46,大约有7个位于这一范围(70%)。均值±1个标准差的范围大概是-2.44和2.76,大约有10个位于这一范围(100%)。比较接近68%、95%和99%,差不多可以认为是正态的。 (2)计算四分位数间距和标准差,如果四分位数间距/标准差的值大约在 1.35左右,可以认为满足正态分布。比如上面的10个数中,四分位数间距是 1.9,标准差是1.3,1.9/1.3大约为1.4左右,比较接近1.35,可以认为是正态的。 (3)通过几幅图来判断,最常用的图有箱式图、直方图、茎叶图、QQ图等。 箱式图、直方图和茎叶图的判断方式差不多,如果是正态的,箱式图、直方图和茎叶图应该都是大致对称分布。如下面两幅图: 箱式图提示,略有偏态,可能有几个异常值,在数值较大的一侧。直方图和茎叶图更明显一些,虽然似乎有点偏,但并不严重,总的来看仍然认为是正态的。 QQ图跟你平时聊天的QQ一点关系也没有。它是Quantile-Quantile的缩写,也就是分位数-分位数图。因为这个图中横坐标和纵坐标都利用了分位数,横坐标是正态分位数,纵坐标是实际数据的分位数。所以Q-Q图的思想就是比较理论分位数和实际分位数的差距,如果理论分位数和实际分位数没什么差别的话,图中所有的点应该都在一条直线上;如果差别大,那就会偏离直线比较大。 所以QQ图判断原则就是:如果大致呈一条左下至右上的直线,可以认为是正态的。如下图: 这个QQ图大致像是一条直线,差不多就行,不用太严格。所以可以认为是正态。 最后总结一下:对于正态性的判断,尽管有很多种检验方法,但这些方法都过于敏感,尤其大样本时候,轻微偏离一点,就会认为非正态。所以实际中没有必要非得根据这些检验方法来判断是否正态。 如果想快速判断,可以简单算四分位数间距和标准差,看一下二者比值是否在1.35左右。如果手头方便,可以随便用任何统计软件,绘制直方图、茎叶图、QQ图等。 可能还有人会说,那我如何在文章中交代呢?如果要写文章,必须提供正态性检验的话,给出一个箱式图是个比较不错的选择,既图示你的数据大小,而且告诉读者大致的数据分布情况。 。

文档评论(0)

sheppha + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5134022301000003

1亿VIP精品文档

相关文档