网站大量收购独家精品文档,联系QQ:2885784924

2025年【数据分析】统计学中p值的含义和显著差异性分析-小马哥的日志-网易.pdfVIP

2025年【数据分析】统计学中p值的含义和显著差异性分析-小马哥的日志-网易.pdf

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

穷则独善其身,达则兼善天下。——《孟子》

【数据分析】统计学中p值的含义和显著差异性分析-小马哥的

日志-网易博客

【数据分析】统计学中p值的含义和显著差异性分析

数据分析2025-03-0421:04:43阅读629评论0字号:大中小

这个社会是残酷的,刚来公司,很多的职业技能尚不具备,但还

是要硬着头皮答应经理“苛刻”的要求,无论实验的过程多么难,结

果的可预测性多么小,我都会回答“OK!这不是打脸充胖子,也不是

要面子,这就是职场,你不学习是不行的!即使有些东西你从来没有

遇到过,甚至没有听说过,你也要因为需要去理解它,掌握它!你比

别人掌握的多,你就会慢慢变得很牛气,就会变得有价值,变得不可

或缺!这就是职场最需要的!今天就学习一下P值的统计学意义!

(当我作出别人都很羡慕的图表时,我的心情是很愉悦的,同样地,

当我在对一组数据头头是道的分析时,从别人的眼神中,我读出了

“崇拜”)。

统计学意义(p值)(这是经理每次争论的焦点)

结果的统计学意义是结果真实程度(能够代表总体)的一种估计

方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们

越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值

是将观察结果认为有效即具有总体代表性的犯错概率。如p=0.05提示

样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意

变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实

验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不

是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,

当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统

计学效力有关。)在许多研究领域,0.05的p值通常被认为是可接受

错误的边界水平。

如何判定结果具有真实的显著性

在最后结论中判断什么样的显著性水平具有统计学意义,不可避

免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选

以家为家,以乡为乡,以国为国,以天下为天下。——《管子》

择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过

程中结果是先验性还是仅仅为均数之间的两两比较,依赖于总体数据

集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。

通常,许多的科学领域中产生p值的结果≤0.05被认为是统计学意义

的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果

0.05≥p0.01被认为是具有统计学意义,而0.01≥p≥0.001被认为具

有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判

断常规。

所有的检验统计都是正态分布的吗?

并不完全如此,但大多数检验都直接或间接与之有关,可以从正

态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要

求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多

观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特

征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变

量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。

这种条件下有两种方法:一是用替代的非参数检验(即无分布性检

验),但这种方法不方便,因为从它所提供的结论形式看,这种方法

统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况

下,通常还是可以使用基于正态分布前提下的检验。后

您可能关注的文档

文档评论(0)

132****8710 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档