统计学概念和方法-第7章.ppt

下载文档

2
0
约5.43千字
约 35页
2017-05-28 发布于北京
举报
版权申诉
保障服务

统计学概念和方法-第7章.ppt

1、本文档共35页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

第七章假设检验数学与信息科学学院王坤 TELfellowang@163.com 主要内容作为一个问题的假设：备择假设、回答假设时的错误怎样回答零假设所提出的问题：p值假设检验的机制拒绝或接受零假设显著水平双边检验假设检验和构造置信区间不拒绝零假设意味着什么 Excel2007在假设检验方面提供的功能小结问题统计推断包括估计和假设检验。估计的任务是根据样本寻找总体参数值及其范围。那么，这样估计的把握性有多大呢？假设检验的兴趣是对任意一个有关未知分布的假设。假设检验又分为参数检验和非参数检验。参数检验考虑总体参数是否等于某个特定的值。非参数检验是考虑利用子样拟合总体分布。本章只介绍参数检验。例 1988年7月28日的纽约时报上刊登了一篇关于人们地理知识的文章。这篇文章描述了一个调查公司的研究结果。研究者们从一些国家抽取许多成年人并请他们鉴别在一个地图上的16个地方，然后把每个人答对的个数加起来。四个国家的样本中答对的个数的均值为美国 6.9 墨西哥 8.2 英国 9.0 法国 9.2 上述结果是一个样本均值的情况，可以轻易获得样本均值差。那么，总体均值是否有差异呢？ 7.1作为一个问题的假设在上述问题中，来自墨西哥和美国的总体均值差异是否为零？零假设 (原假设）墨西哥与美国的样本均值差为8.2-6.8=1.3，这个值是否超出样本抽样随机性解释范围？为此，我们可以假设总体均值相等，即两个总体的均值之差为零。这就是统计学中的零假设(null hypothesis）。在这个例子里，零假设就是问这两个总体均值之差是否等于零。记μm为墨西哥的总体均值，μu为美国的总体均值。那么零假设可以写成： H0： μm- μu=0 H代表假设，下标0表明是零假设。“零”的意思是假设内容的差异为零。注：希腊字母代表总体参数。零假设就是提出一个参数是否等于某一个特殊值。形式上，零假设写成： H0：参数=值备择假设零假设逻辑上的反面假设是“两个参数的差异不为零”，这种反面假设称为备择假设(alternative hypothesis)。上述例子中，备择假设为： H1:μm- μu≠0 显然，零假设H0与备择假设H1不相容。如果样本数据能证明零假设提出的问题应该否定，那么我们就拒绝零假设H0 ，而倾向于备择假设H1。回答假设时的错误犯两类错误的概率当然是越小越好，但是当样本容量 n 固定时, α , β 不能同时都小，即α 变小时, β 就变大；而 β 变小时，α 就变大。只有当样本容量 n 增大时，才有可能使两者同时变小。在实际应用中, 人们常遵循 Neyman-Pearson 原则：在控制犯第一类错误的概率α 的条件下，寻找拒绝域（或检验法则），使得犯第二类错误的概率β 达到最小。不过，基于 Neyman-Pearson 原则的最优检验不一定存在。思考一个人因为杀人而受审理。他实际上是有罪的，但法官确认他为无罪。这里零假设是：一个人是无罪的除非你能证明他有罪。则此案中，法官犯的是第一类错误还是第二类错误？法官犯另外一类错误的情形是怎样的？ 7.2怎样回答零假设所提出的问题为了确定1.3这么大的差异是否属于一类不常见的数据集合，我们计算当总体差别为零时，得到一个大于等于1.3的样本均值之差的概率。这个概率称为p值。当p值很小，以至于几乎不可能在零假设正确时出现目前的样本数据时，我们就拒绝零假设。p值越小，拒绝零假设的理由就越充分。著名统计学家R.Fisher把0.05作为标准，即0.05或者比0.05小的概率被认为是小概率事件。 p值 p值（p value）就是当原假设H0为真时所得到的样本观察结果或更极端结果出现的概率。如果p值很小，说明这种情况的发生的概率很小，而如果出现了，根据小概率原理，我们就有理由拒绝原假设，p值越小，我们拒绝原假设的理由越充分。总之，p值越小，表明结果越显著。通常，如果p值0.05，说明样本结果是统计显著的，拒绝H0 。如果p值0.05，说明结果更倾向于接受假定H0 。这里的0.05称为显著水平。假设检验的机制为了求得p值，我们需要把观测到的样本均值之差转换为t=4.25。（这个过程好比把华氏度转换为摄氏度）这里美国的样本包含了1600个观测，墨西哥的样本有1200个观测。这个例子里，对于观测数大于2000的样本来说，t值大于等于4.25的概率是0.00001