网站大量收购独家精品文档,联系QQ:2885784924

概率论与数理统计第13讲第八章 假设检验.ppt

概率论与数理统计第13讲第八章 假设检验.ppt

  1. 1、本文档共70页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
概率论与数理统计第13讲第八章 假设检验

概率论与数理统计 第13讲 第八章 假设检验 §1 假设检验 统计推断的另一类重要问题是假设检验问题. 在总体的分布函数完全未知或只知其形式, 但不知道参数的情况, 为了推断总体的某些未知特性, 提出某些关于总体的假设. 例如, 提出总体服从泊松分布的假设, 又如, 对正态总体提出数学期望等于m0的假设等. 我们是要根据样本对所提出的假设作出是接受, 还是拒绝的决策. 假设检验是作出这一决策的过程. 例1 某车间用一台包装机包装葡萄糖. 包得的袋装糖重是一个随机变量, 它服从正态分布. 当机器正常时, 其均值为0.5公斤, 标准差为0.015公斤. 某日开工后为检验包装机是否正常, 随机地抽取它所包装的糖9袋, 称得净重为(公斤): 0.497, 0.506, 0.518, 0.524, 0.498, 0.511, 0.520, 0.515, 0.512 问机器是否正常? 以m,s分别表示这一天袋装糖重总体X的均值和标准差. 由于长期实践表明标准差比较稳定, 就设s=0.015. 于是X~N(m,0.0152), 这里m未知. 问题是根据样本值来判断m=0.5还是m?0.5. 为此, 我们提出两个相互对立的假设 H0:m=m0=0.5 和 H1:m?0.5. 然后给一个合理的法则, 利用已知样本作出是接受假设H0, 还是接收假设H1. 如果接受H0, 则认为机器工作正常,否则不正常. 由于要检验的假设涉及总体均值m, 故首先想到是否可借助样本均值`X这一统计量来进行判断. `X是m的无偏估计, 其观察值的大小在一定程度上反映m的大小. 如果假设H0为真, 则观察值`x与m0的偏差|`x-m0|一般不应太大. 若|`x-m|过分大, 就怀疑假设H0的正确性而拒 因此, 可适当选定一正数k,使当观察值`x满足 然而, 因为决策的依据是样本, 当实际上H0为真时仍可能做出拒绝H0的决策(这种可能性是无法消除的), 这是一种错误, 犯这种错误的概率记为 因无法排除犯这类错误的可能性, 因此自然希望将犯这类错误的概率控制在一定的限度之类. 即给出一个较小的数a(0a1), 使犯这类错误的概率不超过a, 即使得 P{当H0为真拒绝H0}?a. (1.1) 犯这类错误的概率最大为a, 令(1.1)式取等号, 态分布分位点的定义得: k=za/2. 因而, 若Z的观察值满足 则拒绝H0, 而若 例如, 在本例中取a=0.05, 则有k=z0.05/2=z0.025=1.96, 又已知n=9, s=0.015, 再由样本算得`x=0.511, 即有 于是拒绝H0, 认为这天包装机工作不正常. 上例中所采用的检验法则是符合实际推断原理的. 因通常a总是取得较小, 一般取a=0.01, 0.05. 因而若H0为真, 即当m=m0时, 断原理, 就可以认为, 如果H0为真, 则由一次试验得到的观察值`x, 满足不等式 上例中, 当样本容量固定时, 选定a后, 可确定 绝对值|z|大于等于k还是小于k来作出决策. 数k是检验上述假设的一个门槛值. 如果|z|?k, 则称`x与m0的差异是显著的, 这时拒绝H0; 反之, 如果|z|k, 则称`x与m0的差异是不显著的, 这时接受H0. 数a称为显著性水平, 上面关于`x与m0有无显著差异的判断是在显著性水平a之下作出的. 统计量Z称为检验统计量. 前面的检验问题常叙述成: 在显著性水平a下, 检验假设 H0:m=m0, H1:m?m0. (1.2) 也常说成在显著性水平a下, 针对H1, 检验H0. H0称为原假设或零假设, H1称为备择假设. 要进行的工作是, 根据样本, 按上述检验方法作出决策, 在H0与H1中择其一. 当检验统计量取某个区域C中的值时, 我们拒绝原假设H0, 则C称为拒绝域, 拒绝域的边界点称为临界点, 如上例中拒绝域为|z|?za/2, 而z=-za/2, z=za/2为临界点. 由于检验法则是根据样本作出的, 总有可能作出错误的决策. 如上面所说, 在假设H0实际上为真时, 可能犯拒绝H0的错误, 称这类弃真错误为第I类错误. 又当H0实际上不真时, 也有可能接受H0. 称这类取伪错误为第II类错误. 犯第II类错误的概率记为 一般来说, 当样本容量固定时, 若减少犯一类错误的概率, 则犯有另一类错误的概率往往增大. 一般来说, 总是控制第I类错误的概率, 使它不大于a, a的大小视具体情况而定, 通常a取0.1, 0.05, 0.01, 0.005等值. 这种只对犯第I类错误的概率加以控制, 而不考虑犯第II类错误的概率的检验, 称为显著性检验. 形如(1.2)式中的备择假设H1, 表示m1可能大于也可能小于m0, 称为双边备

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档