- 1、本文档共66页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
7第七章分布拟合检验及秩和检验资料.ppt
分布拟合检验 前面介绍的各种检验法都是在总体分布形式为已知的前提下进行讨论的.在实际问题中, 有时不知道总体服从什么类型的分布需要根据样本来检验关于分布的假设. 本节介绍χ2拟合检验法和专用于检验分布是否为正态的 偏度,峰度检验法. χ2拟合检验法 在总体未知时, 根据样本X1,X2,...,Xn来检验关于总体分布的假设 H0:总体X的分布函数为F(x), H1:总体X的分布函数不是F(x), (6.1)若总体X为离散型则(6.1)中的H0相当于H0:总体X的分布律为P(X=ti)=pi,i=1,2,.... (6.2)若总体X为连续型, 则(6.1)中的H0相当于 H0:总体X的概率密度为f(x) (6.3) 采用形如 的统计量来度量样本与H0中所假设的分布的吻合程度, 其中hi(i=1,2,...,k)是给定的常数. 皮尔逊证明, 如果选取hi=n/pi(i=1,2,...,k)则(6.4)式定义的统计量近似服从c2(k-1)分布. (n?50) 若H0中所假设的X的分布函数F(x)中包含未知参数先利用样本求出未知参数的最大似然估计(在H0下), 以估计值作为参数值, 然后根据H0中所假设的分布函数, 求出pi的估计值 作为检验统计量.近似地服从c2(k-r-1)分布, 其中r是被估计的参数的个数. 当H0为真时c2不应太大如c2过分大就拒绝H0, 拒绝域的形式为 c2?G (G为正常数).对于给定的显著性水平a, 确定G使 即当样本观察值使(6.5)或(6.6)的c2值有 c2拟合检验法使用的注意事项 例1 在一实验中, 每隔一定时间观察一次由某种铀所放射的到达计数器上的a粒子数X, 共观察了100次, 得结果如下表所示: 解 因在H0中参数l未具体给出, 所以先估计l, 下, X所有可能取的值为W={0,1,2,...}, 将W分成前表所示的两两不相交子集A1,A2,...,A12, 则P{X=i}有估计 c2拟合检验计算表 并组后k=8, 但因在计算概率时, 估计了一个参数l, 故r=1, c2的自由度为8-1-1=6. 现在c2=106.281-100=6.28112.592 例2 1965年1月1日至1971年2月9日共2231天中, 全世界记录到里氏震级4级和4级以上地震计162次, 统计如下:(x-相继两次地震间隔天数, f-出现的频数) 解 按题意需检验假设:H0: X的概率密度为 H0中的参数q未给出, 先由最大似然估计法 若H0为真, X的分布函数的估计为 由上式可得概率pi=P(Ai)的估计: 例2的c2检验计算表 c2=163.5633-162=1.5633, 故在水平0.05下接受H0, 认为X服从指数分布. 例3 下面列出64个伊特拉斯坎人男子的头颅的最大宽度(mm), 检验这些数据是否来自正态总体(取a=0.1) 解 为了粗略了解这些数据的分布情况, 我们先根据所给数据画出直方图.上述数据的最小值, 最大值分别为126,158, 即所有数据落在区间[126,158]上, 现取区间[124.5, 159.5], 它能覆盖区间[126,158]. 将此区间等分为7个小区间, 小区间的长度记为D, D=(159.5-124.5)/7=5. D称为组距. 小区间的端点称为组限. 数出落在每个小区间内的数据的频数fi, 算出频率fi/n(n=84, i=1,2,...,7). 列出下表: 绘出的直方图如下 从直方图看样本很象来自正态总体. 现作c2拟合检验如下. 即需检验假设H0: X的概率密度为 因H0未给出m,s2的数值, 需先估计m,s2, 由最大似然估计法得m,s2的估计值分别为 若H0为真, X的概率密度的估计为 按上式查标准正态分布函数表即可得概率P(Ai)的估计, 例如 例3的c2检验计算表 现在c2=87.67-84=3.67, 因为 故在水平0.1下接受H0, 即认为数据来自正态分布总体. 例4 一农场10年前在一鱼塘里按比例20:15:40:25投放了四种鱼:鲑鱼,鲈鱼,竹夹鱼和鲇鱼的鱼苗. 现在在鱼塘里获得一样本如下: 解 以X记鱼种类的序号, 按题意需检验假设:H0:X的分布律为 现在c2=611.14-600=11.14, k=4, r=0, 故拒绝H0, 认为各鱼类数量之比较10年前有显著改变. 偏度、峰度检验 -用于检验正态总体分布 随机变量X的偏度和峰度指的是X的标准化变量的三阶矩和四阶矩: 当X服从正态分布时, n1=0且n2=3. 设X1,X2,...,Xn是来自总体X的样本, 则n1
文档评论(0)