- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
节分布拟合检验
第五节 分布拟合检验
本章前四节所介绍的各种检验法, 是在总体分布类型已知的情况下, 对其中的未知参数进行检验, 这类统计检验法统称为参数检验. 在实际问题中, 有时我们并不能确切预知总体服从何种分布, 这时就需要根据来自总体的样本对总体的分布进行推断, 以判断总体服从何种分布. 这类统计检验称为非参数检验. 解决这类问题的工具之一是英国统计学家K. 皮尔逊在1900年发表的一篇文章中引进的——检验法,不少人把此项工作视为近代统计学的开端。
内容分布图示
★ 引言 ★ 引例
★ 检验法的基本思想
★ 检验法的基本原理和步骤
★ 检验法-总体含未知参数的情形
★ 例1 ★ 例2 ★ 例3
★ 例4 ★ 例5
★ 内容小结 ★ 课堂练习
★ 习题7-5
内容要点:
一、引例
例如, 从1500到1931年的432年间, 每年爆发战争的次数可以看作一个随即变量, 据统计, 这432年间共爆发了299次战争, 具体数据如下:
战争次数X
发生X次战争的年数
0
223
1
142
2
48
3
15
4
4
根据所学知识和经验, 每年爆发战争的次数X, 可以用一个泊松随机变量来近似描述, 即可以假设每年爆发战争次数分布X近似泊松分布. 于是问题归结为:如何利用上述数据检验X服从泊松分布的假设.
二、检验法的基本思想
检验法是在总体X的分布未知时, 根据来自总体的样本, 检验总体分布的假设的一种检验方法. 具体进行检验时,先提出原假设:
: 总体X的分布函数为
然后根据样本的经验分布和所假设的理论分布之间的吻合程度来决定是否接受原假设.
这种检验通常称作拟合优度检验. 它是一种非参数检验. 一般地, 我们总是根据样本观察值用直方图和经验分布函数, 推断出总体可能服从的分布, 然后作检验.
三、检验法的基本原理和步骤
1) 提出原假设:
:总体X的分布函数为
如果总体分布为离散型, 则假设具体为
:总体X的分布律为
如果总体分布为连续型, 则假设具体为
:总体X的概率密度函数
2) 将总体X的取值范围分成k个互不相交的小区间, 记为,如可取为
其中可取,可取;区间的划分视具体情况而定,使每个小区间所含样本值个数不小于5,而区间个数不要太大也不要太小;
3) 把落入第个小区间的样本值的个数记作,称为组频数,所有组频数之和等于样本容量;
4) 当为真时,根据所假设的总体理论分布,可算出总
体X的值落入第个小区间的概率, 于是就是落入第个小区间的样本值的理论频数.
5) 当为真时, 次试验中样本值落入第个小区间的频率与概率应很接近, 当不真时, 则与相差较大. 基于这种思想, 皮尔逊引进如下检验统计量 并证明了下列结论.
定理1 当n充分大时, 则统计量近似服从分布.
根据该定理, 对给定的显著性水平, 确定值, 使
,
查分布表得, 所以拒绝域为
若由所给的样本值算得统计量的实测值落入拒绝域, 则拒绝原假设, 否则就认为差异不显著而接受原假设.
四、总体含未知参数的情形
在对总体分布的假设检验中, 有时只知道总体X的分布函数的形式, 但其中还含有未知参数, 即分布函数为
其中为未知参数. 设是取自总体X的样本, 现要用此样本来检验假设:
:总体X的分布函数为
此类情况可按如下步骤进行检验:
1) 利用样本,求出的最大似然估计,
2) 在中用代替则就变成完全已知的分布函数
3) 计算时, 利用 计算的估计值
4) 计算要检验的统计量
,
当n充分大时,统计量近似服从分布;
5) 对给定的显著性水平, 得拒绝域
注: 在使用皮尔逊检验法时,要求,以及每个理论频数,否则应适当地合并相邻的小区间,使满足要求.
例题选讲:
例1(讲义例1) 将一颗骰子掷120次, 所得数据见表7-5-2
问这颗骰子是否均匀、对称? (取)
解 若这颗骰子是均匀的、对称的, 则1~6点中每点出现的可能性相同, 都为1/6. 如果用表示第点出现 则待检假设
在成立的条件下, 理论概率 由得频率
计算结果如下表.
1
23
1/6
20
9/20
2
26
1/6
20
36/20
3
21
1/6
20
1/20
4
20
1/6
20
0
5
15
1/6
20
25/20
6
15
1/6
20
25/20
合计
120
4.8
因此分布不含未知参数, 又 查表得
由上表, 知 故接受 认为这颗骰子是均匀对称的.
例2(讲义例2)检验引例中对战争次数提出的假设服从参数为的泊松分布.
根据观察结果, 得参数的最大似然估计为 按参数为0.69的泊松分布, 计算事件的概率
文档评论(0)