- 1、本文档共16页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
一对总体分布函数F〔x〕的假设检验
山东农业大学 概率论与数理统计 主讲人:程述汉 苏本堂 一、对总体分布函数F(x)的假设检验 二、对随机变量的独立性、相关性的假设检验 例如,1 . 考察某一产品的质量指标打算用正态分布模型 2. 考察一种元件的寿命打算用指数分布模型 3. 一个骰子是否是均匀的? 假设 H0:X~N(?, ?2) 假设 H0 :X服从参数为?的指数分布 假设 H0 :这个骰子是均匀的 这里主要介绍拟合优度检验(卡方检验法)。 H0: F(x)= F0(x), H1: F(x)≠ F0(x) §8.3 非参数假设检验 卡方检验(K. Pearson,拟合优度检验) 设 X为未知总体,(x1,x2,…,xn)为大样本(n≥50),欲检验 H0: F(x)= F0(x), H1: F(x)≠ F0(x) 把实数轴(-∞,+∞)分成k个互不相交的区间: (-∞, a1], (a1, a2], …, (ak-2, ak-1], (ak-1, +?) 记a0=-∞, ak=+?, Ii=(ak-2, ak-1] (i=1,2,…,k-1) , Ik=(ak-1, +?), ni为样本观测值(X的取值)落在第i个小区间Ii 的个数, pi 为X取值落入第i个小区间Ii的概率,0pi1, i=1,2, …,k, 则 pi= P{ ai-1X ai } = F0(ai)—F0(ai-1),i=1,2,…,k. 构造统计量: §8.3 非参数假设检验 K. Pearson和R.A.Fisher联合证明了: 定理 不论F0(x)是何分布函数,只要n充分大(n≥50),当假设H0成立时,上述?2统计量都近似地服从自由度为k-r-1的?2 分布。其中r是F0(x)中未知参数的个数。 称ni为实测频数,vi=npi为理论频数。称这类检验为拟合优度检验。 对于给定的?,查?2分布表得临界值??2(k-r-1),使 由样本值计算出?2 统计量的值,当 ?2 ﹥??2(k-r-1) 时拒绝H0 ?2 ≤??2(k-r-1) 时接受H0 可见,皮尔逊定理(准则)适用于实测频数与理论频数相比较的问题。 几点注释 ①若分布函数F0(x)的类型未知,可由实际问题分析或由样本观察数据的直方图来推测。 ②若已知F0(x) 分布类型,还有r个参数未知时,须先用极大似然估计法求出未知参数的估计值,然后再作假设。 ③此检验要求一定是大样本,一般n≥50。至于k的大小,对于正态总体,样本容量n与区间个数k要满足渐近最优关系 k=1.87(n-1)0.4 ④ 若理论频数vi=npi<5时,则将相临的小区间合并,直至全部npi ≥5(合并区间的同时,也将实测频数合并),合并后的小区间数设为k*,则此时?2统计量的由度变为 df = k*-r-1 ⑤手工计算时常采用公式 74 56 30 22 16 12 9 k 10000 2000 1000 500 200 100 50 N =?(-1.22)-?(-1.68)=0.0647. 类似地算得: p3=0.1124, p4=0.1547, p5=0.1813, p6=0.1695, p7=0.1286, p8=0.0793, p9=0.0630. 例1 设从总体X中抽取120个样本观察值,经计算整理得下表,试检验X服从正态分布。(?=0.05) 120 ∑ 6 (219,+∞) 9 8 (216,219] 8 14 (213,216] 7 22 (210,213] 6 23 (207,210] 5 20 (204,207] 4 14 (201,204] 3 7 (198,201] 2 6 (-∞,198] 1 ni 小区间 组号 解 这里只给出了分布类型,有两个待估参数?与?2。 用极大似然法对?与?2作出估计,得到 故提出假设 H0: X ~ N( 209 , 42.77) H1: X不服从 N(209, 42.77) 由 n =120,算得统计量的值 由于 所以接受H0,认为X ~ N(209 ,42.77). ?=0.05, k=9, r=2. 查表得临界值 解 首先,用样本观察值对未知参数?作极大似然估计。以xi表示区间(ti-1, ti)的中点(也称为组中值),则 故提出假设 H0:X服从? =0.2的指数分布. 当H0为
文档评论(0)