- 1、本文档共45页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
总体均数估计PPT
第五章 参数估计基础;图示:总体与样本;抽样试验(n=5);抽样试验(n=10);抽样试验(n=30);3个抽样实验结果图示;① 各样本均数未必等于总体均数;
② 各样本均数间存在差异;
③ 样本均数的分布为中间多,两边少,左右基本对称。
④ 样本均数的变异范围较之原变量的变异范围大大缩小。;中心极限定理:;样本频率的抽样分与抽样误差;一、抽样误差与标准误;3.标准误的计算;对于二项分布,X~B(n,π),
则样本频率
其标准误:;4. 标准误的应用; 二、t 分布的概念 ; ;4. t 分布曲线的特征:;t界值表:详见附表2,可反映t分布曲线下的面积。
单侧概率或单尾概率:用 表示;
双侧概率或双尾概率:用 表示。 ;
;三、总体参数的估计;1.点估计(point estimation)
用相应样本统计量直接作为其总体参数的估计值。; 按预先给定的概率(1??)所确定的包含未知总体参数的一个范围。
总体均数的区间估计:按预先给定的概率(1??)所确定的包含未知总体均数的一个范围。
如给定?=0.05,该范围称为参数的95%可信区间或置信区间;
如给定?=0.01,该范围称为参数的99%可信区间或置信区间。;总体均数置信区间的计算需考虑:
(1)总体标准差?是否已知,
(2)样本含量n的大小
通常有两类方法:
(1) t分布法
(2)u分布法;总体均数置信区间的计算;2、正态分布近似法
当σ已知 或 σ未知,但 n50 时;总体均数的单侧(1-α)置信区间; 例3-3 某地抽取正常成年人200名,测得其血清胆固醇的均数为3.64 mmol/L,标准差为1.20mmol/L,估计该地正常成年人血清胆固醇均数的95%置信区间。 ; 故该地正常成年人血清胆固醇均数的双侧95%可信区间为(3.47, 3.81)mmol?L。
;参数估计的方法:;㈠正态分布法
样本含量n足够大, np与n(1-p)均≥5时 ,;For example;㈡ 查表法
当样本含量较小(如n≤50),np或n(1-p)5时,样本率的分布呈二项分布,总体率的置信区间可据二项分布的理论求得。
例6-7 某医院用某药治疗脑动脉硬化症22例,其中显效者10例。问该药总显效率的95%置信区间为多少?
本例n=22, X=10, 查附表3(411页),得此两数相交处的数值为24~68,即该药总显效率的95%置信区间为(24%,68%)。 ;(三)置信区间的确切涵义;1. 95%的置信区间的理解:
(1)所要估计的总体参数有95%的可能在我们所估计的置信区间内。
(2)从正态总体中随机抽取100个样本,可算得100个样本均数和标准差,也可算得100个均数的置信区间,平均约有95个置信区间包含了总体均数 。
(3)但在实际工作中,只能根据一次试验结果估计置信区间,我们就认为该区间包含了总体均数?。; 2.置信区间的两个要素
(1)准确度:用可信度(1??)表示:即区间包含总体均数?的理论概率大小 。
当然它愈接近1愈好,如99%的置信区间比95%的置信区间要好
(2)精确度:即区间的宽度
区间愈窄愈好,如95%的置信区间比99%的置信区间要好。
;当n确定时,上述两者互相矛盾。
提高准确度(可信度),则精确度降低
(置信区间会变宽),势必降低置信区间的实际应用价值,故不能笼统认为99%置信区间比95%置信区间要好。
相反,在实际应用中,95%置信区间更为常用。
文档评论(0)