- 1、本文档共13页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章教育统计学第章教育统计学
第六章 抽样分布及总体平均数的推断
教学目的:
通过本章学习,同学们应理解抽样分布、小概率事件、显著性水平、统计推断的两类错误等基本概念,并熟练掌握总体参数估计和总体平均数的显著性检验的方法。
第一节 抽样分布
一、抽样分布的基本概念
三种不同性质的分布:
1.总体分布:总体内数据的频数分布;
2.样本分布:样本内数据的频数分布;
3.抽样分布:某种统计量的概率分布。平均数的抽样分布:从某一总体中抽出的,容量为n的一切可能样本平均数的分布。
【如】:样本平均数的抽样分布、相关系数的抽样分布。
二、平均数抽样分布的几个定理
1.从总体中随机抽出容量为n的一切可能样本平均数之平均数等于总体平均数。
E表示平均的符号.
2.容量为n的样本平均数在其抽样分布上的标准差,与总体标准差成正比,与样本容量n的方根成反比。
:是平均数抽样分布上的标准差(一般称作平均数的标准误)。
3.从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。
4.虽然总体不是正态分布,如果样本容量n很大,平均数的抽样分布也近似正态分布。
※:标准误越小,表明统计量与参数值越接近。
三、样本平均数与总体平均数离差统计量的形态
1.总体为正态分布,总体标准差已知时,平均数的离差统计量呈标准正态分布。可写作
2.总体为正态分布,但总体未知,平均数的离差统计量呈t分布。
(1)总体标准差的估计量:
(2)平均数的标准误的估计量:
(3)平均数的离差统计量:
注:
(4)t分布的特点
① 单峰对称,曲线与基线永不相交;
② t值有正有负,也可为零;
③ t分布是随df=n-1而变化的一簇分布;
参看教材86页。
图例6.1和表6.1
图6.1 自由度为1,2,5, t 分布曲线与正态曲线比较图
表6.1 中央面积为0.95不同自由度t的临界值
自由度 2 4 6 20 30 ∞ t 值 ±4.30 ±2.78 ±2.45 ±2.09 ±2.04 ±1.96
中央面积不变,df不同,t的临界值不同。
df无限大时t分布与正态分布重合。
自由度:公式(6.6)中的n-1统计学中称为自由度(用df 表示,即df =n-1)。
自由度:是指总体参数估计量中变量值能独立自由变化的个数。
【例如】:
第二节总体平均数的估计
推断统计有两种形式:参数估计和假设检验。
一、总体平均数估计的基本原理
1.点估计
点估计:用一个样本统计量的值估计出一个具体的总体参数值,就称作点估计。如把样本平均数当作总体平均数。
点估计的评价标准:
(1)无偏性:一切可能样本统计量与总体参数的离差和为零。
【如】:
:为无偏估计量,:为有偏估计量。所以
(2)有效性:当总体参数不止有一种无偏估计量时,某一统计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。
【如】:的有效性高, M0、Md的有效性低。
(3)一致性:当n无限增大时,估计量的值越来越接近它所估计的总体参数值,则这种估计量是总体参数的一致性估计量。
注:点估计既不能指明估计误差大小,也不能说明正确估计的概率大小。
2、区间估计
(1)区间估计:是指以统计量的抽样分布为理论依据,按一定概率要求,由样本统计量的值估计出总体参数值的所在范围。
(2)平均数区间的估计原理:
当总体已知时,根据平均数抽样分布定理,在95%的置信度上估计:
将括号内的不等式整理可得:
为置信上限。
【例】:某区高一学生的英语统考成绩的标准差为6分,从此次考试的试卷中随机抽出100份试卷,算得平均分为71分。试求全区平均成绩的95%和99%的置信区间:
解:∵
1.95%的置信区间为:
2. 99%的置信区间为:
※:置信度越高,置信区间就越大。
三、未知条件下总体平均数的区间估计
1.基本原理
当已知时,用Z估计;当未知时,其原理与已知时基本相同,只是临界值不固定。95%置信度的临界值可写作:t(df)0.05/2;99%置信度的临界值可写作:t(df)0.01/2。
为标准误,有不同的计算公式。
公式的三种不同形式
2.小样条件下的估计
【例】:某研究人员对红星小学五年级学生进行智力测查,从测查结果中随机抽出16个学生的智力分数,求得平均智力为106分,标准差为5分,试计算该校五年级学生智力分数的99%的置信区间.
99%的置信区间为:
我们有99%的把握说该校五年学生的平均智力在102.18至109.82之间.
3.大样本条件下的估计
总体为正态,未知,但n较大,t分布接近z分布,在这种条件下,既可按t分布估计,也可按z分布估计。t估计准确性高,而z估计简便。
【例】
文档评论(0)