- 1、本文档共43页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第六章 抽样分布及总体平均数推断 第一节 抽样分布 第二节 总体平均数的估计 第三节 总体比率的区间估计 第四节 总体方差的区间估计 第一节 抽样分布 一、抽样分布的概念 要区分以下三种不同性质的分布: 总体分布:总体内个体数值的频数分布。 样本分布:样本内个体数值的频数分布。 抽样分布:某一统计量的概率分布。 实验性的抽样分布是为了容易了解,实际上抽样分布是一个理论的概率分布。它是统计推断的理论依据。 二、平均数抽样分布的几个定理 1.从总体中随机抽出容量为n的一切可能样本的平均数之平均数等于总体的平均数。 2.容量为n的平均数在抽样分布上的标准差,等于总体标准差除以n的平方根。 3.从正态总体中,随机抽取的容量为n的一切可能样本平均数的分布也呈正态分布。 4.虽然总体不呈正态分布,如果样本容量较大,反映总体平均数和标准差的样本平均数的抽样分布,也接近于正态分布。 小贴士 1.抽样分布是统计推断的理论依据。 2.抽样误差用抽样分布上的标准差来表示。 3.某种统计量在抽样分布上的标准差称为该种统计量的标准误。 三、样本平均数与总体平均数离差统计量的形态 1.总体分布为正态,总体方差已知时,无论样本大小,样本平均数的抽样分布为正态 分布。 2.总体分布为正态,总体方差未知时,只要样本容量n30,样本平均数的分布为正态分布。 3.总体分布为非正态分布,但总体方差已知,若样本容量n30.样本平均数的抽样分布为渐进正态分布。 当抽样分布为正态分布或渐进正态分布时,样本平均数与总体平均数离差的统计量用Z值来表示。 若总体呈正态分布,总体方差未知而且n30,或总体方差未知,总体未呈正态分布,n30,样本平均数的抽样分布为t分布。 样本平均数与总体平均数的离差的统计量用t值来表示。 t分布的特点: T分布是一种左右对称的分布,且分布的形状随样本容量的变化而变化。 t 分布 正态分布与t分布的比较 相同点: 1.取值范围相同 2.平均数为0,且以平均数处为最高峰向俩侧逐渐下降 3.尾部无限延伸,以横轴为渐进线 4.单峰对称形 不同点: 1.t分布的形态随自由度的变化呈一簇分布形态, 2.t分布的峰狭窄尖峭,尾长而翘的高,在基线上分布的范围广。自由度越小,分布范围越广 3.当自由度增大时,t分布逐渐接近正态分布。当自由度无限大时,t分布与正态分布重合。 t分布表(教材328页) t分布表是由T分布函数计算得到的 ,给出了不同自由度时某些概率下的t值。 因为t分布曲线以纵轴为对称轴,表中只有t的正值。 表的左列为不同的自由度,最上面一行是指t分布曲线两尾部的概率(面积)之和,而表第二行标明的是t分布曲线一侧的尾部概率。 当t分布曲线两侧尾部概率相同时,不同的自由度下其相应t值是不同的。 自由度:指总体参数估计量中变量值独立自由变化的个数。用df表示 自由度与统计运算和统计推断中样本容量及限制因素的个数有关。 自由度的个数等于样本容量n减去限制因子的个数。 第二节 总体平均数的估计 参数估计在统计方法中的地位 统计推断的过程 一、总体参数估计的基本原理 1、点估计 用某一样本统计量的值来估计相应总体参数的值叫总体参数的点估计。 点估计的评价标准如下: (1)无偏性:估计量抽样分布的数学期望等于被估计的总体参数 (3)一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数 小贴士 1、用样本的估计量直接作为总体参数的估计值 例如:用样本均值直接作为总体均值的估计 例如:用两个样本均值之差直接作为总体均值之差的估计 2. 没有给出估计值接近总体参数程度的信息 2、区间估计 以样本统计量的抽样分布(概率分布)为理论依据,按一定的概率要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。 在一定的可靠程度上求出总体参数的置信区间的上下限。 在点估计的基础上,给出总体参数估计的一个区间范围,该区间由样本统计量加减抽样误差而得到的 根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量 比如,某班级平均分数在75~85之间,置信水平是95% 区间估计的图示 置信水平 将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所占的比例称为置信水平 表示为 (1 - ???? ??为是总体参数未在区间内的比例? 常用的置信水平值有 99%, 95%, 90% 相应的 ??为0.01,0.05,0.10 置信区间 由样本统计量所构造的总体参数的估计区间称为置信区间 统计学家在某种程度上确信这个区间会包含真正的总体参数,所以给它取名为置信区间 置信区间与置信水平 影响区间宽度的因素 1. 总体数据的离散程度,用 ? 来测度 2、样本
文档评论(0)