网站大量收购闲置独家精品文档,联系QQ:2885784924

单变量推论统计1:参数估计.ppt

  1. 1、本文档共30页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 单变量的推论统计之一:参数估计 第一节 抽样分布 第二节 参数的点估计和区间估计 第一节 抽样分布 一、相关名词解释 参数值 统计值 随机抽样 随机样本 二、蒙特卡罗抽样分布: 常见的统计问题是:总体未知,比如我们并不知道华电所有学生的大学语文的平均分为u=65。我们只是随机抽样,比如抽取了3000名学生,得知这个3000名学生所构成的样本的均值 =64。因此我们用得到的这个样本统计值去估计总体的参数值。但是我们都知道,样本是随机抽取的,不同的人抽取到的样本(假设让全班28个人每个人都抽一个3000人容量的样本)是不同的,同一个人反复抽样时也很可能抽取到不同的样本。根据排列组合,抽到的是无限个情况的样本。我们反复从华电学生(假设是10000名)中抽3000个人组成样本,每次都计算出一个新的样本均值,那么将会得到无数个样本均值 ,这种重复抽样的方法就叫蒙特卡罗抽样方法。从每个样本中可以计算出一个样本均值 ,我们将重复抽取的n个样本的都计算出来,研究发现,这些均值就构成了均值的蒙特卡罗抽样分布。 因此可见,它是一种理论分布。 研究发现: 1、抽样分布的图形显示样本均值 围绕其目标u,以标准误差SE=σ/ 近似正态地波动。(因此n越大,SE越小,即波动越小) 2、同样地,我们发现样本比例p也可以用这个方法来处理,它围绕其目标P,以标准误差SE= 近似正态地波动。 三、对比总体分布、样本分布、抽样分布 1、参数值:u和σ都是唯一确定的值。 统计值:由于总体容量N〉样本容量n ,因为重复抽样时,每次抽取到的元素都会不尽相同。因此,不同的样本的统计量很可能不同。 2、抽样中样本只涉及到总体中的部分元素而不是全部元素。因为样本的统计量与总体的参数值之间总是存在一定的差别,我们引入抽样分布的概念,旨在对这种差别进行一定的说明。 3、均值的正态近似原理:样本均值以SE的标准误差围绕总体均值u波动。随着n的增加,波动越来越小,越接近正态分布。(n≥30) 4、比例的正态近似定理:在容量为n的随机样本中,样本比例p以SE= 的标准误差围绕总体比例波动。随着n的增加,p的分布也就围绕其目标波动地原来越小,越来越接近正态分布。(n≥30,np≥5) 5、抽样分布是关于样本均值的分布,它的均值就是总体的均值u,即。。。,而抽样分布的标准差,将之称为标准误差SE,以与总体分布、样本分布相区分。其中SE= ,而当样本相当大时,一般用样本的标准差s来代替总体。 例:台湾的一次普遍调查显示,台湾民众的月收入近似地服从正态分布,其均值为13110台币,标准差为8750元,求: (1)随机地抽取一个人,其收入超过18430元的概率。 (2)抽取一个含有50人的随机样本,求其平均收入超过16000元的概率。 (3)如果总体不是正态的,那么(2)的答案是什么? 例:全厂满意工作环境的工人比例为35%,现在从全厂中随机抽取150名工人,问其满意工作环境的工人比例超过45%的概率。 作业题: 1、试计算以下数值的四分位差、中位数、众数 2,3,4,5,4,4,2,5,6,6,7 2、调查某地区的212个乡,目的是要知道每个乡之育龄妇女(15-44岁)落实计划生育的比率,以下为收集到的资料。1)试求四分位差。 2)试求40百分位数点的值。 第二节 参数的点估计和区间估计 一、点估计 1、总体均值的点估计值。 2、总体方差的点估计值。 3、总体标准差的点估计值。 4、总体比例的点估计值。 二、区间估计(即:求置信区间) 1、基本概念 置信度:又称可信度、置信水平。即总体的参数值落在置信区间的把握。或者说用置信区间去估计总体参数值时,成功的可能性有多大。 置信区间:在一定的置信水平下,根据样本的统计值来估计总体的参数值处于一定的区间之内,这个区间就是置信区间。 显著度:又称显著性水平。它表示用置信区间来估计总体参数,其不可靠的概率。若置信水平为95%,则显著性水平为5%或0.05。 2、置信区间与置信度之间的关系 相互制约 置信度高低反映的是这种估计的可靠性或把握性的问题,而置信区间的大小反映的是这种估计的精确性问题。 对于同一个总体和同一个抽样规模来说,所给区间的大小与做出这种估计所具有的把握性成正比。即区间越大,则对这一估计成功的把握性也越大;反之,则把握性越小。 综上,从精确性出发,要求所估计的区间越小越好,但是从把握性出发,又要求所估计的区间越大越好。人们总是需要在二者兼进行平衡与选择。 3、总体均值的区间估计 1)总体方差σ已知时,大、小样本的均值估计 2)总体方差σ未知时,大样本的均值估计 3)总体方差σ未知时,小样本的均值估计 4

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档