正态分布区间估计.pptx

  1. 1、本文档共28页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
正态分布区间估计会计学第1页/共28页抽样误差 由于总体中个体变异的存在,在抽样过程中产生的样本统计量与总体参数间的差异称为抽样误差。第2页/共28页标准误样本统计量的标准差称为标准误。样本均数的标准差称为样本均数的标准误,反映样本均数的离散程度,反映样本均数抽样误差大小。第3页/共28页t分布设从正态分布N(?,?2)中随机抽取含量为n的样本,设: 实际工作中,总体方差未知,用样本方差代替,此时: ~ t分布, ? = n ? 1 t分布曲线第4页/共28页单峰分布,曲线以0为中心,左右对称类似于标准正态分布。t分布的形状与自由度?有关第5页/共28页1-α-tα/2,vtα/2,v双侧:P(t≤-tα/2,ν)+ P(t≥tα/2,ν)=α P(-tα/2,ν t tα/2,ν) = 1-α第6页/共28页参数估计参数估计:由已知的样本统计量推断总体参数。参数估计:点估计和区间估计;区间估计: 假设某个总体的均数为μ,需要找到两个数值A和B,使得在一个比较高的可信度下(如95%),区间(A,B)能包含μ。即P(AμB)=0.95总体均数μ的区间估计第7页/共28页由于总体情况未知,要计算总体参数μ的置信区间,必须依靠样本统计量进行推断。样本是从总体中抽样获得,因此不可避免存在抽样误差。因此计算总体参数的置信区间时,必须利用样本统计量,同时考虑抽样误差和可信的程度(1-α)。a/2a/2-ta/2,vta/2,v第8页/共28页σ未知且样本例数n较小时,按t分布原理计算a/2a/2-za/2za/2第9页/共28页σ已知,按标准正态分布原理计算第10页/共28页σ未知但样本例数n足够大(n>50)时 由t分布可知,自由度越大,t分布越逼近标准正态分布,按标准正态分布原理计算第11页/共28页总体均数的区间估计(单侧)σ未知且样本例数n较小时,按t分布原理:第12页/共28页总体均数的区间估计(单侧)σ未知但样本例数n足够大(n>50)时:σ已知,按标准正态分布原理计算:第13页/共28页总体均数的可信区间(SAS实现)(1)t 分布法 SAS函数:TINV t=TINV(p,df) 求t分位数的函数,p是从-∞到当前t分位数位置的面积。 df=n-1(自由度)第14页/共28页例:随机抽取15名学生,记录他们的性别(sex)、年龄(age)、体重(w)和身高(h),求:学生身高的95%置信区间。f 15 46 156 f 14 41 149 f 18 65 165m 15 50 160 m 13 48 155 m 18 70 180m 14 38 150 m 16 55 165 m 17 68 176m 16 60 170 f 17 50 160 f 17 58 160f 16 60 165 m 17 65 175 f 18 61 162第15页/共28页data a;input sex$ age w h @@;cards;f 15 46 156 f 14 41 149 f 18 65 165m 15 50 160 m 13 48 155 m 18 70 180m 14 38 150 m 16 55 165 m 17 68 176m 16 60 170 f 17 50 160 f 17 58 160F 16 60 165 m 17 65 175 f 18 61 162;第16页/共28页proc means;var h;Output out=b mean=mean std=s n=n;data c;set b;t=tinv(0.975,n-1);/*也可使用t=tinv(0.025,n-1);但此时计算出来的t界值为负数。*/yl=mean-t*s/sqrt(n);/*可信区间的下限*/y2=mean+t*s/sqrt(n);/*可信区间的上限*/proc print;run;Output语句注解第17页/共28页语句格式:OUTPUT OUT=数据集名 [统计关键字=变量名]功能: 将过程结果输出到一个新SAS数据集。第18页/共28页方法2(正态分布近似法)某市2000年随机测量了90名19岁健康男大学生的身高,均数为172.2cm,标准差为4.5cm,试估计该市当年19岁健康男大学生平均身高95%置信区间。第19页/共28页data aa; input x s n;y1=x-1.96*s/sqrt(n); /*可信区间的下限*/y2=x+1.96*s/sqrt(n); /*可信区间的上限*/cards;172.2 4.5 90;proc print;run;第20页/共28页样本频率的抽样误差 随机变量 X ~ B(n,?

文档评论(0)

kuailelaifenxian + 关注
官方认证
内容提供者

该用户很懒,什么也没介绍

认证主体太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档