- 1、本文档共26页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
统计推断 statistical inference 第一节 均数的抽样误差 一、抽样试验 抽样试验(n=5) 抽样试验(n=10) 抽样试验(n=30) 1000份样本抽样计算结果 3个抽样实验结果图示 抽样实验小结 二、中心极限定理 central limit theorem 第二节 t分布与可信区间 一、t分布 t分布的概率密度函数 t分布曲线 t分布曲线下面积(附表2) t界值表 二、总体均数的估计 可信度与可信区间 可信度实验 2. 总体均数的可信区间 3. 两总体均数差的可信区间 4. 大样本总体均数的可信区间(1) 4. 大样本总体均数的可信区间(2) 三、可信区间的解释 江苏大学医学院 统计推断基础 总体 样本 抽取部分观察单位 统计量 参 数 统计推断 如:样本均数 样本标准差S 样本率 P 如:总体均数 总体标准差 总体率 内容: 参数估计(estimation of parameters) 包括:点估计与区间估计 2. 假设检验(test of hypothesis) 总体 样本 抽取部分观察单位 统计量 参 数 统计推断 如:样本均数 样本标准差S 样本率 P 如:总体均数 总体标准差 总体率 抽样误差 (sampling error) :由于个体差异导致的样本统计量与总体参数间的差别;以及统计量间的判别。 从正态分布总体N(5.00,0.50)中,每次随机抽取样本含量n=5,并计算其均数与标准差;重复抽取1000次,获得1000份样本;计算1000份样本的均数与标准差,并对1000份样本的均数作直方图。 按上述方法再做样本含量n=10、样本含量n=30的抽样实验;比较计算结果。 5.00 5.00 4.99 均数的均数 0.0920 0.1580 0.2212 均数标准差 0.0913 0.50 5.00 n=30 0.1581 0.50 5.00 n=10 0.2236 0.50 5.00 n=5 总体标准差s 总体的均数 均数的均数围绕总体均数上下波动。 均数的标准差即标准误 与总体标准差 相差一个常数的倍数,即 样本均数的标准误(Standard Error) =样本标准差/ 从正态总体N(m,s)中抽取样本,获得均数的分布仍近似呈正态分布N(m, ) 。 ①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。 ②随着样本量的增大, 样本均数的变异范围也逐渐变窄。 一、t分布(Student’s t distribution) 二、总体均数的估计 1. 总体均数的点估计(point estimation)与区间估计 2. 总体均数的可信区间(confidence interval,CI) 3. 总体均数差的可信区间 4. 大样本总体均数的可信区间 三、可信区间的解释 随机变量X N(m,s) 标准正态分布 N(0,1) u变换 均数 标准正态分布 N(0,1) t分布 t(n-1) 式中 为伽玛函数; 圆周率 为自由度(degree of freedom),是t分布的唯一参数;t为随机变量。 以t为横轴,f(t)为纵轴,可绘制t分布曲线。 t 分布有如下性质: ①单峰分布,曲线在t=0 处最高,并以t=0为中心左右对称 ②与正态分布相比,曲线最高处较矮,两尾部翘得高(见绿线) ③ 随自由度增大,曲线逐渐接近正态分布;分布的极限为标准正态分布。 双侧t0.05/2,9=2.262 =单侧t0.025,9 单侧t0.05,9=1.833 双侧t0.01/2,9=3.250 =单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05/2,∞=1.96 =单侧t0.025,∞ 单侧t0.05,∞ =1.64 1. 总体均数的点估计与区间估计 参数的估计 点估计:由样本统计量 直接估计 总体参数 区间估计:在一定可信度(Confidence level) 下,同时考虑抽样误差 区间的可信度(如95%或99%)是重复抽样(如1000次)时,样本(如n=5)区间包含总体参数(m)的百分数。常用100(1-α)%或(1-α)表示, α值一般取0.05或0.01。 * *
文档评论(0)