- 1、本文档共38页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
医学统计学抽样误差
抽样误差 Sampling Error 主要内容(Content) 抽样误差及其规律性 标准误 抽样分布与t分布 总结 了解抽样误差规律的重要性 两种研究思路 概率论:已知总体?样本具有什么性质? 统计学:已知样本?总体具有什么性质? 概率论:规律性中的随机性 统计学:随机性中的规律性 抽样误差的定义 假如事先知道某地七岁男童的平均身高为119.41cm。为了估计七岁男童的平均身高(总体均数),研究者从所有符合要求的七岁男童中每次抽取100人,共计抽取了三次。 抽样误差的定义 三次抽样得到了不同的结果,原因何在? 抽样误差的定义 【定义】由于个体变异的存在,在抽样研究中产生样本统计量和总体参数之间的差异,称为抽样误差(sampling error)。 各种参数都有抽样误差,这里我们以均数为研究对象 抽样误差的表现 抽样误差的规律性 既然抽样误差是有规律的,那么它的分布规律到底是怎样的? 模拟试验 假设一个已知总体,从该总体中抽样,对每个样本计算样本统计量(均数、方差等),观察样本统计量的分布规律--抽样分布规律。 考察: 不同的分布 不同的样本含量 对统计量的影响。 均数的模拟试验 从不同总体中进行抽样,观察均数的抽样分布规律。 正态分布总体 对数正态分布总体 U型分布总体 考察: 样本均数的均数与总体均数有何关系? 样本均数的标准差与总体标准差有何关系? 样本均数的分布形状如何? 不同的样本含量对上述性质的影响如何? 从已知正态总体中抽样 A Simulation Study 模拟试验 随机现象的模拟系统 从正态总体中随机抽样,其样本均数服从正态分布; 从任意总体中随机抽样,当样本含量足够大时,其样本均数的分布逐渐逼近正态分布; 样本均数之均数的位置始终在总体均数的附近; 随着样本含量的增加,样本均数的离散程度越来越小,表现为样本均数的分布范围越来越窄,其高峰越来越尖。 均数的抽样误差之特点 各样本均数未必等于总体均数; 样本均数间存在差异; 样本均数的分布很有规律,围绕总体均数,中间多两边少,左右基本对称; 样本均数的变异范围较之原变量的变异范围大大缩小; 随着样本含量的增加,样本均数的变异范围逐渐缩小。 中心极限定理(central limit theorem) Case 1: 从正态分布总体N (μ,σ) 中随机抽样(每个样本的含量为n ),可得无限多个样本,每个样本计算样本均数,则样本均数也服从正态分布。 样本均数的均数为 μ; 样本均数的标准差为 。 中心极限定理(central limit theorem) Case 2: 从非正态(nonnormal)分布总体(均数为μ,方差为σ) 中随机抽样(每个样本的含量为n ),可得无限多个样 本,每个样本计算样本均数,则只要样本含量足够 大(n 50),样本均数也近似服从正态分布。 样本均数的均数为 μ; 样本均数的标准差为 。 标准误(standard error) 样本统计量的标准差称为标准误。 样本均数的标准差称为均数的标准误。 均数的标准误表示样本均数的变异度。 当总体标准差未知时,用样本标准差代替, 前者称为理论标准误,后者称为样本标准误。 标准误的意义 反映了样本统计量(样本均数,样本率)分布的离散程度,体现了抽样误差的大小。 标准误越大,说明样本统计量(样本均数,样本率)的离散程度越大,即用样本统计量来直接估计总体参数越不可靠。反之亦然。 标准误的大小与标准差有关,在例数n一定时,从标准差大的总体中抽样,标准误较大;而当总体一定时,样本例数越多,标准误越小。说明我们可以通过增加样本含量来减少抽样误差的大小。 与样本含量的关系 n 越大,均数的均数就越接近总体均数; n 越大,变异越小,分布越窄; 对称分布接近正态分布的速度,大于非对称分布。分布越偏,接近正态分布所需样本含量就越大。 抽样误差的规律性(1) 均数的抽样误差规律: 在样本含量足够大时,无论总体分布如何,其均数的分布趋于正态分布(大数定律) 在样本含量较小时: 总体为正态分布时:正态分布 总体为非正态分布时:? 正态分布的标准化变化 若 X ~ N(μ,σ) , 则 。 从N(0,1)中1000次抽样的 u 值的分布(n=4) t 分布的概念 实际工作中,总体方差未知。所以,用样本方差代替总体方差, 此时 的分布如何? 从N(0,1)中1000次抽样的 t 值的分布(n=4) t 分布的概念 用样本方差代替总体方差,此时 不服从正态分布。而
文档评论(0)