医学统计学总体均数的估计和假设检验.ppt

医学统计学总体均数的估计和假设检验.ppt

  1. 1、本文档共33页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四节 抽样误差与假设检验 一、抽样误差的概念 (一)均数的抽样误差与标准误 在医学科研中常采用抽样研究的方法,由于存在个体差异,样本均数一般不恰好等于总体均数,这种由个体变异产生的、由抽样误差造成的样本均数与样本均数以及样本均数与总体均数之间的差异( )称为均数的抽样误差。抽样误差在抽样研究中是不可避免的。但有一定的规律可循,我们可以用特定的指标来描述抽样误差的大小。 用样本信息来推断相应总体的特征,这一过程称为统计推断。 统计推断包括两方面的内容:参数估计和假设检验 为了与反映观察值离散程度的标准差相区别,统计学上把样本均数的标准差称为样本均数的标准误,简称为标准误(standard error),其值越大就说明均数的抽样误差就越大,样本均数的离散程度就越高,也就是与总体均数的差异程度越大。 数理统计证明: 从正态分布N(μ,σ2)中随机抽取例数为n的样本,其样本均数的分布仍服从正态分布;即使总体不呈正态分布,只要n很大, 的分布也近似正态分布N(μ, )。 均数标准误(理论值)的计算公式为: 而在实际工作中只有用S估计σ,故标准误的估计值计算公式为 例4-4-1 用例4-2-1某地101例30~40岁骨科病人血清胆固醇值资料计算标准误 均数标准误的用途: 衡量样本均数的可靠性,其值越小则用其估计总体均数越可靠; 结合样本均数和正态分布曲线下的面积分布规律,可用于估计总体均数的置信区间(后述); 可用于均数的假设检验(后述)。 (二) t分布 样本均数的分布服从正态分布N (μ, ) ,按照标准正态分布变换方法,N (μ, ),也可变换成标准正态分布N(0,1), 由于σ往往未知常用s作为σ的估计值,则此时对变量 采用的就不是z变换而是t变换,即服从ν=n-1的t分布 统计量是t的分布就是t分布。 t分布的特征: ① 以0为中心,左右对称呈单峰分布; ② t分布是一簇曲线,分布参数为自由度υ。 ③ t分布的形状与样本例数n有关,高峰比正态分布略低,两侧尾部翘得比正态分布略高。?越大,曲线越近正态分布,当ν=∞时,t分布即为z分布。 由于t分布是一簇曲线,为了便于应用,统计学家编制了表4-4-1 t界值表。 二、总体均数的估计 用样本指标(统计量)估计总体指标(参数)称为参数估计。总体均数的估计有两种方法, 一是点估计:直接用统计量 估计总体参数μ,此法并不常用; 例如 于2000年测得某地27例健康成年男性血红蛋白量的样本均数为125g/L,试估计其总体均数。 →μ,即认为2000年该地所有健康成年男性血红蛋白量的总体均数为125g/L 。 其二是区间估计(参数估计):较常用,即按一定的概率估计总体均数所在数值范围,常用双侧95%可信区间(置信区间),其通式为 当σ已知或未知但n足够大(如n100)用公式: 例4-4-2 由例4-2-2中5名17岁女中学生肺活量资料得 =2.44 L,S=0.33L,试估计该地17岁女中学生肺活量的95%的可信区间。 本例n=5, ?=4,t0.05,4=2.776 例4-4-3 由例4-2-1 101名30~49岁健康男子血清总胆固醇 mmol·L-1,S=0.88 mmol·L-1,求该地健康男子血清总胆固醇值均数的95%可信区间。 三、总体率的估计(置信区间) (一)率的抽样误差及标准误 与均数一样,率也存在抽样误差。率的标准差又称率的标准误为: (二)总体率?的区间估计 当样本例数n足够大,且样本率p和(1-p)都不太小时,即np和n(1-p)均大于5时,样本率p的抽样分布近似正态分布,可用正态近似法,按下式估计总体率?的可信区间: ( , ),缩写为: 例4-4-4 从某地人群中随机抽取144人,检查乙型肝炎表面抗原携带状况,阳性率为9.20%,求该地人群的乙型肝炎表面抗原阳性率的95%可信区间。 本例n =144,p=9.20%,可用近似正态法计算可信区间。 先按式计算 : 正态近似法仅用于当样本例数n较大,且样本率p不接近0或1时。否则,近似程度不够,会出现估计的可信限小于0或大于1的不合理情况。 四、假设检验的基本原理和基本步骤 (一)假设检验的基本原理:假设检验亦称显著性检验,是统计推断的另一个非常重要的方面。 假设检验的原理: 假设检验的基本思想是反证法和小概率的思想。 反证

文档评论(0)

喵咪147 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档