[医药卫生]第四章 抽样误差与假设检验.ppt

[医药卫生]第四章 抽样误差与假设检验.ppt

  1. 1、本文档共51页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
[医药卫生]第四章 抽样误差与假设检验

中心极限定理(central limit theorem) 从均数为?、标准差为?的总体中独立随机抽样,当样本含量n较大时, 样本均数的分布将趋于正态分布 此分布的均数为? 例4.1 在某地随机抽查成年男子140人,计算得红细胞均数4.77×1012/L,标准差0.38 ×1012/L ,试计算均数的标准误。 标准误是抽样分布的重要特征之一,可用于衡量抽样误差的大小,更重要的是可以用于参数的区间估计和对不同组之间的参数进行比较。 (一) 已知 (二) 未知 通常未知,这时可以用其估计量S 代替,但 已不再服从标准正态分布,而是服从著名的 t 分布。 t分布 William Seely Gosset(1876~1937,英) 2.可信区间的计算: 计算可信区间的原理与前完全相同,仅仅是两侧概率的界值有些差别。即 例4.2 某医生测得25名动脉粥样硬化患者血浆纤维蛋白原含量的均数为3.32 g/L,标准差为0.57 g/L,试计算该种病人血浆纤维蛋白原含量总体均数的95%可信区间。 例4.3 试计算例4.1中该地成年男子红细胞总体均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计算可信区间。因为 ,则95%可信区间为: 三、模拟实验 模拟抽样成年男子红细胞数。设定: 产生100个随机样本,分别计算其95%的可信区间,结果用图示的方法表示。从图可以看出:绝大多数可信区间包含总体参数 ,只有6个可信区间没有包含总体参数(用星号标记)。 3.总体均数可信区间的计算公式可以利用 的抽样分布获得。一种重要的方法是利用 t 分布计算区间两端的可信限 。单侧可信区间只需将公式中的双侧界值换成单侧界值。 4.假设检验的思想是,首先对所需要比较的总体提出一个无差别的假设,然后通过样本数据去推断是否拒绝这一假设。其实质是判断观察到的“差别”是抽样误差引起还是总体上的不同,目的是评价两个不同的参数或两种不同处理引起效应不同的证据有多强,这种证据的强度用概率P 度量和表示。 5.假设检验有三个基本步骤: ① 建立假设和确定检验水准,通常选 ② 选择检验方法和计算检验统计量 ③ 确定P 值和做出统计推断结论 所有的假设检验都按照这三个步骤进行,各种检验方法的差别在于第②步计算的检验统计量不同。 可信区间: 需要注意:在小样本情况下,应用这一公式的条件是原始变量服从正态分布。在大样本情况下(如n50),也可以用 替换 近似计算。 下限: 上限: 下限: 上限: 图4-2 模拟抽样成年男子红细胞数100次的95%可信区间示意图 * * * * * * 四、可信区间的确切含义 从1999年某市18岁男生身高值总体 N(μ=167.7cm, σ=5.3cm)中随机抽取100个样本 计算了100个估计μ的95%CI 其中有95个CI包含了μ 有5个不包含μ =167.7cm 20号 161.00~165.57 31号 161.17~167.33 54号 168.05~171.00 76号 167.71~174.84 82号 167.98~174.27 来自N(0,1)的100个样本所计算的95%可信区间示意 如果能够进行重复抽样试验,平均有(1??)的可信区间包含了总体参数,而不是总体参数落在该范围的可能性为(1??)。 在实际工作中,只能根据一次试验结果计算一个可信区间,就认为该区间包含了相应总体参数,该结论犯错误的概率≤ ? 。 可信区间一旦形成,它要么包含总体参数,要么不包含总体参数,二者必居其一,无概率可言。可信度是事前概率。 可信区间的确切含义 正确性:可信度1??,即区间包含总体参数 的理论概率大小,愈接近1愈好。 精确性:区间的宽度,区间愈窄愈好。 当样本含量为定值时,上述两者互相矛盾。 若只顾提高可信度,则可信区间会变宽。 评价可信区间估计的优劣: 四、可信区间与参考值范围的区别 可信区间用于估计总体参数,总体参数只 有一个 。 参考值范围用于估计个体值的分布范围, 个体值有很多 。 95%可信区间中的95%是可信度,即所求可 信区间包含总体参数的可信程度为95%。 95%参考值范围中的95%是一个比例,即 所求参考值范围包含了95%的正常人。

文档评论(0)

qiwqpu54 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档