第三章抽样分布.ppt

  1. 1、本文档共20页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第三章 抽样分布 生物统计学的最基本问题 生物统计学的最基本问题是研究总体与样本间的关系。总体有两类:一是由实际研究对象构成的总体;二是数字的总体。前者可转化为后者。生物统计研究的是数字总体。 总体与样本之间的关系,有以下两个途径: 总体已知,研究样本的分布规律,即由总体到样本; 总体未知,由样本推断,即由样本到总体。 本章研究的是第一个问题:即从总体到样本的研究过程。 4.1 从一个正态总体中抽取的样本统计量的分布 抽样分布:从一个已知的总体中,独立随机的抽取含量为n的样本,研究所得的样本的各种统计量的概率分布。 如样本平均数的抽样分布即为( X, P(X) ) 组合 一、 样本平均数的分布 1、总体标准差已知时,样本平均数的分布服从u 分布(正态分布) 从平均数为μ,标准差为σ的正态总体中,独立随机地抽取含量为n的样本,则 由此可知,样本平均数是一服从正态分布的随机变量,记为 将平均数标准化,则 ,其中标准化的分母为平均数的标准误。 例1:在总体X~N(80,202)中随机地抽取一容量为100的样本,问样本均值与总体均值的差的绝对值大于3的概率是多少? 解:设W是样本均值变量,因总体服从正态分布,所以W~N(μ,σ2/n) 例2:在总体X~N(μ,0.5)中要以99.7%的概率保证偏差∣X -μ∣0.1,问抽取的样本其容量n应取多大? 解:P {∣ X -μ∣0.1}= 0.997 二、总体标准差未知时,样本平均数的分布服从t分布 σ未知时可用样本标准差s代替,标准化变量并不服从正态分布,而服从具n-1自由度的 t 分布 ,其分母为样本标准误差。 自由度:独立观测值的个数。在这里因为计算s时所使用的n个观测值,受到平均数x的约束,这就等于有一个观测值不能独立取值,因此自由度 df =n-1。 t 分布的密度函数:(不要求掌握) t 分布的特征数: 自由度 (df) Degrees of Freedom t 分布曲线 t分布受自由度的制约,每一个自由度都有一条t分布密度曲线。 t分布密度曲线以纵轴为对称轴,左右对称,且在t=0时,分布密度函数取得最大值。 与标准正态分布曲线相比,t分布曲线顶部略低,两尾部稍高而平。df 越小这种趋势越明显。df 越大,t分布越趋近于标准正态分布。 t 分布的单侧分位数与双侧分位数的查表方法(附表4)与正态分布表的查法一致,表示方式也与u分布相同。 右边阴影的面积=0.05 t1 =1.83 全部阴影的面积=0.05 t1 =2.26 全部非阴影面积=0.99 t1 =3.25 左边阴影的面积=0.01 t1 =2.82 左边的总面积 =0.90 t1 =1.38 二、 样本方差s2的分布——χ2分布 从方差为σ2的正态总体中,随机抽取含量为n的样本,可计算出样本方差s2。在讨论样本方差s2的分布时,通常并不直接谈s2的分布,而是将它标准化,得到一个不带任何单位的纯数。该纯数服从n-1自由度的卡方分布。 卡方值:χ2df=(n-1) s2 /σ2 χ2分布是概率曲线随自由度而改变的一类分布(其密度函数较复杂 ,不要求掌握) χ2分布曲线: χ2分布是连续型变量的分布,每个不同的自由度都有一个相应的χ 2分布曲线; 对于较小的自由度,其分布曲线明显右倾,df=1时曲线以纵轴为渐近线; 随着自由度的增加,其偏斜度和峭度接近于0,这时的分布近似于正态分布。 样本方差(卡方)分布的几个特征数: χ 2分布查表方法 χ 2分布的上侧和下侧分位点见下图。 根据(df,α)查χ 2分布的上侧分位数。 (附表6) 若查下侧分位数,只要查出1-α时的分位数即可。 4.2 从两个正态分布总体中抽取的样本统计量的分布 假定有两个正态总体,分别具有(μ1,σ1)和(μ2,σ2)。从第一个总体中随机抽取含量为n1的样本,并独立地从第二个总体中抽取含量为n2的样本。求出x1,s1和x2,s2。下面我们研究x1±x2的分布。 标准化( )后的变量服从标准的正态分布,这样可以推断在标准差已知时,两个样本平均数的差异是否显著。 二、总体标准差未知但相等时,两个样本平均数和与差的分布---t分布 当σ1和 σ2未知时,可用 s1和s2 代替; 若两个总体相互独立且都是正态分布的,同时σ1=σ2,则变量服从自由度为df1+df2的 t分布。 根据df 值和α值可查出t值(附表4),用于统计推断。 三、两个样本方差比的分布—F分布 从两个正态总体中抽出含量分别为n1和n2的样本,求出各自的样本方差。标准化后的样本方差之比称为F,其分布服从F分布(由两个样本的自

文档评论(0)

junjun37473 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档