t分布与t检验.docVIP

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
t分布与t检验

t分布   从数理统计的理论上讲,并且上节的实例也已说明,在总体均数为μ,总体标准差为σ的正态总体中随机抽取n相等的许多样本,分别算出样本均数,这些样本均数呈正态分布。而当样本含量n不太小时,即使总体不呈正态分布,样本均数的分布也接近正态。在下式中,   由于μ与(样本均数的标准差)都是常量,又   X呈正态分布,所以u   也呈正态分布。但实际上总体标准差往往是不知道的,上式分母中的σ要由S替代,成为,那么由于样本标   准差有抽样波动,SX也有抽样波动,于是,在用S代替σ   后上式等号右边的变量便不呈正态分布而呈t分布,其定义公式是 (6.5)   t分布也是左右对称,但在总体均数附近的面积较正态分布的少些,两端尾部的面积则比正态分布的多些。t分布曲线随自由度而不同(如图6.1)。随着自由度的增大,t分布逐渐接近正态分布,当自由度为无限大时,t分布成为正态分布。 图6.1 t分布(实线)与正态分布(虚线)   与正态分布相似,我们把t分布左右两端尾部面积之和α=0.05(即每侧尾部面积为0.025)相应的t值称为5%界,符号为t0.05,,,这里ν是自由度。把左右两端尾部面积之和α为0.01相应的t值称为1%界,符号为t0.01,,。t的5%界与1%界可查附表3,t值表。例如当自由度为10-1=9时,t0.05,9=2.262,t0.01,9=3.250。 可信区间的估计   一、参数估计的意义   一组调查或实验数据,如果是计量资料可求得平均数,标准差等统计指标,如果是计数资料则求百分率藉以概括说明这群观察数据的特征,故称特征值。由于样本特征值是通过统计求得的,所以又称为统计量以区别于总体特征值。总体特征值一般称为参数(总体量)。我们进行科研所要探索的是总体特征值即总体参数,而我们得到的却是样本统计量,用样本统计量估计或推论总体参数的过程叫参数估计。   本章第一节例6.1通过检查110个健康成人的尿紫质算得阳性率为10%,这是样本率,可用它来估计总体率,说明健康成人的尿紫质阳性率水平,这样的估计叫“点估计”。但由于存在抽样误差,不同样本(如再检查110人)可能得到不同的估计值。因此我们常用“区间估计”总体率(或总体均数)大概在那一个范围内,这个范围就叫可信区间。区间小的一端叫下限,大的一端叫上限。常用的有95%可信区间与99%可信区间。根据同一资料所作95%可信区间比99%可信区间窄些(上、下限较靠近),但估计错误的概率后者为1%,前者为5%,进行总体参数的区间估计时可根据研究目的与标准误的大小选用95%、或99%。   二、总体均数的估计   为了说明常用的总体均数之区间估计法,我们不妨回顾一下上节所叙的t分布。   由求t的基本公式   我们看到X与μ的距离等于t(SX),又根据X集中分布在μ周围的特点,若取t的5%   界即t0.05,,(或1%界)乘以SX作为X与μ的距离范围,就可用式(6.6)或式(6.7)求   出区间来估计总体均数μ所在范围,估错的概率仅有5%或1%,因此称95%或99%可信区间。下面用实例说明其求法。   95%可信区间 X-t0.05,νSXμX+T0.05,ΝSX(6.6) p   99%可信区间 X-t0.05,νSXμX+T0.01,ΝSX(6.7) p   例6.2 上面抽样实验中第1号样本的均数为488.6,标准差为61.65,例数10,自由度ν=10-1=9,试求95%与99%可信区间。   1.求标准误     95%可信区间 488.6-2.262(19.50)μ488.6+2.262(19.50),即有95%的把握估计μ是在444.49~532.71区间内   99%可信区间 488.6-3.250(19.50)μ488.6+3.250(19.50),可有99%的把握估计μ是在425.22~551.98区间内   这里两个可信区间都包含μ=500在内,所以这次估计是估计对了。   抽样实验共抽了100个样本,除1号样本外其余99个样本均数也对μ作了区间估计,这些95%可信区间列在表6.4中。我们看到,只有5个95%可信区间(右上角标有星号)不包含总体均数μ=500在内,它们是: 样本号 X 95%可信区间 6 546.7 515.78~577.62 7 524.5 500.45~548.55 28 476.1 454.91~497.29 72 465.3 447.02~483.58 75 526.6 503.10~550.10   平时我们并不重复抽取许多样本来一次次估计总体均数而仅是一次,至于算出的均数会类似一百个样本均数中的那一个就很难说了。如果不遇到类似上列那些均数过大或过小的样本,求出可信区间后总体均数真是在该区间内,那么便是一次成功的估计

文档评论(0)

panguoxiang + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档