[高等教育]4第四章 均值比较与T检验.ppt

  1. 1、本文档共49页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 均值比较与T检验 均值比较的概念 统计分析常常采取抽样研究的方法。即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。 由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。 又由于实验者测量技术的差别或测量仪器精确程度的差别等也会造成一定的偏差,使样本统计量与总体参数间存在差异。 均值比较的概念 由此可以得出这样的认识: 均值不相等的两个样本不一定来自均值不同的总体。 能否用样本均数估计总体均数,两个变量均数接近的样本是否来自均值相同的总体?换句话说,两个样本某变量均值不同,其差异是否具有统计意义,能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。 进行均值比较及检验的过程 一、定量资料基本分析过程(MEANS过程) MEANS过程用于定量资料的统计分析,可计算21种统计量,还可以进行单向方差分析。 当观测量按一个分类变量分组时,MEANS过程可以进行分组计算。例如要计算学生的平均身高,SEX变量把学生按性别分为男、女生两组,MEANS过程可以分别计算男、女生平均身高。用于形成分组的变量应该是其值数量少且能明确表明其特征的变量。 MEANS过程 使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。 MEANS过程的基本功能是分组计算指定变量的描述统计量。包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计量。还可以给出方差分析表和线性检验结果。 Means过程中使用的术语 水平数:指分类变量的值的个数。如性别变量有2个值,称为2个水平; 单元:指因变量按分类变量值所分的组。例如可以按性别将因变量的值分为2组。如果还有一个分类变量年龄,共有10、11、12三个值,可以将因变量的值分为3组。每组因变量称为一个单元,means过程对每个单元的因变量值求各种描述性统计量; 水平组合:如果有2个分类变量,例如性别(男、女)和年龄( 10岁、11岁、12岁 )。按它们的水平组合将会分因变量为6个单元。 例题 Mean过程的数据文件要求:至少有一个连续变量、一个分类变量(离散变量)。对连续变量求其基本描述统计量。分类变量用来分组。 以27个学生的身高为例说明操作步骤(data11-01) 变量no编号,sex性别,age年龄,h身高,w体重。 输出结果 线性检验结果 练习题 已知97个被调查幼儿的体健资料并建立了CHILD.sav数据文件。试按性别(X2)对身高(X5)与体重(X4)做平均数分析。 CHILD.sav数据文件在SP11DATA文件夹下 练习题 在治疗肝癌的药物研究中,为了提高治疗药物在靶器官—肝脏的浓度,降低在非靶器官如心脏的浓度,行2×3×2析因设计,即设置3个因素,第一个因素是药物(“drug”),有2个水平,分别为“丝裂酶素+高分子物质+磁性物质”(实验组=1)和“丝裂酶素”(对照组=2);第二个因素是时间(“time”),有3个水平,分别为给药后15min(=1)、30min(=2)和60min(=3);第三个因素器官(“organ”),有2个水平,分别是心脏(=1)和肝脏(=2)。将60只小鼠随机分为12组(即2*3*2种组合),每组5只,即重复的例数为5。观察指标(反应变量)为组织中丝裂酶素的浓度(ug/g),结果见表8-1和数据文件“factorial_1”。 二、T test过程 1、单一样本T检验(One-sample T Test) 单样本t检验主要用于样本均数与已知总体均数的比较,还可计算相应的描述性统计量及样本均数和总体均数之差的95%可信区间。 例题: 已知某地区12岁男孩平均身高为142.3cm。1973年某市测量120名12岁男孩身高资料。分析该市12岁男孩的身高与该地区平均身高有无明显差异。 建立数据库(data11--02) Confidence interval:95%:置信区间项,可以自定义。 Missing Values:选择对缺失值的处理方法 Exclude cases analysis by analysis:带有缺失值的观测值当它与分析有关时才被剔除; Exclude cases listwise:剔除所有列在Test、Grouping矩形框中的变量带缺失值的项 身高基本描述统计量 单样本T检验分析结果 练习题 已知某水样中含CaCO3的真值为20.7mg/L,现用某方法重复测定该水样11次CaCO3的含量(mg/L)为:20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20.0

文档评论(0)

好文精选 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档