网站大量收购独家精品文档,联系QQ:2885784924

第4章均值比较.docVIP

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第4章均值比较

第4章 均值比较与T检验 均值比较的概念 统计分析常常采取抽样研究的方法。即从总体中随机抽取一定数量的样本进行研究来推论总体的特性。由于总体中的每个个体间均存在差异,即使严格遵守随机抽样原则也会由于多抽到一些数值较大或较小的个体致使样本统计量与总体参数之间有所不同。由此可以得出这样的认识:均值不相等的两个样本不一定来自均值不同的总体。 能否用样本均数估计总体均数,两个变量均数接近的样本是否来自均值相同的总体?换句话说,两个样本某变量均值不同,其差异是否具有统计意义,能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。 对来自正态总体的两个样本进行均值比较常使用T检验的方法。T检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时使用的计算t值的公式不同。 进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。p值小于0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。 F值的计算公式是:F=S12 较大 /S22 较小 进行均值比较及检验的过程 SPSS for Windows提供以下计算变量的描述统计量的过程和对均值进行检验的过程。 1.MEANS过程 MEANS过程计算指定变量的综合描述统计量。当观测量按一个分类变量分组时,MEANS过程可以进行分组计算。例如要计算学生的平均身高,SEX变量把学生按性别分为男、女生两组,MEANS过程可以分别计算男、女生平均身高。用于形成分组的变量应该是其值数量少且能明确表明其特征的变量。 使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。 MEANS过程 使用 MEANS过程的系统默认选择项 MEANS过程的基本功能是分组计算指定变量的描述统计量。包括均值、标准差、总和、观测量数、方差等一系列单变量描述统计量。还可以给出方差分析表和线性检验结果。 举例一: data11--01 使用系统默认值即可按指定分组给出指定变量的均值、标准差观测量数等基本描述统计量。现以27个学生的身高为例说明操作步骤。 no:编号 sex:性别 age:年龄 h:身高 w:体重 因变量:h 自变量与层控制:sex、age 两个变量均放在第一层;两个变量分别放在两层。 举例二: data11--01 MEANS过程的选择项 因变量:h 自变量与层控制:sex、age age变量放在第一层;sex变量放在第二层。 输出结果 (l)表1是由第一层变量age和第二层变量sex确定的各单元中身高均值。 (2)表2是方差分析与线性度检验的结果,说明如下。 方差分析的变量信息:身高*年龄(因变量h标签是“身高”,分组BY变量为AGE标签为“年龄”)。说明方差分析的要求是分析不同年龄的身高均值间是否存在显著性差异。 表2中各统计量的名称和之间的数学关系: ①Sum of squares偏差平方和。 ●Between Groups组间偏差平方和。从表中可以看出组间偏差平方和0.105,它由两部分组成:Linearity是由因变量与控制变量之间的线性关系引起的;Deviation from Linearity是由因变量与控制变量之间的非线性关系引起的。这两项之和为组间偏差平方和。 ●Within Groups组内偏差平方和。各组内各观测相对于组均值的变异,有时也称其为误差变异。 ●Total偏差平方和的总和。它等于组间偏差平方和与组内偏差平方和之和。 ②df自由度 ③Mean Square均方。数值上等于偏差平方和除以自由度之商。 ④F值,数值上等于组间均方与组内均方之商。 从表中可以看出组间偏差平方和0.105,自由度3,均方Mean Square值为组间偏差平方除以自由度,值为0.105/3 0.035。 组内偏差平方和为0.020,自由度23,均方值为0.020/23=0.001 注意,因显示位数有限,此处是近似值)。 总偏差平方和为组间偏差平方和与组内偏差平方和之和。0.1O5+O.020 0.125。 ⑤Sig显著性概率。即假设成立的概率。该假设是:四个年龄组学生身高均值相等。 从表中可以看到,显著性概率近似为O。组间均方远远大于组内均方,说明组间差异远远大于随机误差引起的组内差异。因此可以得出结论:10、11、12、13岁学生的身高差异显著。 线性回归方程的偏差平方和0.097,均方0.097,F值为109.437。Sig近似为0.000。即小于0.001说明回归方程预测性能很好。这也可以从R值为0.879接近l来说明。 (3)表3关联度的测度 Eta值0.915说明因变量与自变量之间联系紧密。 Eta squared等于组间偏差平方和与总偏差平方和之比即0.105/0.

文档评论(0)

kabudou + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档