- 1、本文档共9页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四章 总体均数的估计和假设检验
一、教学大纲要求
掌握内容
抽样误差、可信区间的概念及计算;
总体均数估计的方法;
两组资料均数比较的方法,理解并记忆应用这些方法的前提条件;
假设检验的基本原理、有关概念(如I、II类错误)及注意事项。
熟悉内容
两样本方差齐性检验。
了解内容
t分布的图形与特征;
总体方差不等时的两样本均数的比较;
等效检验。
二、教学内容精要
(一) 基本概念
抽样误差
抽样研究中,样本统计量与总体参数间的差别称为抽样误差(sampling error)。统计上用标准误(standard error,SE)来衡量抽样误差的大小。不同的统计量,标准误的表示方法不同,如均数的标准误用表示,率的标准误用SP表示,回归系数的标准误用Sb表示等等。均数的标准误与标准差的区别见表4-1。
表4-1 均数的标准误与标准差的区别
均数的标准误 标准差 意义 反映的抽样误差大小 反映一组数据的离散情况 记法 (样本估计值) (样本估计值S) 计算 =
= =
S= 控制方法 增大样本含量可减小标准误。 个体差异或自然变异,不能通过统计方法来控制。 2.可信区间
(1)定义、涵义:即按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:CI是随机的,总体参数是固定的,所以,CI包含总体参数的可能性是1-。不能理解为CI是固定随机的,总体参数是随机固定的,总体参数落在CI范围内可能性为1-。当时,称为95%可信区间,记作95%CI。当时,称为99%可信区间,记作99%CI。
(2)可信区间估计的优劣:一定要同时从可信度(即1-的大小)与区间的宽度两方面来衡量。
(二) t分布与正态分布
t分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t分布峰值较低,而尾部较高;③随自由度增大,t分布趋近与标准正态分布;当时,t分布的极限分布是标准正态分布。
(三)总体均数的估计
参数估计有点估计和区间估计两种方式。总体均数的估计,见表4-2。
表4-2 总体均数的估计
点估计 区间估计 意义 直接用样本统计量代替总体参数。 用统计量和确定一个有概率意义的区间,以该区间具有较大的可信度包含总体均数。 估计
方法 以作为估计值 ①小样本(,) ②大样本(,) ③两总体均数差值的可信区间
(,) (四)两均数差别的比较
样本均数和总体均数比较的t检验
前提:服从正态分布
:;:
, (4-1)
配对设计的t检验
前提:差值服从正态分布
:;:
, (4-2)
成组设计的两样本均数比较的t检验
前提:两组数据均服从正态分布;两组总体方差相等
:;:
, (4-3)
其中,=, (4-4)
表示两样本均数差值的标准误。
单样本u检验
前提:当样本较大(如n50)或总体已知时
(n较大时) (4-5)
(已知时) (4-6)
大样本均数比较的u检验
前提:样本足够大
成组设计的两样本均数比较可用:
(4-7)
要推断组间没有差别或差别很小,应采用等效检验(squivalence test)。
(五)假设检验的步骤及有关概念
基本思想:把握“小概率事件在一次抽样试验中是几乎不可能发生”的原理。
步骤:①建立假设、选用单侧或双侧检验、确定检验水准;②选用适当检验方法,计算统计量;③确定P值并作出推断结论。
I类错误:为真(实际无差别),假设检验结果拒绝,接受(推论有差别)所犯的错误称为I类错误(type I error),I类错误的概率记作。
II类错误:为真(实际有差别),假设检验结果拒绝,接受(推论无差别)所犯的错误称为II类错误(type II error),II类错误的概率记作。
1-称为检验效能,过去称把握度(power of test),即两总体确有差别,按水准能发现该差别的能力。
三、典型试题分析
单项选择题
1.当样本含量增大时,以下说法正确的是( )
A. 标准差会变小
B. 样均
文档评论(0)