心理测量第三讲详解.ppt

  1. 1、本文档共32页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
测验的信度 主讲:刘润香 如果一个秤今天和明天秤的结果不一样,我们就不会相信这个秤,认为这个秤有问题 类似的,如果一个心理测验多次测量的结果不稳定或者不一致,那么也不会有人去用这个测验。 信度的概念 一般定义: 信度:即测验的可靠性,指的是测验所得结果的一致程度。它是衡量测验质量好坏的最基本指标。 信度的指标 信度系数rxx 信度指数rxT 测量标准误SE 信度系数 经典测量理论的假设:X=T+E. X为实得分数,T为真实分数,E为随机误差分数。 可以转换为:S2x=S2T+S2E. 信度定义:信度是一组测验分数的真分数方差与总方差(实得分数方差)的比率,即 rxx=S2T/ S2x= 1-S2E/ S2x 信度指数 r2xT=S2T/ S2x,rxT即为信度的第一种表示信度指数。但这里S2T无法求取。 对同一被试反复施测无数次,或用无数个相等的测验对同一被试反复施测无数次,从而一个被试可以得到无数个分数,这无数个分数的平均值为真实分数T,标准差即为测量的误差方差,它也是信度的第二种表示。这里对一个被试能不能反复施测无数次? 测量标准误 SE=Sx(1- rxx)1/2 测量的标准误与信度之间有互为消长的关系:信度越高,标准误越小;信度越低,标准误越大 信度评估的方法 根据反映测验误差的不同来源,可分: 重测信度——考察跨时间的一致性。 复本信度——考察跨内容的等值性。 内部一致性——考察题目的同质性。 评分者信度——考察评分的一致性。 注意: 信度估计方法不只上面几种,实际上有多少误差来源,便有多少估计信度的方法。原则上一个测验哪种误差大,便采用哪种估计方法,有时甚至需要有几种信度系数。 重测信度 定义:即使用同一测验,在同样条件下对同一组被试者前后施测两次,求两次得分间的相关系数,又称稳定性系数 。 计算方法:重测法。A1 A2,求r12。 使用条件: (1)所测心理特质是稳定的(气质、性格、兴趣、态度); (2)遗忘和练习效应基本抵消; (3)两次施测间隔内,被试没有得到更多的学习、练习(动态测验) 注意事项: (1)报告重测信度要报告两次施测间隔时间。 (2)两次测量之间最适宜的时距:随测验的目的、性质和被试特点而异,一般是两周到四周为宜,间隔时间最好不超过六个月。(不能太短,使得记忆或练习效应得以消退;不能过长,以避免被试心理状态受到成熟、历史性变化的影响) 复本信度 等值性系数:A B(反映测验内容引起的误差) 定义:是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试在两个测验上得分的相关系数。 施测方法:将被试随机分成两半,一半被试先做A,再做B;另一半先做B,再做A,合并两个A和B的数据求相关。 稳定性与等值性系数。A B 两个复本的施测相隔一段时间。 计算:类同重测信度,两次测验上得分的积差相关系数。 使用条件: (1)编制两份平行测验(很难编) (2)被试有条件接受两次测验 注意事项: (1)稳定等值性系数需报告施测间隔时间 (2)依然存在练习/记忆效应(如:同一类型的题,解题策略相同) PS:重测信度和复本信度都不适合难度测验。 分半信度 分半信度:1/2A 1/2A 定义 指在测验实施后,将测验按奇偶性分成两半,并分别计算每位被试在两半测验上的得分,求出这两半分数的相关系数。属于内部一致性系数中的一种,反映的是两半测验间的一致性。 校正 原因:测验长度变短,易低估测验的信度; 公式: rxx=2rhh/(1+rhh) 使用前提: 测验能被分成两半(如语文、韦氏智力测验就很难分半) 注意事项: (1)一个测验往往有多种分半方法,因此也对应有多种分半信度,在报告分半信度时需说明分半的方法。 (2)常用的分半方法有奇偶分半、难度分半、内容分半、时间分半(常用于速度测验) 同质性信度 同质性信度 主要代表测验内部所有题目间的一致性。正相关高,测验为同质的;低正相关或为负相关时,测验为异质。也属于内部一致性系数中的一种,其实质是所有分半信度的平均值。 如果测验由许多分测验组成,则要求分测验内部同质,分测验之间异质。 评分者信度 适用:用于测量不同评分者之间所产生的误差。 两个评分者之间的信度:有若干份试卷,每份试卷由两人评分,然后根据每份试卷的两个分数求相关。(如果受过训练的评分者,其评分一致性应达0.90以上) 多个评分者之间的信度:如果采用等级评分,可采用W系数计算评分者信度。 应注意的问题 有多少误差来源就有多少信度估计方法。 应根据情况采用不同的信度指标,原则上一个测验哪种误差大,便用哪种误差估计。 一个测验往往要计算多种信度系数。 例子 复本信度又称等值性系数。它是以两个等值但题目不同的测

文档评论(0)

我是兰花草 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档