浅析经典测验理论(CTT)的优势及缺陷..doc

下载文档

227
0
约4.97千字
约 5页
2017-01-21 发布于重庆
举报
版权申诉
保障服务

浅析经典测验理论(CTT)的优势及缺陷..doc

1、本文档共5页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

浅析经典测验理论(CTT)的优势及缺陷.

浅析经典测验理论(CTT)的优势及不足张越华1 (1深圳大学师范学院应用心理学系,深圳 2011121111) 摘要作为一门独立学科的教育测量学，从创立至今，已近一个世纪，三、四十年代臻于成熟的试题技术质量分析方法，即真分数理论已成为经典性理论。本文先简略介绍经典测验理论（CTT）的概念、数学模型、和假设。而作为一个经典性理论，经典测验理论必然尤其诸多优点，且是其他测验无法替代的，如实用性强、易于操作、便于实施、误差在一定范围内能得到有效的控制。当然，经典测验理论也存在一些不足之处，如真分数与观测分数间存在线性关系的假定不符合事实、误差与真分数独立的假设难以满足、对被试能力的估计依赖于测验题目的难度、测验参数具有对被试样本的很强的依赖性、测验信度建立在平行测验假设的基础之上、信度是针对被试全体的,只代表平均测量精度、经典测验模型中, 擅自假设:对所有被试者, 测量的误差变化量是相同的、对测验等值、适应性测验、标准参照性测验的编制等问题不能给以满意的解决。关键词经典测验理论；真分数理论；优点；缺点 1 引言经典测验理论(Classical Test Theory，CTT)，也称真分数理论。最早实现数学形式化的测量理论。它从十九世纪末开始兴起，二十世纪30年代形成比较完整的体系而渐趋成熟。５０年代格里克森的著作使其具有完备的数学理论形式，而1968年洛德和诺维克的《心理测验分数的统计理论》一书，将经典测验理论发展至颠峰状态，并实现了向现代测量理论的转换。为了研究方便，心理学家引入了真分数的概念。真分数（True Score）即是测量中不存在测量误差时的真值或客观值，操作定义就是无数次测量结果的平均值，在实际的测量中，误差是不可避免的，当误差接近于真分数时，我们就说误差较小。通常用T表示真分数。观察分数用X表示，E表示测量误差，则真分数的基本方程式为：X = T + E。T和E是线性的关系，这里的误差只包括随机误差，系统误差是包含在真分数里的。根据公式我们可推导出三个相互关联的假设公理：第一，反复观察N次，误差平均数为零，即真分数等于实得分数的平均数T=E(X)或E（E）=0. 第二，真分数和测量误差之间相互独立。ρ（T,E）=0 第三，各平行测验误差相关为零。ρ（E1,E2）=0 在实际应用当中，用平行测验反复测量同一个人的同一心理特质是行不通的，因为平行测验不仅要求所测特质相同，对题目、数量、难度、区分度等也要保持一致性。这就增加了编制方面的困难。一般我们都是用同一个测验测量一个团体，团体中的每个人的误差可以假定是随机，并服从正态分布。所测团体的实测分数、真分数和误差分数的方差之间有如下的关系，SX＝ST+SE。公式中只涉及随机误差，系统误差的方差包含在真分数方差中，这就是说真分数访查中包含与测量目的有关的变异（SV）和与测量目的无关的变异（SI）。由此，公式可以变为SX＝SV+ SI+SE CTT假定真分数T、X和测验误差分数E间的关系可以用一个简单的线性函数X=T+E表示。但大量的研究表明,真分数与观测分数间的非线性关系更符合事实。(纪凌开,2005) 3.2 误差与真分数独立的假设难以满足 CTT假定误差与真分数独立,即RTE=0,这是不符合事实的。低能力的被试答题时一般会比高能力被试有更多的猜测,所以其测验误差分的大小及方差必然要大于高能力的被试。 3.3 对被试能力的估计依赖于测验题目的难度在经典测验中, 被试能力与测题难度是相关的,试卷一般是由一组中值难度多, 二头难度值较少的不同试题组成。这设计方法对中间能力水平的被试者较为适应, 而对高能力或低能力的被试者就不能作出精确的估计。只有当测验难度和每个被试者能力水平相匹配时, 测验的效度(衡量测验质量的另一个重要指标)才可能获得最大, 此时即使缩短试卷长度也不会影响其成绩, 这便是“ 因人施考” 的问题。但在经典测验中, “ 因人施考” 是难以实现的, 因为对二次不同难度的测验, 我们是无法进行比较的。 3.4 测验参数具有对被试样本的很强的依赖性经典测验理论指标中最主要的就是测验的信度、效度和测验项目的难度、区分度。要施行高质量的测验离不开对这四个“度”的准确估计。但是在经典测验理论中, 这些参数的估计对样本的依赖性是很大的。最明显的例子就是项目难度。对于同一项目, 若样本的群体水平较低, 就有较高的难度估计值, 若样本的群体水平较高, 则又会有较低的难度估计值。项目区分度从本质上讲是样本群体的项目分与测验总分之间的相关系数, 而众所周知的是, 相关系数的估计受样本全距的影响很大。样本全距宽, 相关系数值大, 样本全距窄, 相关系数值小。测验的信度和效度也主要通过相关分析估计, 因此同样受到样本全距的影响。(纪凌开