教育考试中短测验的分析方法――基于两种项目反应理论方法的比较研究.pdf

教育考试中短测验的分析方法――基于两种项目反应理论方法的比较研究.pdf

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
教育考试中短测验的分析方法――基于两种项目反应理论方法的比较研究

::2012年第 10期 ResponseTheory,P—IRT)和非参数项 目反应理论 MNSQ,理想值为 1,越接近理想值拟合越好,测验过 (Non-parameter Item Response Theory,NIRT)。 程没有受到潜在特质之外的因素影响 。 P—IRT模型以区分度0、难度b、猜测度C、能力参数 如果测验数据满足这三个假设且不同题 目的 、 信息量,等统计量为参数进行项 目分析。常见的 ICC曲线不相交 (N—IRT中称之为题 目间单调)这就 P—IRT模型有Rasch模型、Logistic模型、等级反应模 构成了摩根模型中的双重单调模型(doublymono. 型等。N—IRT使用正答概率的次序、哥特曼错误 tonemodel,DM1I3】。DM模型可以用来对试卷进行项 数、同质性系数H(coefficientsofhomogeneity)等指标 目功能差异(differentialitemfunctioning,DIF)检验 。 进行项 目分析。目前在教育测量中运用最为广泛 一 份优秀的试卷要求试题难度排序具有不变性的 的N—IRT模型是摩根模型(MokkenMode1)t”。 特点。即对于同一群体的不同子群体(如考试中的 P—IRT多应用于大试题量 、大样本的测验 中。 男、女两个子群体),按照正答率对试题排序 ,排序 在处理短测验、小样本数据时P—IRT存在很大的误 结果应当一致 。出现不一致的情况则表明不同子 差 ,N—IRT理论可以弥补这一缺陷 1,帮助研究者全 群体在同一题 目上的正答率不同,这些题 目可能存 面了解测验的质量。两种理论都遵循IRT的基本假 在DIF。P—IRT中也有许多方法进行DIF检验。体 设 :潜在特质单维、被试作答局部独立、项 目特征曲 现在ICC曲线上,不同被试子群体的ICC曲线不重 线 (itemcharacteristiccurve,icc)单调递增。在摩根 合(图1—3),曲线越不重合 ,DIF越严重。 模型中,如果测验数据满足三个假设 ,就构成了单 3 分析实例 调同质模~d(monotonelyhomogeneousmodel,MH)。 其ICC曲线类似于P—IRT中的Logistic模型:每个题 3.1研究样本及数据来源 目的ICC曲线都满足单调递增,但由于区分度不同, 本研究的样本是贵州省贵阳市某高三文科班 ICC曲线可能相交 (图1一1)。如果数据拟合MH模 学生。研究数据为贵阳市2011年一模文综考试的 型 ,说 明被试 能力与试题得分之间单调相关 。 地理部分,共 11个题 目。样本量为 194人,其中,男 P—IRT中用拟合指数等进行维度检验 ,拟合差则说 生71人,女生 123人。 明测量结果中可能受到了目标特质之外的其它因 3.2.1Rasch分析结果 素的影响。如Rasch模型中的OuftitMNSQ和Infit Rasch模型是一种单参数模型,本研究选择该 能力 1-1MH模型 1-2DM模型 1-3项 目功能差异 图1ICC曲线 ChinaExaminationsl19 避 塑 ementandAsse—ssment easur 模型对数据进行P—IRT分析 ,并与N—IRT的分析结 4 果进行 比较 Rasch分析采用Winsteps软件。利用 375

文档评论(0)

yaobanwd + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档