经典测量理论解读.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第四节 经典测量理论   本节首先简要论述了题库同教育测量理论的关系以及两种基本的教育测量理论,并且对教育测量理论和教育测量理论中的经典测量理论作了详尽的论述。 一、题库同教育测量理论的关系   如果我们想对题库有一个透彻的理解,就很有必要了解题库建设所依据的教育测量理论,他们是使题库变得可以使用的科学的依据。题库是按照一定的教育测量理论利用计算机技术构成的某种学科题目的集合。题库中的题目属性有一些其量化指标是一个统计量,如题目的难度、区分度,这是题库的重要指标项,被称为项目统计量(或项目参数)。项目统计量要根据教育测量理论的方法计算出。教育测量理论不仅为题库的项目统计量提供计算方法,也为题库中题目属性项目的建设提供依据,同时为测验的有效性、可靠性分析与评价提供方法和标准。 二、两种不同的教育测量理论   在题库建设中使用的测量理论有两种,即:经典测量理论(CTT: Classical Test Theory)              项目反应理论(IRT: Item Response Theory)   两种理论的核心部分是数学模型,它们是基于不同的假设提出的。经典测量理论采用的是线性的定性模型;项目反应理论采用的是非线性的概率模型。尽管如此,两种理论仍有许多相同及相互联系的地方,经典理论中的项目统计量与项目反应理论中的项目参数有着很高的相关性,只是项目统计量依赖于被试团体,不具普遍性;而项目参数与被试原体无关,项目参数具有不变性,这可使各个被试团体所得到的项目参数具有可比性。参数不变对提高题库的质量、对于测验的编制和实施适应性测验都是非常重要的。 三、测量理论   (一)教育测量的应用   教育测量是对教育领域内的事物或现象,根据一定的客观标准,作慎密的考核,并依据一定的规则将考核的结果予以数量的描述。   教育测量是学校教育常用的基本手段之一。平时的单元测验和期中、期末考试,都是属于教育测量。   在教育科学研究中,特别是实验研究,为了给选择和组合基础条件基本相仿的实验组和对照组提供客观依据,或要掌握单组实验的实验对象的初始水平,一般都要进行事前测量;在实验结束之后,为了要显示因变量的变化情况,又要进行测量。因此,教育测量也是教育科学研究,特别是实验研究的必不可少的工具。   (二)教育测量的要素   任何一种测量都要定义单位、确定参照点和使用体现单位、参照点的测量工具。例如,摄氏温度的测量,人们规定了在标准大气压下,水的沸点和凝固点之差的1/100作为一个摄氏温度单位,确定水的凝固点为摄氏温度零度,并以此为参照点;在此基础上,把体现单位、参照点的摄氏温度计作为测量温度的一种工具。由此可见,测量的三要素是单位、参照点和体现单位和参照点的测量工具。教育测量作为一种特殊的测量,毫不例外地要有单位、参照点和体现单位、参照点的测量工具。   1、单位  单位是计算数量的名称。在物理特征的测量时,千克是测量重量的单位,米是测量长度的单位,分贝是测量声音的单位。任何测量都离不开计量单位。教育测量也是如此。目前,在中小学教育中,教育测量最常用的单位是百分单位和等级单位。百分单位就是规定一项测验的满分为100分,把满分的1/100作为一个计量单位。等级单位是根据一项测验结果的上限和下限,把结果分成若干个等级,每一个等级作为一个计量单位。   2、参照点  所谓参照点是指计量的起点。有了参照点,就可以比较两个测量结果的异同。否则,测量的结果就无法进行比较。根据测量理论,参照点可分成两类:一类是绝对参照点;另一类是人为参照点。   教育测量中的参照点,除了某些体育测量之外,其余测量的参照点,全部是人为参照点。例如,在百分单位的测量中,习惯上将60分作为及格的参照点。   (三)教育测量的特点   1、测量的间接性 一个物体的物理特征,诸如重量、长度和温度等,可以用秤、尺和温度计等予以直接测量。但是,由于学生的知识和技能的掌握、能力的发展、思想品德等情况,都是人的大脑活动情况。今天的科学发展水平,人们还没有办法直接测量人类的心理活动情况。目前,我们只能通过学生的外显行为,间接地测量学生与教育有关的精神特征。具体地说,我们主要是通过学生对文字测验题的反应和其它的一些行为表现,根据教育学和心理学的理论,用逻辑推理的方法来间接地测量他们的知识和技能水平、能力发展情况和思想品德情况的。   2、测量的不稳定性 物理特征的测量结果基本上是稳定不变的。但教育测量则不然。例如,在百分单位中,A、B两个不同年级的学生,在期中语文考试中的成绩都是88分。完全有可能A学生是班上的高分获得者,而B学生在班上是低分获得者。这是由于A、B两学生各自所在年级的语文考试试题的难易程度不一致,评分标准不一样,所在班级的学生考试成绩的分布情况有差异等,造成了分数的价

文档评论(0)

shuwkb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档