外语试题库建设与项目反应理论.docVIP

下载本文档

6
0
约3.12千字
约 3页
2017-08-19 发布于重庆
举报
版权申诉

外语试题库建设与项目反应理论.doc

1、本文档共3页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

外语试题库建设与项目反应理论.doc

外语试题库建设与项目反应理论尽管有人将测试称作“anecessaryevil(难免的坏事),外语测试在外语教学中仍是个不可缺少的重要环节,而且还是一种行之有效的教学手段。通过适当形式的外语测试教师可以掌握学生的学习潜能,了解学生学习进步程度以及所存在的问题,评价学生的外语水平和实际应用外语的能力,检查教与学的实际效果。科学合理的外语测试还能激发学生学习外语的兴趣,增强学习的动力。然而,如果外语测试质量低劣或使用不当,也会造成很大的负面影响。外语试题库建设随着各种类型的外语测试的逐步推行,外语试题库建设的重要性日渐显豁。说到外语试题库建设,不少人以为无非就是把现成的试题汇成一体,记录在卡片或存储于电脑中。近年来,一些机构和院校也正是这样将市面上的模拟试题原封不动收集起来建立了“题库”。但是,如此拼凑而成的“题库”离现代语言测试学题库建设的标准相去甚远,因而根本无法满足外语测试科学化、标准化的需要。以现代语言测试理论为指导的外语试题库建设绝不是一种现成题目的简单堆积,而是需要按照规范的程序,科学地编制、加工和组合足够数量的试题。这样建立起来的题库应当组织严密、结构合理、内容广泛、增容简便、经济实用。因此,正如并非每一位外语教师不经训练就能无师自通地胜任外语测试工作一样,并不见得任何一个考试机构或一所院校都有能力(甚至有必要)建立外语试题库。建立规模高效的外语试题库,受到诸多因素的影响和制约,必须具备一些基本条件。这些条件包括:(1)要有一份相对稳定完善的考试大纲,明确规定测试的目的、性质、内容、题型、题量、时间、记分等等,并以此作为题目编审工作的依据;(2)要有一个精明强干、掌握语言测试理论并且具有实践经验的专门班子,负责题目的编写和审订工作;(3)要有稳定的考生来源,定期接受测试与预测分析,其中作为每次预测统计分析样本人数不得少于100人,以确保样本具有充分的代表性;(4)要有一个高效实用的题目分类系统。这个系统的内容除了题目和答案外,还应当包括题目的名称、索引号、试题内容分类,以及有关的预测统计分析数据,诸如题目的难(易)度、区分度、标准误、偏颇性分析、适宜性和双列相关系数等等;(5)要有一种便于存储题目和题库增容的有效手段,在计算机程度不断提高的今天,也就是要有适用的计算机硬件与软件;(6)要有相应的试题分析统计模式作基础。多年来,语言测试学界主要基于经典式测试理论(classicaltesttheory)的统计方法进行试题分析和试题库建设。近年来,随着语言测试理论实践的深入发展和研究手段的日益现代化,项目反应理论(itemresponsetheory)业已为愈来愈多的语言测试学家所关注,并成为指导他们进行语言测试研究与实践的理论模式。项目反应理论　　项目反应理论,亦称潜在特质理论(latenttraittheory),是关于考生对试题的反应与考生潜在特征能力之间关系的理论。这种理论振聋发聩。一些学者认为,这种理论在语言测试学界的出现,其意义可与核物理学在物理学界的诞生同日而语。还有学者预言,这一理论必将引起语言测试的根本变革。以下仅对项目反应理论做一初步的介绍与评述。　　项目反应理论的核心主要指三种数学模式(逻辑斯蒂)模式:(1)单参数模式,即Rasch模式,只含难度参数值;(2)双参数模式,含有难(易)度和区分度两个参数;(3)三参数模式,包括难度、区分度和猜测指数三个参数。尽管以上三种模式所含参数的数目不同,但都植根于一些重要的理论假设。诸如(a)能力的单维性(unidimensionality):一项测试所测出的能力变量处于单维的空间之中;(b)完成测试任务的非催速性(non-speededness):考生有充足的答题时间,造成错答不是由于时间不够,而是其能力有限;(c)局部独立性(localindependence):考生对测试中各个项目的反应在统计上是相互独立的,即他对一个项目的反应不应是依赖于他对其他项目的反应;(d)样本不变性(sampleinvariance):项目的难度不会因为样本的变化而变化。在上述三种数学模式中,单参数模式最为常用。究其原因,首先是因为单参数模式简单直观,易于掌握;其次,这一模式的运算相对简便,能够做到经济合算、省时省力,且无须借助于程序复杂的大型计算机;另外,还有一个十分重要的原因是,它不需要太大的测试样本,一、二百人即可,而三参数模式则至少需要二、三千人的样本才可以成功运作。因此,下面集中讨论单参数模式。现在用于语言测试的项目反应理论中的单参数模式源于丹麦数学家GeorgeRasch创立的逻辑斯蒂模式。Rasch单参数模式不同于经典测试理论的统计方法,它本质上是概率性的。其基本假设是,一项测试的题目都有特定的难度,各道试题可以按难度分等;而考生也具有一定程度的能力。下