对外汉语教学第7章测试I.ppt

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
对外汉语教学第7章测试I

2、水平测验(Proficiency Tests)、熟巧程度测验: 测试对目的语运用的熟练程度(TOEFL、HSK、出国人员外语水平考试WSK)。 必须弄准什么叫“语言水平”、要求能够预测未来完成特定任务情况。 4、诊断性测验(Diagnostic Tests): 目的是了解学习者对教学内容掌握情况,以便调整教学。不一定需要打分,非正式的测验。 Non-standardized Tests:表现评价(Performance Assessment),真实评价( Authentic Assessment) 所测语言能力的基本特征作理论构想(construct)。理论构想在理论上定义所要开发的测验试图测到的语言能力的基本特征。 制定质量监控计划:信度、效度、对教学的影响(washback)、实用性 资源配置计划(人、物、财、时) 2、试卷构成说明(p308示例): 包括几个部分及各部分顺序、题目数量、答题时间、客观性程度等。 3、对命题人员(特别是兼职命题员)培训 综合运用: 综合填空和完形填空。前者在一段语言材料中涉及很多空儿让被试选择填空,考察点很多;后者不提供备选答案,被试根据上下文自己把答案写在空格处。 HSK填汉字题属于综合式客观题。 总的编写原则是要明确测试目的。具体编写需要积累经验,针对情况具体分析。 2、区分度(discrimination):水平高被试答对的人数大于水平低被试答对人数。 区分度指数(discrimination index):取全体被试分数最高27%作为高分组,最低的27%作为低分组,D=(高分组答对此题人数-低分组答对此题人数)/高分组或低分组人数。 例题见P326-327。 D在-1~+1之间,一般要求在0.3左右。 点双列相关系数(point-biserial correlation coefficient) 双列相关系数 2、平均数(mean);众数(mode,出现次数最多的分数);中位数(median,原始分数排列起来,最中的那个数) 示例:3,7,8,8,8,9,13;3,7,8,9,83(22) 分半(split-half),反映内部一致性程度 内部一致性公式:Kuder-Rechardson系数和Cronbach α系数。 评分者之间信度。 3、影响因素:题目数量;题目同质性;难易度;被试水平 教育测验用学科成绩或教师评定,能力倾向测验用特殊训练成绩,一般标准化测验用另一被证实可靠有效的标准化测验为标准。 构想效度(construct):理论、观念效度,测验结果与设计者关于能力的理论构想之间的相关程度。第二语言习得理论有许多假说,用测验验证,涉及构想效度 3、标准差(standard deviation),方差(v)的平方根,s=√(∑(x-M)2/N) ∑总和 X每个考生分数 N考生总人数 M平均分 计算下列数的方差:3,5,2,7,6 第五节 质量评估:信度和效度 一、reliability 1、可靠性、稳定性,对同样一组被试反复测量结果保持一致。 2、信度估计 再测(retest):稳定性系数,要防止练习效应 等值复本(equivalent-form),平行试卷 二、validity 1、测量对所要测的东西准确测量的程度。相对于特定目的而言。 2、类别: 内容效度(content):实际测量内容对所欲测量内容的代表性程度。成绩测验最应讲求内容效度,即最强调题目代表性,需要确定测验的范围和各部分的比例。靠经验判断等定性分析的方法进行。表面效度(face):考查书面表达能力可以用写作文的方式和改错句的方式,前者表面效度高,并不一定。 标准关联效度(criterion-related):测验结果与某一标准之间关系的密切程度,标准通常指测验所要预测的行为,如大学学习情况、语言运用熟练程度。 预测效度(predictive):测验分数与一段时间后被试的行为表现之间的相关程度。共时效度(concurrent):以测验实施相同或相近时间内搜集到的其他经验性资料为标准。 * * 语言测试 第一节 概说:发展、作用、学科特点 第二节 语言测试基本类型 第三节 语言测验开发过程 第四节 题目编写和分析方法 第五节 质量评估:信度和效度 语言测试 第一节 概说 1、语言测试主要发展阶段: 传统时期或前科学时期(20世纪初-50年代初):依靠直觉判断。作文、口试、翻译等方法。 心理测量-结构主义时期或科学时期(50年代末60年代初-70年代):以结构主义语言学、行为主义心理学、心理测量学为基础,Lado, R. (1961)为标志。分立式测试。 心理语言学社会语言学时期或后现代时期(70年代-80年代初):注意功能性社会性和语言应用。综合式测试,出现完型填空(Cloze Test)等形式,Olle

文档评论(0)

wendan118 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档