111教学测量与评价.pptVIP

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
111教学测量与评价.ppt

§3 物理测验的评价 1.测验与评价中的几个基本概念: 学生通过测验所得的分数称为原始分数。 要客观地评价学生成绩,评价测验和测验题的质量,就必须对原始分数进行统计处理和分析解释。 (1)次数分布表与频率分布表 ①次数分布表: 测验结束后,将各分数段和人数列表统计。这样的统计表就是简单的次数分布表,这种分数在各个分数段的散布情况叫做次数分布。 ②频率分布表: 所谓频率即某一分数段上的人数所占总人数的比例。 将各分数段和每一分数段上的人数所占总人数的比例列表统计。 (2)集中量数和差异量数 频率分布表描述了分数集中趋势和离散程度,即这批考生的一般成绩如何,成绩差异有多大。 ①集中量数: 描述分数向某点集中的趋势的量数称为集中量数。 在教学测量中最常用的集中量数是平均分数。 平均分数的计算公式如下:ˉX=∑Xi /N 。 如果被测人数很多,可用次数分布来计算平均分数: ˉX=(f1Xc1+f2Xc2+…+fNXcN)/N=∑fi Xci /N 。 式中fi代表第i个分数段的人数;Xci代表第i个分数段的组中值。 ②差异量数: 差异量数是用来描述分数的离散程度。 差异量数包括: 全距、平均差以及标准差等。 a.全距(R): 全距(R):表示一组数据中的最大数与最小数之差。 R =Xmax -Xmin。 全距只能反映差异的大致情况。 b.平均差(AD): 离均差(x): 每个变量(例如每个人的分数)与平均数的差。 即:x=X-ˉX。 平均差(AD): 各个变量的离均差的绝对值的平均值。 即:AD=(∣X1-ˉX∣+∣X2-ˉX∣+…+∣XN -ˉX∣)/N=∑∣xi∣/N。 c.标准差(S): 标准差(S): 将各个离均差的平方取平均值再开方,所得的数值叫做标准差。 即:S=(∑x2/N)1/2。 如果直接利用原始分数计算,则:S=[∑X2/N-(∑X/N)2]1/2。 (3)相关 二列变量之间的相互关系,叫做相关。 如果一列变量变动时,另一列变量也发生变动,而且变动的方向相同,则这两列变量是正相关。 如果一列变量变动时,另一列变量也发生变动,而且变动的方向相反,则这两列变量是负相关。 两次物理测验是负相关,说明测验结果的稳定性极差,不能反映学生的真实水平,测验是完全不可信的,即信度极低。 两列变量X、Y之间的相关程度,用相关系数r表示。 相关系数的计算分式为:r=∑xy/(NSxSy), 式中x、y是变量X、Y的离均差x=X-ˉX、y=Y-ˉY;Sx、Sy是变量X、Y的标准差,即: Sx =(∑x2/N)1/2 =[∑X2/N-(∑X/N)2]1/2, Sy =(∑y2/N)1/2 =[∑Y2/N-(∑Y/N)2]1/2。 如果用原始分数来表示,相关系数的计算公式可写成: r=(N∑XY-∑X∑Y)/{[N∑X2-(∑X)2]1/2?[N∑Y2-(∑Y)2]1/2}。 应当指出:相关系数的计算,N应在30以上。 2.物理测验的评价 科学地评价考试质量,主要反映在四项指标上: 信度、效度、难度和区分度。 (1)信度: 信度是测验的可靠性指标,它反映测量的稳定性程度。具体地说,是指两次测验关联的程度。 某一次测验的信度怎样计算呢? 通常是将一次测验的试卷,等值地分成两半,相当于两份试卷,即相当于两次测验。 这样,前一半的分数,以变量X表示,后一半的分数以变量Y表示。 计算出相关系数r,r=(N∑XY-∑X∑Y)/{[N∑X2-(∑X)2]1/2?[N∑Y2-(∑Y)2]1/2}, 再根据公式:rXX=2r/(1+r)计算出rXX的数值。 rXX的数值就是信度的数值。 信度值在0.8以上为基本合格。 影响信度的主要因素有: ①评分的随意性。 要尽量排除主观随机因素,最好是客观评分。 ②题量(在教育测量学中叫做测量的长度)。 某次测验的题量多,信度就高。 如果某次测验的题目数量较少,信度rXX低。为了提高信度,使其达到rKK,则应增大题量。 设增加后的总题量与原题量的比值为K,则有: K=rKK(1-rXX)/[rXX(1- rKK)]。 例如,某次测验的信度rXX=0.64,为了提高信度,使其达到rKK=0.80,则K=2.25。 如果原题量为12个,则应增到27个题目。 (2)效度: 效度是测验的准确性指标。要保证测验具有较高的内容效度,应当编制测验。 编制测验时要列出双向细目表,然后进行分析: ①试卷内容的覆盖面如何? ②各级行为目标所占的分数比例是否恰当? ③各个题目的内容是否合理?是否与要求相符? (3)难度: 难度是指每个试题的难易程度。 对于选择题来说,以被测者答对(或通过)某个题目的人数(R)与总人数(N)的比值,作为该题目的难度数值(P)。则:P =R/N。 应当指出的是,P值越大,说明难度越小。 难度H定义为:H=1-

文档评论(0)

dreamclb + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档