第三篇第10章利用APMS进行数据分析分解.doc

第三篇第10章利用APMS进行数据分析分解.doc

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
促进专业发展篇 第10章 基于大数据的学业成绩分析                     ――利用APMS进行数据分析 理论基础:(1)凡物的存在必有其数量(桑代克) (2)凡有数量的东西都可以测量(麦柯尔)教育测量的特点 (1)测量对象的复杂性和模糊性 (2)测量目的的针对性 (3)测量结果的间接性和推断性 (4)度量单位的相对性 .3 教育统计、教育评价?1、何谓教育统计? 教育统计就是运用统计学的一般原理和方法研究教育科学领域数量关系,找出客观规律的一门学科。 2、何谓教育评价? 教育评价是根据一定的教育目标,运用可行的科学手段,通过系统地收集信息资料和分析整理,对教育活动、教育过程和教育结果进行价值判断,从而为教育决策提供依据的过程。 .4 教育测量、统计、评价的关系 ●“测量”侧重于为“评价”提供反映事物本质状态的原始数据。 “统计”着力于对这些原始数据进行整理、分析、描述与推断,从而提供反映事物本质状态的统计数据。 依据“测量”与“统计”获得的数据,“评价”才能作出科学、客观、准确的价值判断。 没有无目的的测,也没有无依据的评,所以教育测量、教育统计与教育评价通常是一对不可拆分的组合。 1.5 分析模型 一般分析从教育局、学校、老师、班级、学生等进行系统分析。 第2节 指标体系 2.1 《教育测量学》的指标 它主要是四个方面: 难度 (P) 试题或试卷的难易程度 区分度 (D) 试题或试卷对考生水平高低的区分程度 信度 (R) 考试的可信(稳定)程度 效度 (E) 考试的有效(准确)程度 同一题目或同一试卷,在不同的对象、不同的环境,得到的难度/区分度/信度/效度的值是不同的。 2.1.1、难度 (1)难度的涵义 简单理解:试题或试卷的难易程度 (2)难度的计算(用P表示) 客观题难度:P=答对的数目/总的数目 无法考虑多选题的不完全得分情况 主观题难度:P=(高分段的得分率+低分段的得分率)/2 高分段指前27%的人,低分段指后27%的人 通用的难度:P=得分率 (试题、试卷都用这个计算) (3)衡量难度的标准 学校的考试,一般难度控制在0.7-0.8。相当于100分满分,平均分70-80分,有利于反映学生真实水平,有利于区分学生的好中差。 难度0.4,属于偏难,相当于100分满分,平均分不到40分,无法有效区分学生的水平。 (4)难度涉及的对象 与试题、试卷有关,也与不同的学生对象、不同的考试环境有关。 (5)影响难度的因素 对考生水平的正确估计、考察知识点的多少、考察能力的复杂程度或层次的高低、命题的技巧、考生对试题的熟悉程度。 2.1.2、区分度 (1)区分度的涵义 简单理解:试题或试卷对考生水平高低的区分程度 (2)区分度的计算(用D表示) 试题的区分度:D = PH – PL D =(高分段的难度 - 低分段的难度) D =(高分段的得分率 - 低分段的得分率) 高分段指科目分前27%的人,低分段指科目分后27%的人 试卷的区分度:依据试题的分值比例加权计算 (3)衡量区分度的标准(用D表示) 区分度的取值:-1.00到+1.00之间,负数代表水平高(总分高)的学生考得了低分,区分度的值越大越好。 0.4以上,优秀;0.3-0.39,良好;0.2-0.29,尚可;0.19以下,差。 (4)区分度涉及的对象 与试题、试卷有关 (5)提高区分度的方法 使试题的难度适中,使整份试卷难度适中;这是提高区分度的重要方法。 全面的考察学生的学习成果;使高能学生得高分或低能学生得低分,使分数尽量分布在整个分数量尺上。 (6)区分度与难度的关系 难度的高低直接影响考生的得分;难度过高或过低,考生的得分都比较集中,从而区分度较低;难度适中,不同水平的考生得分差异较大,从而区分度较高。 2.1.3、信度 (1)信度的涵义 简单理解:考试的可信程度,衡量稳定性 理解信度的一个例子: 某人称体重 如果对于A称,第一次称50公斤;第二次称60公斤,则两次结果相差太大,即结果不稳定,认为这个A称缺乏信度; 如果对于B称,第一次称50公斤;第二次称52公斤,两次称结果都是一样或越接近,即结果稳定,认为这个B称是有信度的; 衡量一个称是否有信度,与最终测量结果是否准确无关,即不管测的结果对错,只管测出的值是否稳定。 (2)信度的分类和计算方法 重复信度(再测信度):同一试卷做两次——不可行(相当于泄题) 复本信度:同时做两道接近的题——不可行(试题难找) 折半信度(分半信度):一次考试分成两半来计算——不可行(不好拆分) α系数信度(克龙巴赫):克龙巴赫公式——可行且有效 (3)衡量信度的标准(用R表示) 没有明确标准,根据考试目的和目标而定。对

文档评论(0)

jiayou10 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8133070117000003

1亿VIP精品文档

相关文档