网站大量收购闲置独家精品文档,联系QQ:2885784924

基于机器学习技术分析课堂提问的认知.pptx

  1. 1、本文档共17页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于机器学习技术分析课堂提问的认知

基于机器学习技术分析课堂提问的认知水平 自动化1503班 王晓文 2015年12月25日;提问被广泛认为是一种有效的教学策略,在教师与学生的相互交流之间存在着各种用途。在教育实践中,教师对课堂提问的分析具有特殊的效益。本文通过分析将老师的问题按照布鲁姆的分类自动分类到不同的认知水平的有效性,从而探讨了机器学习技术有效性。更具体地说,本文利用三种最有效的机器学习的分类技术:K-最近邻,贝叶斯和支持向量机的三种方法。这样,一个数据集的问题经过收集和分类,并且按照布鲁斯分类。预处理步骤应用到一个适合于机器学习技术问题的表示。使用这个数据集,三种机器学习技术的性能就被评估。结果表明,K最近邻和贝叶斯性能相媲美,向量机在F1和精度性能优越。此外,结果还表明,机器学习技术对于代表问题的特征的数量显示出不同程度???敏感性问题。;布鲁斯分类是最突出的分类系统问题的代表,它是由本杰明.布鲁斯提出,在他的努力,把思想行为分类成三个领域:认知(精神技能),情感(情感或情感领域的增长)和运动(手动或物理技能)。认知领域因其在中学和中学后教育的适用性受到重视。在认知领域,布鲁斯确定了六个不同学习层次 并且根据层次结构进行了组织。 认知方面的六大类如下: ~知识:注重记忆,识别信息; ~理解:专注于组织思想、信息的解释和翻译; ~应用:重点利用细节和原则解决问题; ~分析:专注于寻找潜在的组织和一个整体的划分; ~合成:专注于一个想法组合,以形成新的东西,创造一些独特的无论是口头上或身体上; ~评价:专注于对问题作出判断,解决差距或分歧。 ;从计算的角度来看,将问题自动按照BCL分类可以定义为按照问题的内容自动匹配到某一个确定的布鲁斯认知水平。显然,这项任务可以被看作是文本分类的一种特殊形式。也就是说,与典型的文本分类问题相比,它具有特定领域的特点。;一般而言,目前的文本分类的趋势主要是密集的使用机器学习技术。理想的用机器学习技术设计文本分类系统需要四个主要步骤:文本表示,特征选择,分类建设和分类测试。在文本表示步骤中,使用文本表示方法将文本映射到适于后续步骤的紧凑表示中。在特征选择步骤中,原始集的特征子集由特征的选择方法选择。在分类器的构造步骤中,机器学习分类器通过对人工分类下的一组文本的特征观察自动创建。在分类器的测试步骤,通过搜集到一个新的未知的文字来测试分类器的性能。因为问题分类是文本分类的一个实例,这些步骤也适用 。;基本上,问题文本不能直接用机器学习技术解释,因此,利用转换程序映射一个问题Qi文本到紧凑的表示,其内容需要统一适用。代表一个问题Qi的常见的方法是作一个特征权重W1j…Wtj矢量,0Wj1表示特征T对问题Q的贡献率。;机器学习分类器对一类线性分类的有效性可以通过一些措施进行评价。这些措施的计算基本上取决于所获得的应急表。应急表主要包括以下值 A:系统按照布鲁斯分类正确分类的问题数目。 B:系统按照布鲁斯分类错误分类的问题数目。 C:属类但系统没有正确布鲁斯分类的数目。 D:系统正确的没有分配到BCLS的问题数量。 以下是用于评估机器学习分类性能的常用的措施: 精度(P)召回(R)Fβ测量 准确性(ACC) 除了这些对分类器的措施,分类的有效性可以通过宏观平均值(所有类未加权平均效率)和微观平均值(从每类列联表的总和计算的有效性)进行评估。 ;K-近邻法 k最近邻方法是由Cover和Hart提出的.所谓k最近邻,就是考察训练文本集中与该新文本距离最近(最相似)的k篇文本,根据这k篇文本的类别来预测待分类文本的类别.距离(相似度)的度量可以使用欧氏距离、夹角余弦或者明考斯基距离等,通常使用夹角余弦.通过相似度的简单累加或者加权平均,选择相似度最大的类别作为新文本的类别.;朴素贝叶斯法: 朴素贝叶斯是一种有效的概率分类方法,已应用于文本分类中。它的基本思想是单词和类的联合概率来估计类的概率。朴素贝叶斯方法是最早用于文本分类的分类器算法,是一种统计学分类方法,它基于贝叶斯决策论并且基于此项独立的假设,不同属性对分类结果的影响是独立的。;基于支持向量机的文本分类 支持向量机是Vapnik等提出的一种新的学习方法,它是建立在统计学习理论的VC维(Vapnik Chervonenkis Dimension)理论和结构风险原理基础上的,根据有限的样本信息在模型的复杂性(即特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。支持向量机的最大特点是根据结构风险最小化(Structural Risk Minimization: SRM)准则,以最大化分类间隔构造最优分类超平面来提高学习机的泛化能力,较好地解决了高维数、非线性、局部极小点等问题,在训练样本数目相对较少的情况下也能取得很好的分

文档评论(0)

dajuhyy + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档