网站大量收购闲置独家精品文档,联系QQ:2885784924

主观题自动评分系统设计与实现.doc

  1. 1、本文档共12页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
主观题自动评分系统设计与实现

主观题自动评分系统设计与实现   摘要:本文系统地阐述了如何构建一个主观题自动评分系统。该系统主要针对《计算机基础》课程中的名词解释和简答题来进行计算机阅卷。本文所构建的自动评分系统主要采用自然语言理解,并依据《知网》知识库来作为自动评分的依据。   关键词:计算机阅卷 主观题试题 自动评分   中图分类号:TP301.6 文献标识码:A 文章编号:1007-9416(2012)01-0113-02      1、引言   近年来随着计算机技术的不断发展,计算机考试渐渐成为新兴的考试方式。计算机考试中的一个很重要过程是试卷考试后的评分工作,例如现在广泛使用的考试答题卡,就是利用计算机和读卡器来完成大批量、重复的评分和成绩登记工作。把计算机自动评卷技术应用到考试中去,使得阅卷工作有可能只需计算机自动完成,于是考试自动阅卷技术成为研究的重点。计算机阅卷的效率高、速度快、准确率高、不会产生疲劳,特别适用于大规模、大批量考试试题的自动阅卷。自动阅卷评分和自动试卷分析可以将教师从繁重的阅卷工作中解脱出来,提高了教师的工作效率,可以真正实现无纸化考试。   2、系统需求分析   考试中主观题的自动评分功能涉及到模式识别、人工智能以及自然语言理解等方面相关的理论和知识,计算机还需解决一些技术上的问题。本文所建立的主观题自动评分系统的主要功能是通过所建立好的试题库及答案库对用户所提交的试卷进行自动评分。这里的试题库主要是指《计算机基础》课程中的名词解释和简答题。系统的主要模块包括知网、自动评卷和查询。   (1)知网信息获取模块的主要功能是从《知网》知识库中获取适合本系统使用的词语信息库和用于计算语义相似度的义原库。   (2)自动评卷模块中包括分句分词子模块、词语语义相似度计算子模块、句子语义相似度计算子模块和评分模块。   (3)评分模块的主要功能是对评分结果进行查询,并以友好的形式展示给用户。   主观题自动评分系统还应具有界面清晰、结构良好、使用简便、系统维护性强等特点。   3、系统概要设计   3.1 系统的总体框架   系统的总体框架图如图1所示。   各个模块的主要功能如下:   3.1.1 知网信息获取模块   知网信息获取模块的主要功能是从《知网》知识库中获取适合本系统使用的词语信息库和用于计算语义相似度的义原库。   3.1.2 建立题库及答案库模块   将用户提交的试题和答案组织和题库和答案库的形式,用作对所提交的试卷进行自动评分的标准库。   3.1.3 自动评分模块   自动评分模块是本系统的核心模块。负责对用户所提交的主观试题进行主动评分。该模块首先对试题答案进行分句分词操作,将其分解为计算机所能处理和识别的中文单词。然后计算这些中文单词和标准答案中单词的语义相似度,再根据这些单词相似度计算各个句子和标准答案的语义相似度。最终根据所有句子的语义相似度计算整个答案的准确度,并根据该结果进行评分。   3.1.4 查询模块   该模块的主要功能是对评分结果进行查询,并以友好的形式展示给用户。   3.2 知网信息获取   3.2.1 知识库提取   要建立用于语义相似度计算所需要的《知网》数据库,首先创建一个空的词库结构,用于存放提取出的《知网》数据库。然后建立一个结构体,用于暂存每一条概念的词条信息,从中提取出NO(词条号信息),W_C(汉语词性信息),以及DEF(定义信息)项。接着逐条导出《知网》词目并提取其中有用信息,直到所有词条相应信息全部被提取。最终生成基于《知网》知识库的数据库,作为下一步义原数据库建立的输入。   3.2.2 义原层次树和义原数据库的建立   首先建立一个用于暂时存放实体条目的entity层级表结构体,存放实体的重要属性。然后创建基于义原的实体层次树,用于存放各个义原的结构,表示概念与属性之间的关系。接着将创建的义原实体层次树导出到数据库中,将义原实体层次树中每个节点存入数据库的字段中,最终生成义原数据库。   3.3 自动评卷模块   3.3.1 分句分词模块   为了减少试题答案中无效的回车、换行等符号,首先去除答案前面和后面的回车换行,然后对答案进行分句处理并去除答案中间的无用空行。最后在把分好的句子片段存储在相应的子句存放数组中。分词本文采用的是最大词长匹配算法。最大匹配算法需要一个已知的词汇数据库作为支撑,本文以知网数据库作为该算法的词库。   3.3.2 词语语义相似度计算模块   (1)词语相似度计算:从词语Wi和词语Wj间义项的任意组合计算相似度值中取出最大义项相似度作为词语Wi和词语Wj的相似度。   (2)义项相似度计算:《知网》中义项间相似度的计算,均要基于义项的概念表达式(DEF)进行计算。对

文档评论(0)

bokegood + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档