- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
教务管理系统中数据挖掘技术应用探究
教务管理系统中数据挖掘技术应用探究 摘要:教学管理决策在高校教育中是一项重要的工作。目前,高校内部运行的各种管理系统和各类数据库,已经积累了包括学籍管理系统、成绩管理系统在内的海量数据。本文主要研究如何采用数据挖掘技术在学院教务管理系统中,对海量数据进行发掘和应用,为人才培养提供比较客观的决策支持
关键词:数据挖掘;决策树;ID3算法
中图分类号:G471 文献标志码:A 文章编号:1674-9324(2017)14-0009-02
一、前言
随着信息技术的发展,数据挖掘正成为一个日益受到重视的热点研究领域,并得以蓬勃发展,越来越显示出其强大的生命力。据相关资料调查显示,在一个大型企业数据库中,只有其中百分之七的数据能够得到很好的应用。同样,高校内部运行的各种管理系统和各类数据库,已经积累了海量的数据,然而隐藏在这些海量数据中的深层次的模式一直没有得到充分的发掘和应用,学校管理者只能通过简单数据查询和排序等传统数据库技术功能获得表面的信息。我们努力想要解决的是,如何对那些庞大的海量数据进行高层次的处理,从中找出管理者关心的规律和模式,以此帮助管理者更好地把现有的数据转化为可供使用的知识进行决策和研究,来提高学校管理决策的科学性,提高管理水平和办学质量
二、决策树分类算法
决策树(Decision Tree)学习是以实例为基础的归纳学习算法。它着眼于从一组无次序、无规则的事例中推理出决策树表示形成的分类规则,它的一个最大优点就是在学习过程中不需要使用者了解很多背景知识(这也同时是它最大的缺点),只要训练例子能够用“属性―结论”式的方式表达出来,就能使用该算法来学习。决策树算法中最著名的算法是Quinlan提出的ID3算法。他把C.E.Shannon的信息论引入到了决策树算法中,把信息熵作为选择测试属性的标准,对训练样本集进行分类,并构造决策树来预测如何由测试属性对整个样本空间进行划分。ID3算法采用信息量作为测试属性的选择标准来分割训练样本集并最终生成决策树
三、数据的收集和整理
本研究利用数据挖掘技术中的ID3算法,在教务管理系统中,实现一个专业方向选择辅助指导的模块,大学生在修完职业基础课后,能更好地按自身的特点选择专业方向
在大学生专业方向辅助指导中,我们将以服装系为例使用决策树分类挖掘技术中的ID3算法,通过学生大学一年级专业基础课的学习成绩,配合问卷调查,预测学生最适合选择的专业方向
我们以华南女子学院服装专业学生在大一期间的成绩为挖掘数据源(共194个样本),根据学生各科的学习成绩信息,剔除了成绩表中与专业发展方向无显著相关性的属性,如体育等课程属性,选择7门具有代表性的专业基础课作为基础数据进行处理
其次,对训练表中的每一列成绩属性的值进行离散化处理。我们将成绩分成三个部分,用A表示[80,100]之间的分数,用B表示[70,79]之间的分数,用C表示[0,69]之间的分数
除了学习成绩之外,我们还需要考虑影响学生专业方向选择的其他因素,服装系的专业方向具体划分为三个方面:制板与工艺方向;造型设计方向;市场营销方向
学生在大一修完专业基础课后,自行选择专业方向。为了更好地了解学生选择专业方向的动机、阶段性学习的完成情况,以及大学二年级工学结合的专业实践后对自己所选方向的满意度,我们设计了问卷调查调查:①学生的个人兴趣:A.手工制作;B.创意设计;C.人际交往。②选择专业方向?r是否按兴趣来选择。③经过一年的专业学习,觉得现在的专业方向是否合适自己
通过数据收集、数据整理之后,我们实际可以使用的数据记录为182条,由于在系统实现过程中,我们还需要预留一部分数据进行数据分析准确度测试,因此,在放入训练数据集进行决策树模型生成训练的实际数据记录为146条
四、利用ID3算法构造学生成绩分析决策树
(一)信息增益的计算
首先我们先利用公式计算出信息熵,参加数据挖掘的记录有146条,经过两年的专业学习后,认为自己更适合学习制板与工艺方向的有58人,认为自己更适合学习造型设计方向的有48人,觉得自己更适合市场营销方向的有32人,不确定方向的8人
下面计算信息增益值
利用公式:信息增益值I(S/A)=H(S)-H(S/A)
经过整理后,参加数据挖掘的属性有9个,通过计算得到的Gain(S,xq)最大,即个人兴趣对分类最有帮助,所以选择兴趣对决策树的结构进行首次分区,产生4分枝
(二)递归创建决策树
选择兴趣作为测试属性之后训练实例集分为4个子集,生成4个子节点,对每个子节点递归采用上述过程进行分类直至每个节点中各个实例属于同类
以“兴趣=手工制作”为例
选择手工制作的同学一共有56人,经过两年的专业学习后,认为自
您可能关注的文档
最近下载
- 2025年全国特种设备安全管理人员A证考试题库(含答案) .docx
- 灌装操作工作业指导书.doc
- 番茄酱灭菌灌装机说明书end.doc VIP
- 性格培养08勇敢的小熊.pptx
- 腐植酸肥料生产建设项目可行性研究报告.doc
- 民营企业财务管理新规制度.doc
- 2023基于手机银行APP专区调研的客群精细化运营分析报告.pdf VIP
- 杀菌操作工作业指导书.doc VIP
- 基于手机银行APP专区调研的客群精细化运营分析报告-42页.doc VIP
- 马工程系列《教育学原理》项贤明主编第一到十章全完整版课件PPT:产生发展、教育与社会人的发展、目的培养目标、制度、课程教学德育、教师学生等(1).pptx
文档评论(0)