基于决策树的毕业生课程优化算法设计.docx

基于决策树的毕业生课程优化算法设计.docx

  1. 1、本文档共15页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

?

?

基于决策树的毕业生课程优化算法设计

?

?

[摘要]利用高校已有的毕业生就业信息,应用统计规律性和决策树数据挖掘理论,发现隐藏在毕业生就业信息后的信息,为学校根据社会需求变化而变更培养人才结构提供决策支持。

论文关键词:数据挖掘,决策树,毕业生

现有高校的就业率统计大多是把有没有工作岗位作为衡量标准,这种方法只能从宏观上反映出社会对人才的总需求和总供给之间的关系,而掩盖了社会人才需求结构与高校人才培养结构之间的关系。因此本文认为对毕业生就业信息的应用分析应该区分是否“所学即所用”的在本专业或本行业就业的分析理念。那么这就给统计工作带来了巨大的挑战,如何区分哪位毕业生的就业是属于本专业的呢,我们提出把各专业的毕业生的就业看成是一种模式,即有一定的规律可遵循。把高校毕业生就业信息满足与该模式的认为是本专业或本领域就业,而不满足该专业就业模式的为专业外就业。

2、就业模式库的建立及就业形式分析算法

2.1就业模式库的建立

设某高校有计算机专业,那么根据该专业的就业实际可以认为该专业毕业生就业模式库为:软件开发技术总监,软件工程管理,软件开发,软件维护,软件测试,电子资料处理,硬件生产,硬件维护,计算机教师,非计算机专业领域的应用。按照这种模式建立某校就业模式库如下图1.1所示。随社会用人结构的变化,可能当前建立的模式库没能包括有些新的就业形式,也可能有些已经过失。像其它系统的规则库一样,就业模式库为人工手动设置,可以进行添加、修改、删除操作,这样就可以实现螺旋式的就业模式库的建立。

图2.1就业模式库

2.2就业形式分析算法

(1)选择统计分析数据的起始年限,从时间范围生界定分析的数据对象;

(2)按统计分析的专业进行数据的抽取;

(3)根据第二步选择相应专业的就业规则库;

(4)当就业栏信息与规则库中的一致时,我认为相对与该专业,该学生在本专业就业,否则即为没有在本专业就业;

(5)求得在本专业就业率或非本专业就业率。

3、基于决策树的课程优化设置

实现基于决策树的课程优化设置就是希望通过发现毕业生所从事的工作的好坏与学校在课程设置上的关系,希望发现有一类课程对学生的就业起到关键作用而有的课程对毕业生的就业影响相对较小。

3.1学生成绩表的预处理

对成绩表决策属性的分类。为了便于决策树的使用把所涉及的课程总计分为四类:专业基础课,专业课,英语课,实践课。以计算机专业为例,把计算机专业的课程分为如下图所示的四类。我们不难看出计算机专业基础课主要包括:计算机数学基础、计算机专业英语、数据结构、微计算机技术、计算机组成原理、计算机操作系统、软件工程、软件开发工具与环境、数据库系统概论、多媒体技术基础及其应用、计算机系统结构、管理信息系统;计算机专业课主要包括:计算机网络、IPV6、网络数据加密算法研究、服务器配置、网络编程、网络存储系统;实践课程主要包括:ACM算法设计实践、毕业设计、面向对象程序设计。

对每一大类成绩的处理。按照我们上图的分类处理,我们的到的专业基础、专业课、英语课、实践课程四类都不是原子的。为此对四大类的成绩进行如下的处理:

(1)对每一大类计算期望值E(平均值)。设某一类,则平均值可以通过下式求得:

(2)对每一大类的平均值进行离散化处理,用V(C)函数表示。规定当E90时,该属性值记为优;为E80时,该属性值记为良;否则记为中。

3.2就业信息表的处理

由于毕业生就业的工作新式种类繁多,并且有时即便是同一性质的工作也有不同的叫法,为了克服这一问题。我们人为的对毕业生从事的工作性质进行分类,本文根据毕业生从事的工作与所学专业的相近程度,把工作性质分为三类:高度相近(E1),相似度较低(E2),非本专业(N1)。如对计算机专业我们可根据经验分为:软件开发技术总监(E1),软件工程管理(E1),软件开发(E1),软件维护(E2),软件测试(E2),电子资料处理(E2),硬件生产(E2),硬件维护(E2),计算机教师(E2),非计算机专业领域的应用(E2),其他非本专业领域(N1)。

通过以上对学生成绩表和毕业生就业信息表的预处理,我们把毕业生的成绩表和就业信息表的连接运算,得到新的成绩-就业表,如下表所示。

?表3-1成绩-就业表

?

学号

专业基础课

专业课

实践课

英语

从事工作性质

7000101

E1

7000202

E2

7000203

E1

7000204

E2

7000205

E2

7000206

N1

7000207

E1

7000208

E2

7000209

E2

7000210

N1

7000211

E1

文档评论(0)

158****1629 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档