必威体育精装版基于Kmeans和CBR方法的高校就业预测模型应用研究-高等教育论文.doc

必威体育精装版基于Kmeans和CBR方法的高校就业预测模型应用研究-高等教育论文.doc

  1. 1、本文档共37页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
必威体育精装版基于Kmeans和CBR方法的高校就业预测模型应用研究-高等教育论文.doc

基于Kmeans和CBR方法的高校就业预测模型应用研究   【摘要】提出运用Kmeans聚类算法和CBR案例推理方法对高校学生就业趋向进行预测。针对采集的高校就业信息的高维海量数据,首先使用Kmeans聚类方法将已就业数据划分成不同的就业类别,从而极大地减少了特征分析工作量。对未就业数据进行预测时,先计算跟每一聚类中心的距离值,从而得到其合适的分类,再在每一类中进行CBR推理,最后得出对其的预测分类结果。实验结果表明,提出的算法预测结果较为精确,为高校就业指导提供了帮助。   【关键词】Kmeans聚类 CBR推理 高校就业预测      随着高校的扩招,我国高等教育已经由精英教育转向大众教育,从1999年开始,高等学校的办学规模、招生规模逐步扩大。而由此带来了应届毕业生的就业形势一年比一年严峻,2010年,全国普通高等毕业生达630万,比2009年的611万又增加了19万人[1]。面对如此大的就业压力,各个高校也加强了就业指导方面的工作。不少高校开展了对学生的就业指导,如收集、筛选有效的需求信息,为毕业生提供指导与咨询等,以提高学校的就业率。但很多高校就业工作还只是做了面上工作,缺乏实际效果,并不能真正解决学生的实际问题。   目前,很多高校都在使用就业管理系统、学籍管理系统等数据库帮助工作,但这些数据库往往还停留在简单的统计、查询等功能上。由于毕业生就业工作涉及的数据量十分巨大,而且时间集中,仅靠传统的数学和统计手段已经不够。如何运用数据库中的数据得到对就业指导有用的信息成为了一个非常有实际意义的研究内容,而数据挖掘技术可在高校就业预测中有很好的应用前景。   本文首先用Kmeans[2]方法对往年已就业学生进行聚类,对每一类特征进行分析,得到其就业特征信息。对未就业学生进行预测时,先将其与每一类中心点计算距离,将其分入某一类,在同一类中再用CBR[3]进行案例推理,从而得出其与哪几个个案最相似,用这些成功就业的特征作为该学生的预测结果,而且还可以根据这些学生特征给新同学一个建议。本文结构如下,第1节介绍基于Kmeans和CBR的高校就业预测模型,第2节给出实验结果和分析,最后一节给出结论。      1 基于Kmeans和CBR的高校就业预测模型      学生管理和就业数据数据量庞大,因此需要使用数据挖掘知识进行处理,使用数据挖掘对学生管理和就业数据进行管理的概念流程如图1所示。   在图1的数据挖掘和机器学习库中,可以使用多种算法,如决策树算法[4]、关联规则算法[5]、SVM(Support Vector Machine,支持向量机)[6]算法等等。本文重点是对就业数据进行预测,因此提出了使用Kmeans聚类算法和CBR算法,以得到较好的预测结果。   Kmeans(K均值)聚类算法是一种基于划分的聚类算法,建立在最小化误差平方和的准则上。其过程是先随机选择一些初始代表点作为初始聚类中心,然后计算其余样本点与各中心点的距离,把它们分到最近(距离最小)的类中去;然后对每一类中的样本点计算均值,把这个均值作为新的聚类中心点;反复迭代,直到聚类中心点不再改变或者达到迭代最大步数。Kmeans聚类算法的效率很高,时间复杂度为O(tkn),其中n是样本数,k是聚类的类数,t是算法迭代次数(tlt;N)。   CBR(Case-Based Reasoning,基于案例推理)方法是对已经发生的“历史”与待求解问题进行相似性匹配,利用相似的一个或若干个“历史”对待求解问题进行解答。当给定一个待求解问题,CBR首先检查是否存在一个同样的训练案例。如果找到一个,则返回附在该案例上的解。如果找不到同样的案例,则CBR将有哪些信誉好的足球投注网站具有类似于新案例的训练案例。概念上讲,这些训练案例可以视为新案例的邻接者。CBR试图组合临近的训练案例,提出新案例的解。如果解之间出现不相容,可能需要回溯有哪些信誉好的足球投注网站其他解。CBR的主要难点包括找到一个好的相似性度量,开发对训练案例索引的有效技术和组合解的方法。      本文提出的基于Kmeans和CBR的高校就业预测模型的流程示意图如图2所示,首先用Kmeans方法对往年已就业学生进行聚类,对未就业学生进行预测时,先将其与每一类中心点计算距离,将其分入某一类,在同一类中再用CBR进行案例推理。      2 实验结果和分析      数据挑选自最近几年实际的就业信息,共320个样本,部分样本数据例子如表1:      2.1 数据预处理   首先要把数据进行预处理,不是数值型的数据转换成数值型数据。如性别男用0代表,女用1表示,获奖情况我们也将其数值化,考虑用获奖的次数来替换获奖这个属性,社会工作也是如此.对特长我们简单用有特长(数值1表示)、无特长(数值0表示)来区分。生源地则

文档评论(0)

zhangningclb + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档