基于教育大数据分析的高校学生行为预警研究.docxVIP

基于教育大数据分析的高校学生行为预警研究.docx

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

?

?

基于教育大数据分析的高校学生行为预警研究

?

?

杨文君刘新薛宝平李健刘娇

[摘??????要]?新的安全预警管理系统是以大量数据为基础,运用决策树、机器学习技术、聚类分析等方法,根据学生的身心发展规律,对不同类型的数据进行挖掘,从而分析出学生的学习、生活、思想特点和规律,进而帮助教师更加了解学生,并实现对可能发生校园突发事件的一类学生提前进行预警的目的。

[关??键??词]?大数据;高校学生;行为预警;研究

[]?G645?????????[文献标志码]?A???????[]?2096-0602(2020)40-0020-02

一、大数据背景下高校学生管理研究的意义

大数据所具有的重要功能之一就是预测,可以收集学生在校园生活中所生成的各类数据,通过知识的融合对学生的情况进行实时预测,实现对学生学习、生活和思想数据的实时监管。郭晓科在《大数据》中指出大数据的到来使人们从自己的原有思维框架中走出,依靠大量数据的整合寻找彼此的相关性,是一个先看到结果再进行分析的过程[1],利用大数据技术进行相应的数据处理,再对学生的数据进行关联性分析,整理出学生在学校学习和生活过程中产生的各种问题并建立早期的预警系统。发现与校园突发事件相关联的因素可提前进行干预,降低其可能带来的不良影响和损失,还可以根据学生的情况提出合适的成长方法,这对高校的教育管理工作是一个飞跃提升。

二、研究内容及采取的措施

把学生的多种数据整合在一起,如学生教务数据、图书馆数据、一卡通数据、门禁数据、学工数据、上网数据、个人信息数据等,使这些数据在关系型数据库和分布式存储之间转换,并把他们放在分布式系统HDFS中,通过对这些数据进行预处理来掌握学生的行为并预测他们的生活轨迹[2]。

学生行为的聚类分析,学生行为预测是通过Scala实现聚类分析、关联规则挖掘、协同过滤等机器学习算法在Spark上的并行化,对学生的历史数据运用该技术进行分布式处理。把分析结果用JavaWeb技术与ECharts以可视化的形式来展示,对需要重点关注以及一般关注的两类学生进行相关性分析,提出具有建设性的参考意见,以便于动态监测学生行为,及时指导学生,使他们全面健康发展。

(一)数据集成与预处理

1.数据预处理

根据项目所提出需要的数据信息,观察数据的特征,对学生个人信息数据、教务数据、学工数据等数据先进行数据的预处理,将不同来源的数据进行归一化处理。

对于我们采集到的数据,有些学生存在已经退学、休学或者缺考、缓考等现象,这些不确定因素造成了数据的缺失。另外,由于教务管理系统里的数据录入时间比较早,近几年系统在不断调整,已将数据结构打乱。通过对数据进行过滤清洗,保证数据的完整性和利用率,去掉一些无用的和冗余的数据。

学生行为预警主要是针对在校本科学生行为的预警分析与预测,而管理系统里数据内容非常多,有临时聘用的人员、学校职工,还有硕士和博士,把这些冗余人员的记录清洗掉,对数据信息进行过滤,同样对一些上网数据、一卡通数据、图书馆数据等都要进行数据的过滤与清洗[3]。

2.数据转换

由于学校保留的数据都是用户的历史记录数据,这些数据数量庞大,而且质量不高,本项目将数据运用统计学、聚类和分类方法进行泛化和压缩。同时,根据需要对数据进行转换。例如把学生每天的消费次数、每个月的月消费额、消费时间段的频次作为学生原消费数据的转换方式内容,为使数据更有利用的价值,把不同数据做相应的转换。

3.数据归约

由于在不同的系统中有很多重复的数据,而且有些数据也不是此项目需要挖掘的目标,为了达到降低数据维度的目的,针对那些无关联的数据属性,在数据预处理过程中,对其进行规约和剔除。

(二)处理与分析实时学生数据

对收集到的各种数据(包括教务数据、图书馆数据、一卡通数据、门禁数据、学工数据、上网数据、消费数据)的集成和预处理,进行统计分析。建立学生画像,根据学生画像的特征对学生行为进行聚类分析,运用基于密度优化的K-means聚类方法来进行分析[4]。数据分析结果可视化模块是以JavaWeb技术以SpringMVC框架为基础,对数据处理与分析模块数据分析结果进行可视化。通过对学生在校期间学习和生活的各种数据进行分析,产生数据分析结果,包括以下内容:学生出勤率的分析是每门课程的考勤情况以及每月到课率的波动曲线,学生成绩的分析是对每门课程的统计以及对这些课程的成绩在班级和专业里的排名情况和学生学分绩点情况的分析。学生消费分析是指上大学以来的消费信息,每月的消费和每日的消费,与同学相比的消费情况。学生图书借阅分析是指对学生入学以来进入图书馆的频率以及入馆时间、借阅时长、借阅的总册数情况的分析。学生上网记录分析,包括最长的上网时间、最短的上网时间及平

文档评论(0)

周澈 + 关注
实名认证
文档贡献者

天堂湖

1亿VIP精品文档

相关文档