基于校园大数据的助学金获取关键因素分析.docx

基于校园大数据的助学金获取关键因素分析.docx

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

??

?

??

基于校园大数据的助学金获取关键因素分析

?

??

?

?

?

?

?

?

?

???

?

?

?

?

?

王煜刘彤彤郭磊

摘要:本文在获取校园一卡通数据的基础上,采用数据挖掘与Logistic回归分析方法,以某高校的助学金发放为例,分析助学金获得者的共同特征,为其建立数学模型,以期完成精准资助,帮助真正家庭贫困的同学顺利完成学业。

关键词:助学金;数据挖掘;影响因素;Logistic回归分析

中图分类号:G467.8文献标志码:A文章编号:1673-8454(2018)17-0064-03

一、引言

助学金是帮助困难学生完成学业,保障学习质量的重要手段。精确的助学金资助策略,体现了决策者的管理智慧和教育公平性。目前国内许多学者主要关注以下几个方面的研究内容:①助学金管理模式的探索及体系的完善。国内学者从影响资助的不同因素出发,构建了多样化的资助评价体系。如余春玲根据平衡加分卡思想,分析了目前高校贫困学生资助模式存在的问题,并基于平衡记分卡,构建了一个包含财务、客户、内部流程管理过程、学习与成长四个方面指标的高校贫困学生资助评价体系。[1]张彦坤结合高校国家助学金评定实际情况,构建了一套包括4项一级指标、12项由一级指标细化而来的子因素的助学金量化评定指标体系。[2]②助学金制度绩效调查分析。国内学者大多从财政教育投资的投入、活动、产出、结果和影响等方面,多角度构建了多层次的高等教育绩效评价体系。[3]如陈绵水等从助学金发放(资金投入指标)、助学金使用(过程指标)、助学金效果(产出指标)三个方面评价助学金制度绩效,得出我国助学金评定基本做到公平公正,但仍存在宣传工作不尽人意,信息不够畅通,存在少量暗箱操作等问题。[4]③关于影响助学金发放的因素模型的探究。国内学者大多综合利了模糊评价与熵权法,建立模糊评价模型。[5]如夏阳针对资助判定问题,运用模糊层次分析方法,构造模糊一致矩阵,建立了助学金判定模型。[6]也有学者利用了SPSS中的多元线性回归模型。如邓海云进行多元线性回归分析,应用stepwise方法,建立了评定的多元线性回归关系模型。[7]

现有文献研究多局限于理论层面的宏观分析,实证分析和数学模型的辅助研究较少,并且已有的实证分析大都是通过问卷调查得到的数据,具有一定的主观性。本文则针对某高校校园一卡通的客观数据,采用数据挖掘技术,利用相关性分析提取与获得助学金与否有关的特征因子,以期进行精准助学金发放。本文的数据直接来自于较为客观的学生一卡通数据,在此基础上,本文将获得助学金与否作为被解释变量,建立二分类Logistic回归模型来直观说明影响助学金获得与否的关键因素。

二、模型设计

逻辑回归又称logistic回歸,是一种广义线性回归,用于在被解释变量是非连续情况下进行回归分析。根据被解释变量的分类方式不同,有二分类logistic回归和多分类logistic回归。

1.模型选择

2.变量选取

三、实证分析

本文根据某高校学生一卡通数据,选取108名学生作为样本,进行实证研究。

1.变量描述性统计分析

本文从极小值、极大值、均值、标准差四个方面对108名学生一个月的一卡通数据进行描述。在各消费中,食堂消费的均值最大,为318.5,说明该校学生的花销大多用于伙食消费;成绩排名的标准差最大,达到843.5,说明所选学生的学习存在明显的两极分化;开水房消费与坐校车次数的极小值为0,说明开水房消费与校车消费并不是学生的必须消费;去图书馆次数的标准差较大,说明学生的学习态度存在较大差异。具体描述情况见表2。

2.多重共线性分析

Hanushek和Jackson认为Logistic回归模型的参数易受解释变量间共线性的影响[11],由于本文是多因素分析,为了防止各变量存在多重共线性,避免各个变量之间的相互影响,保证结果的准确性,首先对解释变量与被解释变量进行多重共线性检验。[12]

本文选取方差膨胀因子(VIF)和条件索引(CI)来检验变量间的共线性[13],一般认为VIF值越大则变量共线性越强,VIF≥5时存在复共线性,VIF≥10时存在严重共线性。当条件索引30≥CI≥10时存在弱共线性,100≥CI≥30时存在中等共线性,CI100时存在严重共线性。而当CI10时认为不存在共线性。

从表3的多重共线性分析结果可以看到,各个解释变量的方差膨胀因子(VIF)的最大值为1.182,未超过5;条件索引(CI)的最大值为7.481,小于10,说明各变量之间不存在多重共线性问题,可以在一个模型中使用。

3.逻辑回归分析

本文选取H-L拟合优度检验[14-15]来判断模型的拟合情况,零假设为模型能够很好地拟合数据。分析结果显示,Sig=0.5960.1,接受零假设,说明模型拟合数据程度好。

表4是对

您可能关注的文档

文档评论(0)

186****5366 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档