- 1、本文档共6页,可阅读全部内容。
- 2、有哪些信誉好的足球投注网站(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
??
?
??
基于校园大数据的助学金获取关键因素分析
?
??
?
?
?
?
?
?
?
???
?
?
?
?
?
王煜刘彤彤郭磊
摘要:本文在获取校园一卡通数据的基础上,采用数据挖掘与Logistic回归分析方法,以某高校的助学金发放为例,分析助学金获得者的共同特征,为其建立数学模型,以期完成精准资助,帮助真正家庭贫困的同学顺利完成学业。
关键词:助学金;数据挖掘;影响因素;Logistic回归分析
中图分类号:G467.8文献标志码:A文章编号:1673-8454(2018)17-0064-03
一、引言
助学金是帮助困难学生完成学业,保障学习质量的重要手段。精确的助学金资助策略,体现了决策者的管理智慧和教育公平性。目前国内许多学者主要关注以下几个方面的研究内容:①助学金管理模式的探索及体系的完善。国内学者从影响资助的不同因素出发,构建了多样化的资助评价体系。如余春玲根据平衡加分卡思想,分析了目前高校贫困学生资助模式存在的问题,并基于平衡记分卡,构建了一个包含财务、客户、内部流程管理过程、学习与成长四个方面指标的高校贫困学生资助评价体系。[1]张彦坤结合高校国家助学金评定实际情况,构建了一套包括4项一级指标、12项由一级指标细化而来的子因素的助学金量化评定指标体系。[2]②助学金制度绩效调查分析。国内学者大多从财政教育投资的投入、活动、产出、结果和影响等方面,多角度构建了多层次的高等教育绩效评价体系。[3]如陈绵水等从助学金发放(资金投入指标)、助学金使用(过程指标)、助学金效果(产出指标)三个方面评价助学金制度绩效,得出我国助学金评定基本做到公平公正,但仍存在宣传工作不尽人意,信息不够畅通,存在少量暗箱操作等问题。[4]③关于影响助学金发放的因素模型的探究。国内学者大多综合利了模糊评价与熵权法,建立模糊评价模型。[5]如夏阳针对资助判定问题,运用模糊层次分析方法,构造模糊一致矩阵,建立了助学金判定模型。[6]也有学者利用了SPSS中的多元线性回归模型。如邓海云进行多元线性回归分析,应用stepwise方法,建立了评定的多元线性回归关系模型。[7]
现有文献研究多局限于理论层面的宏观分析,实证分析和数学模型的辅助研究较少,并且已有的实证分析大都是通过问卷调查得到的数据,具有一定的主观性。本文则针对某高校校园一卡通的客观数据,采用数据挖掘技术,利用相关性分析提取与获得助学金与否有关的特征因子,以期进行精准助学金发放。本文的数据直接来自于较为客观的学生一卡通数据,在此基础上,本文将获得助学金与否作为被解释变量,建立二分类Logistic回归模型来直观说明影响助学金获得与否的关键因素。
二、模型设计
逻辑回归又称logistic回歸,是一种广义线性回归,用于在被解释变量是非连续情况下进行回归分析。根据被解释变量的分类方式不同,有二分类logistic回归和多分类logistic回归。
1.模型选择
2.变量选取
三、实证分析
本文根据某高校学生一卡通数据,选取108名学生作为样本,进行实证研究。
1.变量描述性统计分析
本文从极小值、极大值、均值、标准差四个方面对108名学生一个月的一卡通数据进行描述。在各消费中,食堂消费的均值最大,为318.5,说明该校学生的花销大多用于伙食消费;成绩排名的标准差最大,达到843.5,说明所选学生的学习存在明显的两极分化;开水房消费与坐校车次数的极小值为0,说明开水房消费与校车消费并不是学生的必须消费;去图书馆次数的标准差较大,说明学生的学习态度存在较大差异。具体描述情况见表2。
2.多重共线性分析
Hanushek和Jackson认为Logistic回归模型的参数易受解释变量间共线性的影响[11],由于本文是多因素分析,为了防止各变量存在多重共线性,避免各个变量之间的相互影响,保证结果的准确性,首先对解释变量与被解释变量进行多重共线性检验。[12]
本文选取方差膨胀因子(VIF)和条件索引(CI)来检验变量间的共线性[13],一般认为VIF值越大则变量共线性越强,VIF≥5时存在复共线性,VIF≥10时存在严重共线性。当条件索引30≥CI≥10时存在弱共线性,100≥CI≥30时存在中等共线性,CI100时存在严重共线性。而当CI10时认为不存在共线性。
从表3的多重共线性分析结果可以看到,各个解释变量的方差膨胀因子(VIF)的最大值为1.182,未超过5;条件索引(CI)的最大值为7.481,小于10,说明各变量之间不存在多重共线性问题,可以在一个模型中使用。
3.逻辑回归分析
本文选取H-L拟合优度检验[14-15]来判断模型的拟合情况,零假设为模型能够很好地拟合数据。分析结果显示,Sig=0.5960.1,接受零假设,说明模型拟合数据程度好。
表4是对
您可能关注的文档
- 广西北部湾经济区电子信息产业发展回顾与态势.docx
- 做好护患沟通、改善护患关系的方法.docx
- 唢呐在管乐器组的和声运用.docx
- 党史教育素材融入初中思政课教学的策略.docx
- 企业云的7个战略趋势分析.docx
- 基于建筑给排水施工技术探究.docx
- 信息技术背景下初中语文阅读翻转课堂教学模式探究.docx
- 房屋建筑工程施工的质量管理与控制措施研究.docx
- 天津金融发展对策研究.docx
- 2024-2030年中国不连续换网器行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国中短裤行业供应规模及投融资战略规划分析研究报告.docx
- 2024-2030年中国中药保健品行业市场发展分析及发展趋势与投资前景研究报告.docx
- 2024-2030年中国中继媒体网关(TG)行业发展分析及投资风险预警与发展策略研究报告.docx
- 2024-2030年中国中空纤维透析设备行业运营态势与应用前景预测报告.docx
- 2024-2030年中国中老年女装行业深度调研及投资前景预测研究报告.docx
- 2024-2030年中国中耕机租赁行业盈利态势与前景动态预测报告.docx
- 2024-2030年中国中草药种植行业市场深度调研及竞争格局与投资发展潜力研究报告.docx
- 2024-2030年中国不锈钢衬纸行业市场发展趋势与前景展望战略分析报告.docx
- 2024-2030年中国不锈钢阀门市场行情走势与未来竞争态势剖析研究报告.docx
- 2024-2030年中国专用变压器行业发展分析及发展趋势预测与投资风险研究报告.docx
文档评论(0)