基于校园大数据的助学金获取关键因素分析.docx

下载文档

0
0
约3.64千字
约 6页
2024-09-23 发布于湖北
举报
版权申诉
保障服务

基于校园大数据的助学金获取关键因素分析.docx

1、本文档共6页，可阅读全部内容。
2、有哪些信誉好的足球投注网站（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

基于校园大数据的助学金获取关键因素分析

???

王煜刘彤彤郭磊

摘要：本文在获取校园一卡通数据的基础上，采用数据挖掘与Logistic回归分析方法，以某高校的助学金发放为例，分析助学金获得者的共同特征，为其建立数学模型，以期完成精准资助，帮助真正家庭贫困的同学顺利完成学业。

关键词：助学金；数据挖掘；影响因素；Logistic回归分析

中图分类号：G467.8文献标志码：A文章编号：1673-8454（2018）17-0064-03

一、引言

助学金是帮助困难学生完成学业，保障学习质量的重要手段。精确的助学金资助策略，体现了决策者的管理智慧和教育公平性。目前国内许多学者主要关注以下几个方面的研究内容：①助学金管理模式的探索及体系的完善。国内学者从影响资助的不同因素出发，构建了多样化的资助评价体系。如余春玲根据平衡加分卡思想，分析了目前高校贫困学生资助模式存在的问题，并基于平衡记分卡，构建了一个包含财务、客户、内部流程管理过程、学习与成长四个方面指标的高校贫困学生资助评价体系。[1]张彦坤结合高校国家助学金评定实际情况，构建了一套包括4项一级指标、12项由一级指标细化而来的子因素的助学金量化评定指标体系。[2]②助学金制度绩效调查分析。国内学者大多从财政教育投资的投入、活动、产出、结果和影响等方面，多角度构建了多层次的高等教育绩效评价体系。[3]如陈绵水等从助学金发放（资金投入指标）、助学金使用（过程指标）、助学金效果（产出指标）三个方面评价助学金制度绩效，得出我国助学金评定基本做到公平公正，但仍存在宣传工作不尽人意，信息不够畅通，存在少量暗箱操作等问题。[4]③关于影响助学金发放的因素模型的探究。国内学者大多综合利了模糊评价与熵权法，建立模糊评价模型。[5]如夏阳针对资助判定问题，运用模糊层次分析方法，构造模糊一致矩阵，建立了助学金判定模型。[6]也有学者利用了SPSS中的多元线性回归模型。如邓海云进行多元线性回归分析，应用stepwise方法，建立了评定的多元线性回归关系模型。[7]

现有文献研究多局限于理论层面的宏观分析，实证分析和数学模型的辅助研究较少，并且已有的实证分析大都是通过问卷调查得到的数据，具有一定的主观性。本文则针对某高校校园一卡通的客观数据，采用数据挖掘技术，利用相关性分析提取与获得助学金与否有关的特征因子，以期进行精准助学金发放。本文的数据直接来自于较为客观的学生一卡通数据，在此基础上，本文将获得助学金与否作为被解释变量，建立二分类Logistic回归模型来直观说明影响助学金获得与否的关键因素。

二、模型设计

逻辑回归又称logistic回歸，是一种广义线性回归，用于在被解释变量是非连续情况下进行回归分析。根据被解释变量的分类方式不同，有二分类logistic回归和多分类logistic回归。

1.模型选择

2.变量选取

三、实证分析

本文根据某高校学生一卡通数据，选取108名学生作为样本，进行实证研究。

1.变量描述性统计分析

本文从极小值、极大值、均值、标准差四个方面对108名学生一个月的一卡通数据进行描述。在各消费中，食堂消费的均值最大，为318.5，说明该校学生的花销大多用于伙食消费；成绩排名的标准差最大，达到843.5，说明所选学生的学习存在明显的两极分化；开水房消费与坐校车次数的极小值为0，说明开水房消费与校车消费并不是学生的必须消费；去图书馆次数的标准差较大，说明学生的学习态度存在较大差异。具体描述情况见表2。

2.多重共线性分析

Hanushek和Jackson认为Logistic回归模型的参数易受解释变量间共线性的影响[11]，由于本文是多因素分析，为了防止各变量存在多重共线性，避免各个变量之间的相互影响，保证结果的准确性，首先对解释变量与被解释变量进行多重共线性检验。[12]

本文选取方差膨胀因子（VIF）和条件索引（CI）来检验变量间的共线性[13]，一般认为VIF值越大则变量共线性越强，VIF≥5时存在复共线性，VIF≥10时存在严重共线性。当条件索引30≥CI≥10时存在弱共线性，100≥CI≥30时存在中等共线性，CI100时存在严重共线性。而当CI10时认为不存在共线性。

从表3的多重共线性分析结果可以看到，各个解释变量的方差膨胀因子（VIF）的最大值为1.182，未超过5；条件索引（CI）的最大值为7.481，小于10，说明各变量之间不存在多重共线性问题，可以在一个模型中使用。

3.逻辑回归分析

本文选取H-L拟合优度检验[14-15]来判断模型的拟合情况，零假设为模型能够很好地拟合数据。分析结果显示，Sig=0.5960.1，接受零假设，说明模型拟合数据程度好。

表4是对

您可能关注的文档

文档评论（0）

186****5366 + 关注: 实名认证

内容提供者

该用户很懒，什么也没介绍

咨询Ta 进入空间

1亿VIP精品文档

更多 >

基于校园大数据的助学金获取关键因素分析.docx