基于大数据技术开展高校精准资助认定的探究

2023-10-06 10:40张起志
山西青年 2023年6期
关键词:困难资助精准

王 莹 李 鹏 张起志

1.东北林业大学理学院,黑龙江 哈尔滨 150040;2.东北林业大学党委学生工作部,黑龙江 哈尔滨 150040

2013 年,习近平总书记前往湘西进行考察时首次提出了“精准扶贫”的资助工作理念,该理念的提出,是高校资助工作理念的一次变革,在原来高校资助工作的“普遍扶贫”基础理念上增加了“精准”的概念,能够提升高校资助工作的育人成效。2020 年,在全国教育工作大会中,“精准资助”的概念也被进一步明确,要求高校在开展家庭经济困难学生的资助工作时要贵在精准,要进一步提高家庭经济困难学生的认定、预算分配、资助标准设定等工作的精准化水平。近年来,在中国高等教育迅速发展的过程中,我国高校招生规模不断扩大,高校中家庭经济困难学生的人数也逐渐增多,基本呈现逐年上升的趋势。为了解决家庭经济困难学生上学难、生活难、就业难等一系列的问题,实现高等教育机会均等的目标,我国学生资助经费投入大幅增加,学生资助规模不断扩大。在当前学生基数日趋庞大的背景下,如何采取有效措施对家庭经济困难学生的家庭情况进行有效的精准识别,并以此为基础开展差异化的资助工作和育人工作,成为当前高校资助工作的重点[1]。目前,进入大数据时代,面对海量的数据,如何做好数据挖掘、信息处理工作,进而使大数据为人所用,正在逐渐变成一个重要的研究课题。因此,将大数据技术应用于高校家庭经济困难学生认定,以此为基础提供科学、公平、客观的贫困生识别方法,对实现高校精准资助具有重要推动作用。

一、当前我国高校家庭经济困难学生认定困境

通过查阅资料调研,目前我国大部分高校往往采用“收集学生材料—评议小组初步讨论拟定家庭经济困难学生等级排名—认定小组审核认定—院级公布家庭经济困难人员名单—上报学生资助管理中心”的评定流程来确定家庭经济困难学生人员及等级,存在着有效信息核实较难,认定程序不够规范、认定结果相对可调整性低、可量化认定标准笼统等问题。

(一)有效信息核实较难

大多数高校在开展家庭经济困难学生认定工作时往往将《家庭经济困难学生认定申请表》《高等学校学生及家庭情况调查表》等作为了解掌握学生家庭经济状况的主要材料,申请家庭经济困难的学生往往被要求提交相关材料。但生源地政府或部门对学生家庭经济条件缺乏必要的调查机制,学生提供的家庭经济困难证明材料真实性有待考证[2]。

(二)认定程序不够规范

大多数高校在对学生的家庭经济情况进行认定的过程中,主要依靠学院的辅导员老师或是资助专干老师、班级的主要干部以及班级的学生代表对家庭经济困难学生提供的证明材料、班级匿名投票情况及学生的日常消费情况等进行综合考虑。由于学生投票的过程主观性很强,没有量化的标准,因此认定过程中的随意性比较大,出现遗漏或不准确的现象时有发生,因此,较难真实反映各位学生的家庭经济情况困难程度[3]。

(三)认定结果可调整性低

一般来说,对于高校家庭经济困难学生的认定工作大多是在学生入学后开始申请并建档完成,大多数高校家庭经济困难撤档或者换档的情况很少,一般只是在一年后对家庭经济困难学生的评定等级做出小范围内的调整,且这种调整往往是依据家庭经济困难学生过去一年内对班级对学院的贡献度、对学校活动的参与度等来确定的,较少参考学生的家庭经济状况。因而大学四年内,高校的家庭经济困难学生数据库是基本不更新的,动态可调整性较低。

(四)可量化认定标准笼统

家庭经济困难学生认定标准涉及学生家庭所在地经济发展情况、家庭基本情况、家庭成员健康状况、家庭成员工作情况、家庭收入情况、家庭负债情况、家庭所在地受灾状况、学生贷款情况等,是一个较为复杂的体系,需要一个科学的、统一的、可量化的认定标准。由于学生来自不同的地区,不同地区的发展状况又不尽相同,学生家庭的收入情况和学生家庭当地的物价情况可能存在较大差异,这使得家庭经济困难的认定缺乏统一的标准。目前,认定过程和结果易受主观因素影响,且较为笼统模糊。因此,家庭经济困难的名额给谁难以进行精准判定。

因此,在国家和社会的重视和关注下,高校如何把国家和社会资助的资金用到实处、精准资助,能否被公平公正、客观合理地分配好,都是国家和社会关注的重点。高校家庭经济困难学生认定程序的科学性、公平性和可操作性也和能否让更多真正有困难的学生以及家庭受到合理的帮助有很大相关[4]。

二、大数据技术在高校家庭经济困难学生认定中的应用

随着大数据技术的不断发展和各高校“精准资助”体系建设的逐渐完善,越来越多的高校开展使用大数据技术手段量化学生的家庭信息和行为特征,大数据技术在高校家庭经济困难学生认定中的应用成为当前研究热点。

目前,高校常用的评选方法为定性与定量相结合的方式。伍冬云[5]认为在大数据背景下,信息共享模式已成为发展趋势,充分利用互联网可获取到个人消费信息,运用数据挖掘技术实现对资助对象的精准认定。吉朝明等[6]通过对Apriori方法进行改进处理并实际应用,用来进行经济困难群体的判定和挖掘,其运用随机森林算法和决策树进行判别,运用机器学习中的XGBoost 模型及主层次分析等进行判别,而该系统仅使用一个弱分类求解器,计算过程中会使模型精度偏低。曹路舟等[7]利用大数据分析专家Datist 软件以学生的各类消费交易数据为基础进行导入建模,进而完成所需数据的截取、融合及有形化表达。其利用K-Means 算法对家庭经济困难学生的相应的指标体系进行处理,对学生的消费交易情况进行判定,再应用GBDT 算法对家庭经济困难学生的贫困等级程度进行预测判定。郝婧等[8]应用高校学生使用的一卡通的各项数据,利用数据挖掘技术来进行高校家庭经济困难学生认定模型的构建,应用二分k-means 算法对学生校园一卡通的消费流水数据进行聚类,同时运用轮廓系数和簇内误方差方式进行聚类效果评价,并通过调整参数值以获得家庭经济困难学生最佳的聚类效果。

三、构建机器学习和深度学习的家庭经济困难学生认定平台的探索

本文拟通过大数据筛选后进行精准判定的数学建模,从而构架出资助对象精准认定的一体化网络平台,具备导入数据、建模分析、系统运算、自定义筛选等功能,可应用于家庭经济困难学生认定,提供客观的分析和结果,有助于学校进行精准资助。

(一)数据收集

数据搜集方面,先是实际调查了解市场上的家困生认定所存在的主要问题,之后通过大量面向大学生们的调查问卷来收集数据。在完成必要的信息采集后,开发小组运用3-δ原则对数据进行清洗和匿名化处理,借助特征工程及特征分析确定模型所需指标与数据,并根据数据特征与相关系数成反比实现一定的数据降维处理。

(二)模型建立

在得到必需的指标与数据后,首先采用多元统计分析方法进行数据挖掘,深度挖掘贫困生特征指标与贫困生身份之间的关联模式,随后针对最小化判别误差问题进行优化建模,采用机器学习、深度学习中随机森林、svm 支持向量机、神经网络、XGBoost 四个弱分类求解器所训练的融合判别器,该判别器在测试集上获得了88.71%的准确率。开发小组为了使模型能够适应真实场景下数据吞吐量大、判别结果实时性要求高的特点,本产品还针对特征冗余、算法学习速度、大数据批处理等问题对算法进行了专项优化,最终本产品以web 网页的形式呈现。

(三)Web 开发

在Web 开发方面,选用python 语言,后端采用Django 框架,采用了numpy 等计算软件包,使用了joblib、pandas 来进行数据清洗、数据处理及数据分析,而为了使系统的页面更加简洁、功能更加丰富;而前端采用了基于HTML css javascript的bootstarp 框架,根据后端中所写的路由写每一个HTML 模板,其中主要包括base.html、header.html、footer.html 三个文件,其中base.html 中通过cdn 的方式引入了bootstrap 以及需要的jquery、javascript header 以及footer 文件分别写好了系统的导航栏和尾页。通过Django 自带的模板语法的继承方法将其他的HTML 模板引入这三个基本文件以实现各个页面风格统一,系统采用了MVT 模式,前后端交互则使用了Django 自带的交互逻辑。对于批量导入判定当中生成的结果excel 表格下载部分,在HTML 表单中,enctype规定了form 表单在发送服务器时候的编码方式,创建一个名字为import_excel 的视图函数,用Django request 的FILES.get 方法接收前端POST过来的文件对象。然后取到上传文件的后缀名,设置一个简单的判断语句用于判断上传的格式是否为EXCEL 的格式。如果上传格式正确则会进入数据处理部分,将上传的表格以Data frame 的格式读入,批量处理数据之后将生成名为“sorted_output.xlsx”的表格,用来存放我们需要的数据结果。这样做的目的是方便程序将数据渲染到前端,以及方便用户需要下载处理后的表格。开发小组设置了一个download_sorted_data 视图函数,当被调用时会返回sorted_output.xlsx 文件。

(四)功能实现

最终得到的网页可实现个体判别及批量导入判别两个主要功能。个体判别方面,在同学填入前端的数据会暂时储存在一个自带的excel 表格中,之后后端通过调用excel 表格中经过清洗的数据以成熟的算法进行计算进而输出结果,同时也会清除部分原表中的数据以保证同学们的隐私安全。而批量导入判别方面,判别人可以通过下载网页预留的excel 模板来实现数据导入,把大批量数据进行统一计算。最终得到结果后对结果进行降序排序并生成一个新的excel 表格储存数据,用户会在网页内看到输出结果,如有需要,也可以通过点击下载承载有输出结果的excel 表格以便使用。

(五)多端口搭建

本章所搭建的平台除了可通过网页端搜索链接进入外,还已实现平台通过在微信公众平台添加网页子链接直接连接到信息填写网页页面或批量处理结果页面,实现随时随地更方便地进行信息填写与相关资质认定。接下来,平台的主要优化方向为微信后端小程序的使用以及开发资质认定APP,从网页端口与微信公众号等多方向出发,形成辐射式网络应用,达到资质认定的最优化使用。

四、总结与展望

本文所搭建的精准资助一体化平台将改善以往认定工作中存在的学生家庭贫困身份难核实等困境,实现人工智能与学生资助管理工作的有机结合,并达到了对市场上运用的相关分解器的优化效果,具有认定标准系统化、人力资源高效化、后台监督管理动态化、与大数据时代海量数据结合适应的特点,也在一定程度上填补了基于大数据的精准资助实践创新研究的空缺,将大数据技术应用于高校资助认定工作中,可以有效提高当前高校教育资助工作的精准程度,确保了资助工作的公平性、精确性、及时性,最终实现不让一名学生因家庭经济困难而失学,达到精准量化、动态管理、点面结合、定位准确、全面育人的目标,为高校大学生的资助工作踏入“精准”时代提供更好的平台。

猜你喜欢
困难资助精准
困难中遇见团队
困难我不怕
高校资助育人成效的提升路径分析
“隐形资助”低调又暖心
精准防返贫,才能稳脱贫
精准的打铁
精准扶贫 齐奔小康
选择困难症
精准扶贫二首
美国防部资助研发能垂直起降的无人机