基于机器学习的高校就业情况大数据分析及预测

2020-04-09 04:41罗丹
无线互联科技 2020年2期
关键词:机器学习数据分析

罗丹

摘   要:机器学习能够通过不断获取新的知识与技能,算法可以得到不断的完善与发展。文章基于机器学习对高校就业大数据进行研究,讨论机器学习对高校就业大数据的意义,并对高校就业情况进行了预测,希望能够为高校教育的研究与发展提供一定的参考。

关键词:机器学习;高校就业;数据分析

随着高校毕业生数量越来越多,我国就业压力也在不断提升。想从根本上解决这个问题,就要根据市场情况分析,形成有效的改革策略,充分利用机器学习的特殊优势为大数据分析提供助力。因此,基于机器学习对高校就业情况进行大数据分析,是发现并解决问题的重要途径[1]。

1    常见的机器学习算法

随着机器学习的发展,在具体应用中探索出了10余种算法类型,本文选取其中3种进行分析与阐述,即朴素贝叶斯、分类回归树和线性回归。

(1)朴素贝叶斯算法模型,虽然外形相对简单,但是具有广泛的应用性和功能性。一般来说包括两种概率:每个类的概率和基于X值情况下个类的条件概率。在算法模型计算完成以后,就可以使用概率模型针对新的数据进行预测,该模型如图1所示。

(2)分类回归树,又称决策树。该类算法主要应用在机器学习的预测建模上,一般在模型的构件上选择二叉树表示。二叉树上的每一个节点代表所输入的变量和变量的分叉点,而树叶节点则包括输出变量的预测,各个分支节点通过叶节点的汇总,最终得出预测结果。该模式的最大优势是通常不用对数据进行特殊的处理,计算起来相对简单,并且结果较为直观[2]。

(3)线性回归算法,是当前应用的最广的一种算法类型,最大优势是模型误差比较小,线性回归通过自身的系数(β),将输入变量X与输出变量Y用等式关系表达出来。

2    机器学习对高校就业情况大数据研究的意义

高校就业情况的大数据是动态且复杂的,如果简单地从数据来分析,很可能无法探究到问题存在的本质与现实情况。要想把高校就业情况的大数据充分运用起来,分析研究过程就必须是动态、深入的,分析方法与研究方式必须要是符合现实情况、不断改进的。机械性的工作,普通的计算机算法就足以胜任,但分析提供的数据并不能为高校教育提供有效的参考。

机器学习是能通过经验的不断累积自动进行改进的计算机算法研究,所以非常适合用于对高校就业情况大数据研究。机器学习能够用具体的高校就业情况的数据,不断优化该计算机算法,从动态的角度去分析與看待就业与高校教育的情况,得出的分析与结论更加合理、有参考性。

3    机器学习对于高校就业情况大数据的研究

在具体的高校就业信息获取过程中,不仅要统计毕业生在就业情况上的主观意愿,而且要充分结合毕业生的学习与生活状况,才可能对高校的就业情况作出准确做信息统计与预测。在高校学生毕业就业选择的过程中,一般情况下会有3种选择,即岗位就业、创业与继续深造,对高校毕业生未来的发展产生重大的影响。按照传统的方法,很难对毕业生未来的选择进行精准的预测,同时在预测的范围与精度上是无法令人信服的,难以满足其他学生对于此类信息的需求。

随着大数据概念的出现和机器学习算法的传播与发展,近年来通过机器学习算法来提高预测的速度与准确度的教育研究成为可能。基于前人对机器学习在教育方面的探究,机器学习算法是分析、研究高校毕业生就业大数据的重要途径。分析、讨论高校毕业生就业情况的数据,不仅能够给毕业生提供准确的就业服务,还能为学校提供管理与信息资源上的帮助,从而实现教育水平的提高与升级,为打造更高水平的大学增添实力[3]。

以机器学习算法为基础,通过高校毕业生就业情况的大数据来分析毕业生的就业去向、方式是合理且可行的。应用机器学习算法预测就业情况与方向,为提高高校职业教育水平打开了崭新的空间。在研究过程中发现,高校毕业生进入劳动市场时,受到的影响因素很多,不仅受到其学校的品质与个人能力的影响,和他们家庭的背景也有很大的关系。父母的受教育水平与家庭收入水平呈正比例关系,家庭经济压力小的家庭选择深造的几率比较高,所以从就业的方向上来看,家庭是不可分割的因素。针对院校的不同,高水平的大学所教授学生的学习能力比较强,无论是学术水平,还是机会都会比一般的高校学生要多,因此直接就业的几率会比一般高校学生低。学生在毕业时的就业环境更是会直接影响到学生的就业情况,当学生毕业时经济状况不好,选择就业的学生会比较多,而当经济状况比较好的时候,选择去深造的高校毕业生就会增多。

从高校就业情况的大数据分析上看,能够影响高校毕业生选择就业情况的因素还有很多,例如性别比例、兴趣爱好与市场需求等。在研究的过程中发现,对大数据所提供的信息进行探讨,应综合分析对高校学生就业产生明显影响的因素,而不单是考虑高校毕业学生的就业选择数据。只要充分地利用好机器学习的算法能力,就能够有效地解决现有研究当中存在的信息收集客观性与准确性不高的问题。在研究中,不仅要利用好机器学习的算法技术,把控好其中的变量和影响因素,也是研究的关键所在,并且还要能够保证数据信息的全面性与准确性。同时,分析结论与情况预测都要立足于机器学习算法的准确性,而不是注意每个变量的细微变化[4]。

4    基于机器学习对大学生就业情况的预测

通过机器学习算法对于高校就业情况进行分析讨论,对高校就业的各种方式与影响因素进行了列举及数据对比,能有效地预测未来的高校毕业生就业的情况。根据得出的结果可以看出,对毕业后就业情况产生巨大影响的因素有学生自身的能力水平、性别差异、学习地点等。

在具体的分析中,女性毕业后更愿意选择出国接受进一步教育,和男性相比较她们选择直接就业的几率是很低的。从学习的地点上看,在西部地区接受教育的学生更加愿意选择毕业以后直接去工作,中部区域的学生在毕业以后喜欢在国内进一步学习与就业。东部与南部地区的学生,许多都选择在毕业之后到国外去学习更多的知识。从学科教育上看,学习人文社会类学科的学生多数会选择直接就业,而在财经类专业毕业的学生更加希望到更高的学府去深造。高校学生在学校的学业能力是一项考察其毕业之后就业状况的重要指标,在一定程度上说明了该毕业生的能力及学习水平[5]。

在研究过程中分析高校人才的培养过程与市场因素是极为关键的。将培养过程中存在的诸多信息要素运用在机器学习算法当中,不仅是一种用于解决高校就业情况的新路径,更是一种立足于高校就业情况利用大数据来实现教育资源数据整合与优化的新思路,有助于帮助高校对学生毕业时进行行为管理以及提供相应的帮助。利用机器学习算法,根据高校就业情况的大数据信息,对机器学习算法本身的模型进行不断整理、优化、分析反馈就业信息,使高校在提前预测毕业生就业情况的条件下,做到有效的校园就业平台搭建与校园就业帮扶,从而提高其整体教育水平和学校学生的就业率。

5    结语

基于機器学习算法自身的优化与进步,对高校就业情况的大数据进行分析,有助于全面、客观地分析高校毕业生具体的就业情况,为高校提前预测毕业生的毕业动向提供很好的参考。由于机器学习算法并不是一个范式的、固定的分析方法与研究途径,所以希望机器学习算法在今后的高校教育与就业等方面的实践与运用当中,能够适当地增加更多的变量与因素,使其变得更加的高效、准确,更好地为增强高校就业服务与提高教育水平提供助力。

[参考文献]

[1]张素芳,翟俊海,王聪,等.大数据与大数据机器学习[J].河北大学学报(自然科学版),2018(3):299-308.

[2]谷珊.大数据环境下机器学习算法趋势研究[J].海峡科技与产业,2017(8):12.

[3]曹志民,吴云,韩建,等.测井数据岩相分类的机器学习方法和大数据岩相分类探讨[J].化工自动化及仪表,2017(8):36-37.

[4]王先毅,陈大伟.基于智能机器视觉的工业大数据预警分析系统[J].电子技术与软件工程,2017(10):88.

[5]肖红.大数据下的机器学习算法探讨[J].通讯世界,2017(6):78.

Abstract:Machine learning can constantly acquire new knowledge and skills, algorithms can continue to improve and develop. This paper studies the employment big data of colleges and universities based on machine learning, discusses the significance of machine learning to the employment big data of colleges and universities, and forecasts the employment situation of colleges and universities based on machine learning, hoping to provide some references for the research and development of higher education.

Key words:machine learning; university employment; data analysis

猜你喜欢
机器学习数据分析
前缀字母为特征在维吾尔语文本情感分类中的研究
浅析大数据时代对企业营销模式的影响
基于支持向量机的金融数据分析研究