基于大数据集成技术的高校毕业生就业率预测研究

2021-02-06 12:56张志辉刘增奇
现代电子技术 2021年4期
关键词:就业率神经元向量

张志辉,刘增奇

(1.燕山大学,河北 秦皇岛066004;2.河北师范大学,河北 石家庄050024)

高校作为一个国家培养人才的主要基地,自从1999年高校扩招以来,高校每年的毕业生数据大幅增加,但是用人单位的招聘数量增幅却相对较小,这就导致了一个供需矛盾,高校毕业生就业面临巨大压力[1-3]。高校毕业生就业问题是当前国家、社会、高校关注的焦点,关系到社会稳定,因此如何对高校毕业生就业率进行预测,预测结果对于高校人才计划培养的制定和调整具有重要的意义[4]。

最初人们通过对高校毕业生就业率的历史数据和资料进行分析,通过一定的统计学方法对高校毕业生就业率发展变化趋势进行描述,建立相应的高校毕业生就业率预测模型,将对将来的高校毕业生就业率进行预测,该类方法包括了定性分析的高校毕业生就业率预测方法和定量分析的高校毕业生就业率预测方法,其中,定性分析的高校毕业生就业率预测方法最具代表性的为专家预测方法,但是定性分析的高校毕业生就业率预测结果极不可靠,有时得到的结果与实际高校毕业生就业率相差很远[5-7]。定量分析法实际是定性分析的改进,主要有时间序列分析的高校毕业生就业率预测方法、灰色系统的高校毕业生就业率预测方法,以及回归分析的高校毕业生就业率预测方法,这些定量分析法建模效果有一定的局限性,对小规模、变化特点单一的高校毕业生就业率数据,预测精度比较高,但当高校毕业生就业率变化比较复杂时,这些方法的预测效果则会变差,使得高校毕业生就业率预测错误较高[8-9]。

近些年,随着科学技术的飞速发展,出现了基于机器学习的算法的高校毕业生就业率预测方法,如基于BP神经网络的高校毕业生就业率预测方法、RBF神经网络的高校毕业生就业率预测方法、支持向量机的高校毕业生就业率预测方法等,这些基于机器学习算法可以对高校毕业生就业率变化特点进行非线性拟合,使得高校毕业生就业率预测效果要优于传统方法[10-12]。但是在进行高校毕业生实际预测时,高校毕业生就业率与许多因素密切相关,这些因素之间又互相联系,使得高校毕业生就业率变化十分复杂,单一的神经网络或者支持向量无法完整描述高校毕业生就业率变化特点,难以获得高精度 的预测结果[11,13-14]。

为了获得更加理想的高校毕业生就业率预测结果,本文提出基于大数据集成技术的高校毕业生就业率预测方法。该方法集成了神经网络和支持向量机两者的优点,更加全面地描述了高校毕业生就业率变化特点。预测结果表明,本文方法是一种精度高、误差小的高校毕业生就业率预测方法。

1 预测方法

1.1 BP神经网络

当前神经网络众多,每一种神经网络都有自己的适应范围和优点,但是也有各自的局限性,相对于其他神经网络,BP神经网络不仅具有其他神经网络的优点,即非线性拟合能力强,同时具有误差反向传播功能,具有更高的学习精度。因此,本文引入BP神经网络到高校毕业生就业率预测的建模过程中。

图1 为BP神经网络的结构,由图1可以看出,其为一个多层结构,各层神经元之间存在一定的关联性,同层的神经元之间不存在关联性,这与人的大脑神经网络系统具有很大的相似性,因此具有思维和学习能力。

其他神经网络只有一个信号前向传播阶段,而BP神经网络共有n个输入神经元节点,m个隐含神经元节点,k个输出神经元节点,其学习过程具体如下:

第一阶段:信号前向传播。

1)设输入层的第i(i=0,1,2,…,n-1)个神经元的输入信号为xi,那么隐含层的第j个神经元的输入为:

式中:n表示输入层的神经元数量;wij表示隐含层的权值。

图1 BP神经网络的结构

2)隐含层的第j(j=0,1,2,…,n-1)个神经元的输出为x′j,采用激发函数:

式中:m表示隐含层的神经元数量;wjl表示输出层的权值。

4)设第p个样本的期望值为x′l,l=1,2,…,k-1,那么其误差性能指标函数为:

5)判断BP神经网络的总输出误差,如果误差比较大,那么就需要进入到误差反向传播阶段,不然就终止学习。

第二阶段:误差反向传播。

1)第k+1时刻,输出和隐含层的权值计算公式为:

2)η为学习速率,Δwjl和Δwij为权值的变化量,计算公式为:

3)采用梯度下降算法对各层的权值进行调整,使BP神经网络的输出误差不断减小,直到满足实际要求为止。

1.2 支持向量机

通常情况下,支持向量机求解是将一个问题的原始数据映射到高维空间,然后在该空间对求解的问题进行建模,具体为:式中:ξ2i为支持向量机的输出误差;C为对输出误差的惩罚参数:φ(·)表示映射函数。

根据支持向量机的学习原理,得到式(9)的Lagrange约束规划形式,即:

根据极值定律对ω,b,ξi,αi求偏导,消去ω和ξi,建立以下的矩阵方程:

根据Mercer条件,得到支持向量机回归函数为:

1.3 大数据集成技术的高校毕业生就业率预测

针对单一技术的高校毕业生就业率预测缺陷,结合高校毕业生就业数据向大规模方向发展的趋势,提出基于大数据集成技术的高校毕业生就业率预测方法,具体步骤如下:

1)针对某一个高校的毕业生就业率预测问题,从其毕业生就业管理系统导出就业率的历史数据。

2)由于受到多种因素的影响,以及因素之间的相互作用,使得高校毕业生就业率变化比较随机,使得高校毕业生就业率历史数据之间的差异性比较大,因此对高校毕业生就业率历史数据按式(13)进行标准化处理,使高校毕业生就业率处于[0,1]的范围内。

式中:xi表示第i年的高校毕业生就业率原始值为第i年的高校毕业生就业率处理后的值;xmax和xmin分别为高校毕业生就业率的最大值和最小值。

3)从预处理后的高校毕业生就业率历史数据中选择部分数据组成训练样本,剩余的高校毕业生就业率历史数据组成测试样本。

4)分别采用BP神经网络和支持向量机对高校毕业生就业率的训练样本进行学习,建立高校毕业生就业率预测模型。

5)采用BP神经网络和支持向量机建立高校毕业生就业率预测模型并对测试样本进行预测,得到相应的高校毕业生就业率预测结果。

6)确定BP神经网络和支持向量机的高校毕业生就业率预测结果权值,权值用于描述它们对高校毕业生就业率最终预测结果的贡献。

7)根据权值计算得到高校毕业生就业率最终预测结果,并对其进行分析。

综合上述可知,大数据集成技术的高校毕业生就业率预测如图2所示。

图2 大数据集成技术的高校毕业生就业率预测流程

2 高校毕业生就业率预测的实例分析

2.1 测试对象及测试环境

为了测试大数据集成技术的高校毕业生就业率预测效果,选择某高校的大数据集成技术的高校毕业生就业率历史数据作为测试对象,如图3所示。

图3 某高校毕业生就业率历史数据

为了分析大数据集成技术的高校毕业生就业率预测方法的优越性,选择BP神经网络的高校毕业生就业率预测(BPNN)和支持向量机的高校毕业生就业率预测方法(SVM)进行对比实验。

2.2 与其他方法的高校毕业生就业率预测结果分析

由于该高校毕业生就业率历史数据数量比较少,因此将全部数据作为训练样本进行建模,然后将这些样本数据作为测试样本进行预测,统计BP神经网络的高校毕业生就业率预测方法、支持向量机的高校毕业生就业率预测方法和大数据集成技术的高校毕业生就业率预测结果,如图4所示。

图4 不同方法的高校毕业生就业率预测结果对比

对图4预测结果进行分析可以发现:

1)BP神经网络的高校毕业生就业率预测效果最差,出现了多个偏差比较大的高校毕业生就业率预测点,使得高校毕业生就业率预测精度比较低,这是因为BP神经网络虽然具有强大的拟合能力,但是其泛化能力比较差,即出现过拟合的概率相当高。

2)支持向量机的高校毕业生就业率预测效果要优于BP神经网络,这是因为支持向量机的泛化能力要强于BP神经网络,从而减少高校毕业生就业率预测误差,但是由于其只能从一个角度描述高校毕业生就业率变化特点,高校毕业生就业率预测精度不够高。

3)大数据集成技术的高校毕业生就业率预测效果要明显优于单一的BP神经网络和支持向量机,这是因为其集成了BP神经网络和支持向量机的优点,实现了两种方法的优势互补,可以从不同角度描述高校毕业生就业率的变化特点,降低了高校毕业生就业率预测误差。

2.3 本文高校毕业生就业率预测方法的通用性测试

为了测试大数据集成技术的高校毕业生就业率预测方法的通用性,选择20所高校的毕业生就业率作为测试对象,统计每一所高校的高校毕业生就业率预测精度,结果如图5所示。

图5 20所高校的高校毕业生就业率预测精度对比

由图5可以看出,大数据集成技术的高校毕业生就业率预测均超过了92%,能够高精度地对所有高校的毕业生就业率进行建模和分析,具有良好的通用性。同时,相对于单一的BP神经网络和支持向量机,大数据集成技术的高校毕业生就业率预测精度分别高于BP神经网络和支持向量机10%和5%左右,有效降低了高校毕业生就业率预测误差,再次验证了大数据集成技术的高校毕业生就业率预测方法的优越性。

3 结语

本文提出基于大数据集成技术的高校毕业生就业率预测方法。与BP神经网络和支持向量机等当前流行的高校毕业生就业率预测方法并进行了对比测试,结果表明,相对BP神经网络和支持向量机,大数据集成技术的高校毕业生就业率预测精度有了一定的改善,解决了当前高校毕业生就业率预测较低的缺陷,可以为高校毕业生就业管理人员提供有价值的参考信息。

猜你喜欢
就业率神经元向量
向量的分解
《从光子到神经元》书评
聚焦“向量与三角”创新题
跃动的神经元——波兰Brain Embassy联合办公
向量垂直在解析几何中的应用
向量五种“变身” 玩转圆锥曲线
基于二次型单神经元PID的MPPT控制
毫米波导引头预定回路改进单神经元控制
本科新闻专业在京就业率较低
数据