基于BP神经网络飞行学生成绩预测

2022-03-25 02:48罗忠运
科技资讯 2022年4期
关键词:神经元神经网络误差

目前,飞行学生(以下简称“学生”)培养,以中国民用航空飞行学院为例,分为理论学习和分院实训两个阶段。通过执照考试才能进入下一阶段训练,成绩高低决定学生下分院排名,目前成绩预测,缺乏科学的方法。该文在学生成绩预测中引入BP(Back Propagation)神经网络,结合学生现实表现、部分文化课成绩以及高考成绩,建立神经网络评价模型,对学生成绩进行预测分析。仿真显示,该方法能够得到较为理想的预测结果,可为学生管理提供可靠的决策指导。

飞行学生  成绩分析  BP神经网络  学生管理

  文獻标识码:A   文章编号:1672-3791(2022)02(b)-0000-00

LUO Zhongyun

(Civil Aviation Flight University of China, Guanghan, Sichuan Province,618307 China)

At present, the training of flying students (hereinafter referred to as “students”) takes the Civil Aviation Flight University of China as an example, and is divided into two stages: theoretical study and branch training.Only after passing the license exam can you enter the next stage of training.At present, there is a lack of scientific methods for performance prediction.In this paper, BP neural network is introduced in the prediction of student performance, combined with students' actual performance, some cultural class performance and college entrance examination results, a neural network evaluation model is established to predict and analyze student performance. Experimental results show that this method has high prediction accuracy and provides reliable decision-making guidance for student management.

:Flying student;Score analysis;BP neural network;Student management

随着移动终端和传感设备的全面普及,以及移动互联技术的广泛应用。各种类型的数据充斥着学生的生活和学习。近年来,智慧校园建设全面推进,学生的生活和学习数据都被记录。这些数据与学生成绩存在着内在联系,影响学生的学习成绩。因此,众多教育工作者开始运用数据挖掘技术进行学生教育和管理。

学生管理数据挖掘,指运用数据挖掘技术,从大量行为数据、教学数据中提取有效数据信息,挖掘数据间的内在联系,并对未知数据预测分析的过程。以此,为学生管理者提供科学的管理策略和实践指导。执照成绩预测是学生成才管理的重要内容之一。

目前,成绩分析常用的数学方法有支持向量机(Support Vector Machine)、BP神经网络等。支持向量机可利用分类原理将执照成绩分为通过与不通过两类。通过模型训练,得到分类结果。在实际应用中,学生成绩预测相比于分类更具参考价值。该文通过BP神经网络,将学生操行表现、主要科目成绩、挂科门次重修门次以及平均绩点等主要数据作为神经网络的输入单元,以学生执照考试三科总成绩为目标值。利用MATLAB自带的BP神经网络工具箱,对模型进行训练,最后得出预测成绩,并做误差分析。

BP神经网络能够模仿人脑神经元对外部刺激信号的反应过程,基于多层感知器,结合正向传播的信号和反向传播的误差,能有效建立用于处理非线性信息的智能化网络预测。

此种模型的神经网络得到广泛应用,在函数逼近、模型识别分类、数据压缩和时间序列预测等领域应用较为成熟。其包括输入单元、隐藏单元和输出单元,其中隐藏单元的层数可以根据需求随意设计,隐藏单元可以进行信息传递和互换,负责信息处置。

S型函数作为BP神经网络传递函数,通过反向传递函数,其中为期望输出;为网络的计算输出,通过网络权值和阈值的迭代调节,不断减小差函数E值。使网络计算输出无限逼近期望输出,三层BP网络如图1所示。

首先,数据进入输入单元再经过各级隐藏单元,根据神经元间的权值计算输出,最终达到输出单元,通过比较输出结果与期望输出结果,得到网格误差,此为正向传播;其次,根据网络误差,从输出单元开始,到隐藏单元和输入单元,逐级按照梯度下降方法调整权值,这个过程称为权值反向传播。通过误差正向传播和权值反向传播,使误差和最大学习次数达到预设值,输出结果。

以三层神经网络为例,输入单元、隐藏单元和输出单元的神经元个数分别为、、,则隐藏单元第个神经元输出如下:

式(1)中,为隐藏单元激活函数;为隐藏单元第个神经元门限;为第个输入单元的输入;为隐藏单元第个神经元与输入单元第个神经元的权值。输出单元第个神经元可表示为:

式(2)中,为输出单元激活函数;为输出单元第个神经元的门限;为隐藏单元第个神经元与输入单元第个神经元的权值。反向传播过程第个神经元与期望输出之间的误差可表示为:

式(3)中,为输出层第个神经元期望输出值。

该文数据集是来自飞行技术专业某学生中队,2017级学生部分学习成绩数据及操行表现数据。考虑到执照考试知识点与主要课程的关联程度,该研究选取飞行原理、飞行性能以及飞机电子电气系统等主要课程作为神经元输入,剔除一些对执照考试影响较小的课程数据。飞行学生在整个养成阶段,操行分数间接反映学生学习生活方面的态度,平均绩点则反应学生整个过程的综合水平。因此,以上两类数据也作为神经元输入数据。而飞行学生私照、商照及仪表三门执照考试总成绩作为模型的期望输出。输入数据如表1所示。

此外,学生个体差异大,自由度高,影响飞行学生执照成绩因素很多。例如晚上就寝时间、图书馆自习时间等。这些数据中,某些对执照成绩影响较小,如果都考虑作为输入,必然会影响模型执行效率。

模型构建主要包括以下3个阶段:输入、处理和输出。处理包括归一化处理,确定输入、输出、隐藏单元,设置训练参数,创建BP网络模型,调用函数等。输出包括训练样本和测试样本的输出,如果测试样本的输出符合训练样本的预期则学习结束,如果不符合训练样本的预期,则再次学习,调整阈值,直到符合预期为止。模型构建流程如图2所示。

实验环境采用MATLAB,是一种集数值分析、数据可视化、矩陣计算以及非线性动态建模的高级技术计算语言和交互式环境。预测仿真实验使用R2017a版本MATLAB自带的BP神经网络工具箱实验测试。该工具箱包括了很多种神经网络的初始化和训练。BP神经网络的实现过程包括:输入样本至神经元产生输出值、计算输出误差将误差反向传递、得到阈值和权重值、循环迭代误直到差达标训练终止。

预测模型的具体实现步骤如下。

(1)将样本数据输入网络,设定网络参数,隐藏单元神经元数初设为10,网络迭代次数为1 000次, 期望误差为0.000 000 01, 学习速率为0.01。

(2)实验数据来源于某高校飞行学生332组学生的成绩数据,其中299组作为训练样本,33组作为测试样本。

(3)训练样本按照0.7、0.15、0.15比例随机设置训练集、验证集和测试集对网络进行训练。

期望输出值和预测输出值的相关度如图3所示。

根据图3数据可知,横坐标为样本期望输出值,纵坐标为模型预测输出值。相关度系数用表示,若越接近1,则表示线性化程度越高,预测效果越好。网络训练结果得出训练集训练数据、验证数据、测试数据的相关系数分别为0.95、0.92、0.84,整体相关系数为0.93,具有较高的线性化程度。

神经网络工具箱,运行代码后,可以在工作区得到训练出的网络net,输入代码,利用训练好的神经网络进行数据预测。网络训练主要代码如下。

x = data1';t = data2';

trainFcn = 'trainlm';  hiddenLayerSize = 10;

net = fitnet(hiddenLayerSize,trainFcn);

net.divideParam.trainRatio = 70/100;

net.divideParam.valRatio = 15/100;

net.divideParam.testRatio = 15/100;

[net,tr] = train(net,x,t);

y = net(x);e = gsubtract(t,y);

performance = perform(net,t,y)

view(net)

利用训练好的网络,对测试集33组飞行学生成绩进行预测,目标值与预测值相关系数=0.97,具有较高的线性化程度,能够达到理想的预测结果。测试集目标值和预测值的相关度如图4所示。

目标值与预测值误差直方图如图5所示。

从图5所示误差可以得出如下结论:绝大部分测试集样本误差集中在-5.5~+5.5分之间,极少数样本误差达到-8、+8区间以外。对于总分300分的执照考试成绩而言,整体预测效果较为理想,能够达到预测指导目的。

该文在构建模型时,利用学生管理经验,剔除噪声数据,这种数据处理方式存在较大的人为因素。其次在模型构建时,未对数据进行PCA降维预处理,因此,模型的训练及预测效率较低。在后期的研究中,首先对数据进行关联分析,得到有效输入数据。其次需扩大输入样本范围,该文在构建飞行学生成绩预测模型的过程中,仅采用单一年级小样本数据,不具备一般性,在后期的数据搜集过程中,要尽量对飞行学生进行全覆盖。同时,在特征数据上尽量加入对执照成绩有较大影响的数据,例如:学生的自习时长,作息规律性等量化数据。该文执照成绩预测得到较为理想的预测结果,为学管工作者日常管理科学的决策指导。综上,在学生日常管理过程中,不仅要对学生做好思想政治教育,还要善于搜集学生日常数据,挖掘数据内在规律,助力学生科学管理。

[1] 马高,刘康.基于BP神经网络CFRP约束混凝土抗压强度预测[J].湖南大学学报:自然科学版,2021,48(9):88-97.

[2] 王伟,代红,赵斯祺.基于特征优化和BP神经网络的入侵检测方法[J].计算机工程与设计,2021,42(10):2755-2761.

[3] 张彦荣.基于改进灰色神经网络的学生体育成绩预测[J].电子测量技术,2019,42(22):86-90.

[4] 郑秀月.基于BP神经网络的校园网络舆情危机预警研究[J].齐齐哈尔大学学报:自然科学版,2021,37(6):14-16,20.

[5] 温正. MATLAB科学计算[M].北京:清华大学出版社, 2017.

[6] 赵梦娜. 基于SVM和BP神经网络的量化策略研究[D].大连:大连理工大学,2021.

:中国民用航空飞行学院青年基金《大数据背景下飞行学生管理方法研究》(项目编号:XJ2021016101)。

罗忠运(1988—),男,硕士,研究实习员,研究方向为高校学生思政教育及学生管理。

猜你喜欢
神经元神经网络误差
基于人工智能LSTM循环神经网络的学习成绩预测
基于图像处理与卷积神经网络的零件识别
MIV-PSO-BP神经网络用户热负荷预测
AI讲座:神经网络的空间对应
仿生芯片可再现生物神经元行为
隧道横向贯通误差估算与应用
隧道横向贯通误差估算与应用
这个神经元负责改变我们的习惯
三次样条和二次删除相辅助的WASD神经网络与日本人口预测
研究人员精确定位控制饮酒的神经元