基于SSA-CNN的航空器着陆跑道占用时间预测

2024-04-01 07:50陈亚青李颖哲赵瑞高浩然
科学技术与工程 2024年7期
关键词:航空器机场卷积

陈亚青, 李颖哲, 赵瑞, 高浩然

(1.中国民用航空飞行学院民航飞行技术与飞行安全科研基地, 广汉 618307; 2.中国民用航空飞行学院空中交通管理学院, 广汉 618307; 3.中国民用航空飞行学院院办公室, 广汉 618307)

受到跑道容量的限制,中国大型机场航班流量趋于饱和,对于提高机场跑道运行效率迫在眉睫。2021年中国机场出港航班总量为383.42万班次,出港总运力为68 090.38万座,运力同比增长7.39%。2021年旅客吞吐量达到1 000万的机场比2020年增长了2座,其中共有9座机场旅客吞吐量达到三千万[1]。欧洲单一天空空中交通管理(single european sky atm research, SESAR)研究表明跑道占用时间是限制跑道容量的主要因素之一,跑道占用时间的影响因素包括机场滑行道的布局、能见度条件、跑道状态、飞机类型等[2]。目前中国对跑道占用时间的定义和标准尚未界定,也没有形成统一的规范文件出台,导致跑道资源得不到充分利用,造成部分机场航班排队严重,影响机场运行效率和旅客出行满意度。因此,结合各个机场航班运行历史数据和机场自身特点,预测跑道占用时间对提高跑道使用效率和提高跑道容量都具有重要的现实意义。

Martinez等[3]通过对采集数据进行分析,得出不同机型着陆跑道占用时间不同,机型大小与着落跑道占用时间成正比。Stamatopoulos等[4]设计了一个决策支持系统,罗马费米齐诺机场的实际应用表明,系统可以有效估计跑道占用时间。Capri等[5]建立了车辆来跟踪航空器的模型,更好地模拟了航空器滑行轨迹。Baik等[6]使用遗传算法来优化航空器排队问题的决策变量,结果表明该方法能够有效地优化航班序列,减少跑道占用时间和航班延误。Ghalebsaz Jeddi等[7]对底特律机场跑道占用时间进行了统计分析,结果表明跑道占用时间更近似于混合贝塔分布。Kolos-Lakatos[8]通过对4个机场数据分析发现配备快速出口的机场跑道占用时间会明显降低。雷振军[9]在机场快速出口滑行道优化问题中详细分析跑道占用时间和滑行距离。Nikoleris等[10]建立了一个递归排队模型,研究结果表明准确预测跑道占用时间是提高四维航迹精度的重要内容。康瑞等[11]通过建立跑道容量评估模型,分析了跑滑结构和跑道容量的关系。欧控中心与代尔夫特理工大学基于法国戴高乐国际机场的航空器运行数据,采用复合机器学习模型预测选定跑道30 min之内的航空器着陆次数以及每架航空器的跑道占用时间[12]。Friso等[13]使用机器学习方法对跑道占用时间进行了建模和预测,并提出了一种基于观察先兆的方法,用于发现和预测跑道异常占用的情况。田晓颖[14]利用算法将着陆许可发布时机转化为可操作的节点。高伟等[15]利用蒙特卡洛方法研究了机场跑道的运行效率。金京等[16]以B-737机型为研究对象,建立了航空器着陆跑道占用时间统计模型,并以QAR(quick access recorder)实际运行数据做对比验证了模型计算准确性,但模型并未考虑风的因素。邢志伟等[17]提出基于局部加权支持向量回归方法对航班滑出时间进行了预测,但模型对于初始权值和阈值更为敏感,稳定性有待提高。张思远等[18]分析了跑道占用时间和航空器着陆间隔对跑道容量的共同影响。冯超等[19]分析深圳机场场面监视雷达信号及ADS-B(automatic dependent surveillance-broadcast)数据,绘制深圳机场地图和电子围栏,得出了进出港航班的跑道占用时间,实现了对机场跑道占用时间统计分析的功能,其中关于跑道占用时间定义方面是基于运行习惯所得,缺乏一定科学性。潘卫军等[20]通过对3个机场数据分析,采用反BP神经网络方法对跑道占用时间进行了预测,但数据精度有一定误差,神经网络模型参数也可以进行进一步优化。黄龙杨等[21]提出SSA-BP(sparrow search algorithm-back propagation)方法对中南某机场起飞跑道占用时间预测,得出起飞跑道占用时间与离港航班数量强相关,但机场数量和样本影响因素有所不足。

在国外的研究中,在对航空器跑道占用时间进行预测时只考虑了部分影响因素,较少的影响因素可能会导致预测结果产生较大偏差。在中国的研究中,根据案例机场从动态规划、最优化算法方面对机场跑滑构型及最佳出口数量进行研究,但并未考虑到不同的机场环境、气象条件、航空器类型等影响跑道占用时间的相关特征参数,对现有机场跑道容量的提升参考价值有限。从国内外研究结果来看,影响跑道占用时间的因素主要包括跑滑结构和航空器类型等因素,跑滑结构不同,对应滑行距离也不同。现充分考虑着落跑道占用时间各项影响因素的重要程度,利用卷积神经网络(convolutional neural networks, CNN)算法构建航空器跑道占用时间预测模型,针对CNN算法中相关参数进行优化,将典型机型在不同跑道运行的QAR数据按照不同跑滑结构对应训练,实现对不同机场跑道不同条件下航空器着陆跑道占用时间的准确预测。

1 航空器着陆跑道占用时间影响因素分析

QAR记录器可以存储超过600 h的飞行数据,记录的数据包括航空器的重量、航向、空速、油量、气象条件等各种飞行过程中的参数。相较于其他监视系统记录间隔长、数据值缺失等缺陷,QAR数据记录频率为每秒一次,缺失值很少,可以提供更加详细和可靠的数据信息,有利于对航空器整个着陆至脱离过程进行分析。

1.1 数据处理

通过综合考虑机场的运行效率提升以及安全等因素,结合国外学者的研究成果以及中国跑道侵入中保护区概念,本文中将航空器着陆跑道占用时间界定为:航空器机头飞越跑道入口至航空器机尾完全越过跑道边界的时间间隔。根据定义对相关航空公司提供的29 108条航空器着陆QAR数据进行着陆跑道占用时间的截取,对缺失值和异常值处理后,得到的QAR有效数据共22 612条,其中,QAR数据中机型为A320和B737-800,将两种机型转化为更具体的航空器重量,可以更详细的区分航空器着陆时机身重量的差别。不同机场跑道数量不同,QAR数据按照不同机场进行分类,每条QAR数据都对应不同的着陆跑道,可以更具体的体现不同机场跑道数量和不同跑道对占用时间的影响。根据每条QAR数据中不同滑行距离和脱离道口角度和数量的配置,可得出航空器所选的具体脱离道口,即跑滑结构的影响。最后,将不同机场QAR数据进行整合,可以提高模型的普适性,更好的适用于全国各个机场。依据QAR数据和相关资料中提取的参数,计算得到了着陆跑道占用时间,并将航空器重量、落地气温、风速、风向、脱离道角度、脱离道口数量、滑行距离、进入跑道速度、脱离速度作为主要影响因素,处理后的QAR数据形式如表1所示。

表1 样本数据Table 1 Sample data

1.2 相关性分析

1.2.1 皮尔森相关系数

皮尔森相关系数(pearson correlation coefficient)是描述两个变量之间线性关系大小的系数,一般用r表示。r值正负表示两个变量之间的关系是正相关还是负相关,绝对值越大,相关性越强,被广泛应用于数据分析和统计学研究中,可以帮助研究人员了解变量之间的关系,从而做出更准确的预测和决策。其表达式为

(1)

1.2.2 影响因素相关性分析

采用皮尔森相关系数对22 612条QAR数据进行分析。通过热力图矩阵展示因变量与自变量之间的线性关系,同时还能获得各个自变量之间的线性关系。着陆跑道占用时间与影响因素之间的线性关系,具体如图1所示。

图1 影响因素热力图Fig.1 Thermal diagram of influencing factors

图1中各参数指标与占用时间的线性关系为:滑行距离(0.53)与跑道占用时间成正比;脱离速度为(-0.24)、脱离道口数量(-0.15)、进入跑道速度(-0.15)、落地气温(-0.12)与跑道占用时间成反比;脱离道角度(0.084)、风速(0.004 4)、风向(-0.029)、航空器重量(-0.061)与跑道占用时间呈低相关性。

通过对相关航空公司处理得到的22 612条QAR数据进行相关性综合分析,得到以下结论。

(1)与AROT呈高相关性的参数:滑行距离、脱离速度、脱离道口数量、进入跑道速度、落地气温。

(2)与AROT呈低相关性的参数:脱离道角度、风速、风向、航空器重量。

(3)与AROT的重要度排序为:滑行距离、脱离速度、脱离道口数量、进入跑道速度、落地气温、脱离道角度、风速、风向、航空器重量。

2 基于SSA-CNN构建着陆跑道占用时间模型

2.1 CNN模型

卷积神经网络(CNN)是机器学习的一种算法,是通过卷积计算的前馈神经网络。卷积神经网络是多层感知机的变体,采用局部连接和共享权值的方式处理已知网络拓扑结构的神经网络。卷积神经网络通过QAR数据的输入,可以有效的从大量数据中学习到不同影响因素的特征信息,根据提取的特征信息只需少量的人工参与就可以得到可靠的跑道占用时间预测值。

2.2 SSA模型

麻雀搜索算法(SSA)由Xue等[22]在2020年提出的一种群智能优化算法,具有简单易懂,计算效率高的优点,因此本文中采用麻雀搜索算法优化卷积神经网络相关参数。

麻雀搜索算法灵感来源于麻雀在寻找食物时的行为,通过模拟麻雀在搜索食物时的个体行为和群体行为,不断地更新每个个体的位置和速度,以达到全局最优解,麻雀之间会相互监视以获得更好的食物资源,从而避免陷入局部最优。该算法已被广泛应用于各种优化问题中,如参数优化、控制优化等领域。由于CNN部分参数为人为设定,所以网络结构未必是最优结构,需要采用麻雀搜索算法对相关参数进行优化。

2.3 SSA-CNN模型

基于以上两种算法的各自特点,采用SSA-CNN算法构建预测模型,实现对着陆跑道占用时间的预测。根据处理后表1的QAR数据形式,将QAR数据划分成训练集和测试集,代入到卷积神经网络进行迭代,初步得到着陆跑道占用时间预测值,然后将卷积神经网络参数作为需要优化的变量代入到麻雀搜索算法中,得到卷积神经网络的最优参数值,调整原有卷积神经网络固定参数,运行优化后卷积神经网络得到新的着陆跑道占用时间预测值,具体预测流程如图2所示。

图2 跑道占用时间预测流程图Fig.2 Flowchart for runway occupancy time prediction

卷积神经网络模型的构建采用Python开源机器学习库sklearn1.0.2版本进行搭建,由输入、卷积、池化、全连接和输出部分组成。两层神经网络就可以拟合线性和非线性函数,因此配置两层神经网络结构就可以满足要求。最后设置全连接层将卷积神经网络的输出特征进行组合,输出为跑道占用时间的一维向量。

麻雀搜索算法由种群初始化函数、边界检查函数、计算适应度函数、适应度排序函数、位置排序函数、发现者更新、加入者更新、危险更新模块组成。以均方误差损失函数为适应度目标,采用Adam优化算法对卷积神经网络中的通道数、卷积核维度、学习率、批量训练数据大小参数进行优化,麻雀搜索算法优化卷积神经网络参数流程如图3所示。

图3 SSA-CNN模型优化流程图Fig.3 Flowchart for SSA model optimization

3 着陆跑道占用时间预测结果分析

3.1 CNN预测AROT

将QAR数据分为80%的训练组和20%的测试组,采用123为随机种子数。卷积神经网络模型接收大小为9的输入向量,输出大小为1的时间向量,令输入向量为自变量X,输出向量为因变量Y。设置Channel=32、Kernel size=5、Learning rate=0.000 1、Batch size=32、Stride=1、Leaky ReLU = 0.2、Activation=‘relu’、Linear=‘3’、Epochs=20、Solver=‘Adam’,设定参数后的CNN结构如图4所示。

图4 CNN结构图Fig.4 CNN architecture diagram

将训练集输入设置好的CNN模型完成训练,对测试集的预测值和真实值误差对比如图5所示。

图5 CNN预测值与真实值误差对比Fig.5 Comparison between CNN predicted values and actual values error

3.2 SSA-CNN预测AROT

首先设定均方误差值作为适应度的目标函数,设置初始化函数、边界检查函数、计算适应度函数、适应度排序函数、位置排序函数、发现者更新函数、加入者更新函数、危险更新函数。设置MaxIter=100(最大迭代次数)、PD=0.7(发现者比列)、Pop=20(种群数量)、ST=0.6(预警值)、SD=0.2(识到有危险麻雀比重)、Dim=4(维度),其中Channel大小下边界为8,上边界为64,Kernel size下边界为1,上边界为3,Learning rate大小下边界为0.000 01,上边界为0.001,Batch size下边界为8,上边界为64。迭代后的均方误差值如图6所示。由图6可知,优化后的SSA-CNN模型均方误差最后收敛于16.89。其中,优化后的参数如表2所示。

图6 SSA误差收敛曲线Fig.6 Convergence curve of error for SSA model

表2 SSA-CNN参数取值Table 2 SSA-CNN Parameter values

SSA优化后的CNN结构如图7所示。

图7 SSA-CNN结构图Fig.7 SSA-CNN architecture diagram

SSA-CNN预测模型对测试集的预测值和真实值误差对比如图8所示。由图8可知,CNN与SSA-CNN两种模型都能有效实现对着陆跑道占用时间的预测。为了评价预测精度,采用均方误差(mean square error, MSE)、平均绝对误差(mean absolute error, MAE)以及平均绝对百分比误差(mean absolute percentage error, MAPE)作为预测结果的评价指标,结果如表3所示。

图8 SSA-CNN预测值与真实值误差对比Fig.8 Comparison between SSA-CNN predicted values and actual values error

表3 着陆跑道占用时间预测精度评价Table 3 Evaluation of landing runway occupancy time prediction accuracy

从表3中指标可以看出,SSA优化后的CNN预测结果较优化前MSE减少了1.041 6,MAE减少了0.091 7,MAPE减少了0.08%。结果表明SSA-CNN模型对于着陆跑道占用时间的预测提升是有效的。

3.3 模型结果对比

将优化模型所得最优参数配置用于6个典型机场具体跑道的着陆占用时间预测。选取航空公司真实运行的QAR数据,影响因素作为模型输入,对不同跑滑结构下的跑道进行AROT预测,将6组算例数据真实值与预测值进行对比,如表4所示。

表4 着陆跑道占用时间真实值与预测值对比Table 4 Comparison between the actual and predicted values of landing runway occupancy time

通过对表4的典型机场不同跑滑结构的AROT观察得知,5组结果差值均在1 s以内,真实值与模型所得预测值差值较小,模型可靠性良好。

4 结论

研究基于QAR运行数据,采用SSA-CNN模型对着陆跑道占用时间进行预测。着陆跑道占用时间与滑行距离、脱离速度、脱离道口数量、进入跑道速度、落地气温具有较强关联性,与脱离道角度、风速、风向、航空器重量关联性较弱。SSA优化后的CNN模型预测结果得到有效提升,MSE减少了1.041 6,MAE减少了0.091 7,MAPE减少了0.08%。最后通过输入航空公司真实运行的QAR数据,实现了对典型机场不同跑滑结构的AROT预测。

麻雀算法收敛速度快,卷积神经网络对数据特征提取效果好,本文首次采用SSA-CNN模型对AROT进行预测,预测模型可以对不同跑滑结构下的跑道进行AROT预测,预测结果可以为机场跑道运行容量扩充,提升机场跑道运行效率提供参考。由于QAR数据获取困难,目前数据量和影响因素维度还有待提高,包括增加其他机型的QAR和航司等数据,随着后续机型数据增加,模型将具有更好的可扩展性和准确性,下一步的研究方向将在QAR数据的基础上,考虑与其他数据源和机场数据的融合,使预测模型更好的应用于机场实际运行中。

猜你喜欢
航空器机场卷积
机场罢工
基于3D-Winograd的快速卷积算法设计及FPGA实现
如何避免GSM-R无线通信系统对机场电磁干扰
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
面部识别使机场安检提速
论航空器融资租赁出租人的违约取回权
航空器的顺风耳——机载卫星通信
火星航空器何时才能首飞
MSG-3在小型航空器系统/动力装置维修要求制订中的应用