张梓鸿 赵正阳 王文斌** 李 洋 李沅军
(1.中国铁道科学研究院集团有限公司城市轨道交通中心, 100081, 北京;2.石家庄铁道大学交通运输学院, 050043, 石家庄∥第一作者, 助理研究员)
城市轨道交通轨道几何是评价轨道平顺性的重要指标,也是影响线路运行安全性、舒适性的关键因素。目前,对于轨道几何不平顺的预测方法主要包括传统预测和机器学习预测[1-4]两大类。文献[5]将列车加载作为影响道床变形的因素,建立了轨道有限元模型,通过道床变形模量得到道床累积变形随加载次数的变化规律。文献[6]基于概率分布的基本思想,建立轨道几何不平顺状态推移矩阵,计算得出轨道几何不平顺的推移变化规律。文献[7]基于灰色区间理论并引入时变参数,建立时间序列的非等时距灰色时变参数模型,对轨道质量指数进行了预测。文献[8]基于灰色区间理论对轨道几何不平顺指标进行了预测。文献[9]考虑维修作业对轨道几何不平顺变化规律的影响,通过三次多项式对直线段和曲线段轨道几何不平顺随时间变化的规律进行了拟合,并分别对小半径曲线段和直线段进行了预测。文献[10]采用数值模拟方法,建立了轨道几何不平顺指数型恶化函数以及捣固后恢复函数,对捣固作业后轨道几何不平顺的状态进行了预测。文献[11]基于机器学习方法对建立了城市轨道交通轨道几何神经网络预测模型。文献[12]通过机器学习建立双隐层BP(反向传播)神经网络模型,并对7项轨道几何不平顺指标进行了预测。文献[13]采用时间序列对城市轨道交通轨道质量指数进行了预测,建立了输入层节点个数为6、输出层节点个数为1、隐含层节点个数为10的3层结构的BP神经网络模型。文献[14]通过3D卷积神经网络对高铁轨道质量指数进行了预测,将时间、空间和轨道几何不平顺指标等检测项作为模型的输入,并从初始化参数、学习速率、激活函数及损失函数等方面对模型进行了优化。基于调研发现,当前对于城市轨道交通轨道几何不平顺指标预测研究仍存在一定的不足:传统方法对部分因素进行了量化,预测精度较低且只适用于部分城市轨道交通线路;依靠已有的神经网络法搭建的神经网络较为简单,不能较好地拟合输入、输出数据,且主要通过时间序列对数据进行预测,预测精度有限。
本文基于城市轨道交通轨道几何动态检测数据,结合时间、空间及检测项等特征,建立了基于卷积神经网络的轨道几何不平顺指标预测模型,并利用某城市轨道交通线路实测数据进行了验证。试验结果表明,结合时间、空间及检测项等特征的基于卷积神经网络的轨道几何不平顺指标预测模型有较高的预测精度,为轨道几何不平顺预测提供了新思路。
轨道几何不平顺预测的整体流程主要包括数据选取、数据集构建、模型训练和模型评估4个部分,如图1所示。
注:m为当前检测月份;x为选取区段的起始里程,单位km。
分别建立左高低、右高低、左轨向、右轨向、轨距、水平和三角坑等7项指标的基于卷积神经网络的轨道几何不平顺指标预测模型。对该模型训练的数据集从检测项、时间及里程等3个维度对数据进行整合处理。
1) 检测项:左高低、右高低、左轨向、右轨向、轨距、水平及三角坑等各指标间并非独立存在。在卷积神经网络中将每项检测指标作为模型训练的特征参数构建模型,提高模型的预测能力。
2) 时间:反映轨道区段随时间连续变化情况。将时间作为特征参数对轨道几何不平顺随时间的变化特征进行提取,充分挖掘不同月份条件下轨道几何不平顺的变化情况,以提升模型的训练效果。以2022年某城市轨道交通上行线路K16+700—K16+900区段第1、2期左高低检测数据为例,其左高低-里程关系曲线如图2所示。
图2 某城市轨道交通上行线路左高低-里程关系曲线
3) 空间:里程维度通常能够反映某轨道区段的整体情况。分析列车荷载、地质条件等因素影响该预测单元受的轨道几何不平顺变化情况。以2020年1月9日某城市轨道交通上行线路K16+700—K16+900区段检测数据为例,其7项检测指标-里程关系曲线如图3所示。
图3 K16+700—K16+900区段内7项检测指标-里程关系曲线
通过对数据的多维度统计,将某城市轨道交通上行线路K16+700—K16+900区段2020年1月9日至3月16日共6期7项检测指标数据形成的特征矩阵可视化至三维散点图中,如图4所示。
注:散点颜色深浅表示检测值的大小。
本文构建的卷积神经网络共3层,包括1层输入层、7层卷积层、3层池化层、4层全连接层和1层输出层。卷积神经网络结构如表1所示。
表1 卷积神经网络结构
卷积神经网络内部卷积、池化及全连接层模型如图5所示。
注:括号中的数值表示卷积层和池化层的层数。
Adam(自适应矩估计)结合AdaGrad(自适应梯度)算法和RMSProp(均方根反向传播)算法的优点,综合考虑梯度的一阶矩估计和二阶矩估计重新对步长进行计算,并根据每个参数的历史梯度信息对学习率的大小进行自适应调整,有效解决学习率难以调整和局部极小值问题。
激活函数均选取ReLU,它是卷积神经网络中常用的激活函数之一。激活函数fReLU(x)的计算公式如下:
fReLU(x)=max(0,x)
(1)
对于负数输入,fReLU(x)函数的梯度为0,可能导致神经元无法更新权重。本文添加了一个小的正值斜率0.01来修正负数输入的梯度。修正后的fReLU(x)函数曲线如图6所示。
图6 修正后的fReLU(x)函数曲线
fReLU(x)函数在训练时易收敛,计算速度快。fReLU(x)函数在卷积神经网络的隐藏层中引入非线性,使网络可以学习非线性的特征,同时还能缓解梯度消失的问题,从而提高网络的性能。
本文选择均方误差作为损失函数,它是回归问题中常用的损失函数。损失函数EMS的计算公式为:
(2)
式中:
f(xi)、xi——第i个样本的真实值和预测值;
n——样本个数。
忽略下标i,以f(x)-x为横坐标,以EMS为纵坐标,形成的EMS随f(x)-x的变化曲线如图7所示。
图7 EMS随f(x)-x的变化曲线
EMS函数曲线光滑、连续,处处可导,便于使用梯度下降算法。误差减小的同时梯度逐渐减小,这有利于EMS函数的收敛。
为防止过拟合同时加快模型训练速度,本文在卷积神经网络的全连接层采用Dropout方法[14]。随机选取全连接层90%的神经元进行训练和预测,计算公式如下:
rl~Bernoulli(p)
(3)
(4)
(5)
yl+1=f(zl+1)
(6)
式中:
Bernoulli(p)——概率随机函数;
rl——第l层激活神经概率矩阵;
yl——第l层神经元输入向量;
wl+1——权重矩阵;
bl+1——偏移矩阵;
f(zl+1)——正向传播函数,zl+1为第l+1层卷积神经网络实际输入向量。
基于卷积神经网络的轨道几何不平顺指标预测模型的训练测试环境选用Windows 10系统,CPU(中央处理器)为AMD Ryzen 7 4800U,最高频率为4.2 GHz,内存为16 GB,环境管理器为Anaconda 4.10.3,语言环境为Python 3.9.7,深度学习框架为TensorFlow 2.10.0。本文通过上述环境搭建并测试基于卷积神经网络的城市轨道交通轨道几何不平顺预测模型。
本次选取某城市轨道交通线路的检测数据作为评估数据集,其中训练集由前34期检测数据构成,验证集由后7期检测数据构成,以完成模型评估。
预测未来数据变化属于回归问题。本文通过EMS对轨道几何不平顺预测结果进行了评估。
(7)
式中:
y——真实的动态几何不平顺值;
n——预测区间内检测数据总量。
以三角坑为例,基于卷积神经网络的轨道几何不平顺指标预测模型下三角坑EMS-迭代次数变化曲线如图8所示。
图8 三角坑EMS-迭代次数变化曲线
由图8可以看出:训练迭代50次后,基于卷积神经网络的轨道几何不平顺指标预测模型达到收敛。
利用训练后的模型进行预测,采用EMS对预测结果进行量化,三角坑的EMS为0.018 4,其他指标的EMS均在0.020 0左右。轨道几何不平顺指标预测数据与真实数据对比结果如图9所示。
a) 左高低
由图9可见:轨道几何不平顺指标的预测数据与检测数据的拟合度较高,说明基于卷积神经网络的轨道几何不平顺指标预测模型能够较为准确地预测出各指标的整体变化规律。
基于上述数据集,采用文献[16]中单隐层BP神经网络、双隐层BP神经网络、多元回归分析及本文的卷积神经网络等方法对三角坑轨道几何不平顺的EMS进行对比,结果如表2所示。由表2可知:相比单隐层BP神经网络、双隐层BP神经网络和多元回归分析,卷积神经网络下的EMS分别降低了73.29%、71.80%和664.81%,说明卷积神经网络具有更好的拟合能力。
表2 4类预测方法下的EMS
为了更加精准预测城市轨道交通轨道几何不平顺变化趋势,本文通过分析影响其变化因素,建立了基于检测项、时间、里程等3个维度的基于卷积神经网络的轨道几何不平顺指标预测模型,并从学习速率、激活函数、损失函数、Dropout方法等角度对该模型进行优化。利用某城市轨道交通线路历史检测数据作为试验数据对模型进行了验证,与多元回归分析、双隐层BP神经网络相比,卷积神经网络预测的轨道几何不平顺指标的均方误差显著降低。结果表明,基于卷积神经网络的轨道几何不平顺指标预测模型能对大范围、长时间的轨道动态几何不平顺变化趋势进行良好的预测,可为后续城市轨道交通行业维保模式向状态修转变提供良好的技术基础。