基于马尔科夫链的高铁列车连带晚点横向传播

2022-11-30 13:02刘睿徐传玲文超
铁道科学与工程学报 2022年10期
关键词:连带马尔科夫晚点

刘睿 ,徐传玲,文超

(1. 西南交通大学 综合交通运输国家地方联合工程实验室,四川 成都 610031;2. 重庆长安汽车股份有限公司,重庆 400023;3. 西南交通大学 综合交通大数据应用技术国家工程实验室,四川 成都 610031)

保证高速列车安全正点运行是高速铁路运输组织的核心要义。高速铁路网络的建设完善、线路利用率的提高、行车密度的增大对准确刻画列车运行过程、优化调度指挥工作提出了更高要求。高速列车运行受到随机干扰,造成列车晚点并在一定范围内传播,影响后续区间或局部路网内的其他运行列车。晚点横向传播增大了铁路调度指挥难度,降低了高速铁路服务的可靠性与准时性。研究晚点的时空分布特点与晚点传播特性,对优化运输组织调整策略,实现准时可靠的列车运营具有重要意义。国内外对连带晚点的研究主要集中在连带晚点的识别判定、晚点传播与预测等方面。YUAN等[1]指出进路线路冲突和晚点换乘连接会影响连带晚点的发生;CAREY等[2]使用拟合统计仿真数据建立晚点传播仿真系统,预测车站连带晚点的概率分布;DAAMEN等[3-4]利用图论研究并开发自动识别确定列车进路冲突的工具,以此确定连带晚点的发生;定时事件图[5]、活动图[6]和排队网络模型[7]等用于构建或计算晚点传播范围;王昕等[8]根据列车晚点时间和追踪列车间隔时间得到列车晚点情况,以晚点损失最小和未占用固定到发线列车数目最少为双重目标构建规划模型。孟令云等[9]从列车间晚点传播链和结构性晚点传播角度构建列车群晚点传播链;殷勇等[10]建立基于SIR模型的车站晚点传播模型分析车站内的晚点传播机制;黄平等[11-12]分别利用随机森林和RNN模型预测晚点恢复时间和晚点实时预测;张琦等[13]利用小波神经网络构建列车连带晚点的预测模型,并将连带晚点分为严重、消散、潜在和一般4种类型。综上,已有研究主要利用传统数学模型方法分析连带晚点的产生原因、判定方法和传播过程。缺乏利用列车运行实绩,通过数据挖掘处理后,分析连带晚点横向传播特性。故本文基于列车运行实绩,重点研究列车在车站层面受晚点横向传播而导致的连带晚点,利用齐次马尔科夫链分析不同状态下的连带晚点横向传播特点。本文的主要立足点是根据列车当前的晚点状态及历史的晚点传播过程,可以提供列车未来可能状态的推导和预测,为调度员进行行车调整提供较为直观的决策依据,协助调度员及时准确地制定调度调整策略,减少列车间的相互作用干扰,降低对车站日常行车工作组织的影响。

1 列车连带晚点横向传播过程

根据晚点类型可将列车晚点分为初始晚点和连带晚点,初始晚点指受外界因素影响而首次晚于时刻表规定的其在车站的到达出发时刻而形成的晚点。由于受到其他列车影响而使列车在车站的到达或出发时刻晚于列车运行计划,这种情况下的晚点称为连带晚点。若前行列车发生初始晚点,其实际到达时间与后行列车的图定到站时刻间隔不满足车站间隔时间,则后行列车发生连带晚点。

表1所示是一个完整的晚点横向传播过程,前行列车G634次在广州南站由于ATP系统发生故障而发生初始晚点,初始晚点时长为12 min。初始晚点所造成的连带晚点形成晚点横向传播,导致后行列车G6146次列车和G2912次列车分别发生11 min和6 min的连带晚点。冗余时间能够消除或吸收晚点时间,使后行列车运行恢复原有秩序,故G6228次列车按计划运行。

表1 高速列车晚点传播示例Table 1 Example of delay propagation of high-speed trains

图1描述了列车到达某车站后发生晚点,导致后行列车发生连带晚点以及晚点恢复的过程,实线表示计划运行线,虚线表示实际运行线,I为车站间隔时间,分别是列车1,2和3的冗余时间。列车1在区间运行过程中受到干扰后在B站发生初始晚点t1。由于列车1与列车2之间的线间冗余时间小于t1,未能完全吸收该晚点,故列车2受到列车1的干扰发生连带晚点t2。同样列车3与列车2之间的冗余时间小于t2,列车3受到列车2的干扰发生连带晚点t3;列车4也受列车3的影响发生连带晚点t4。列车5与列车4间的冗余时间大于t4,故该晚点被完全吸收,列车5未受前行列车的干扰,正点到站。

由图1可知列车到站实际上是一个随机过程,当前列车的到站状态仅与前行列车的到站状态有关,而与前行列车在到站前所处的状态,以及前行列车之前的列车运行状态无关。吴昊[14]指出“无后效性”是指事物的下一个状态与过去的状态和信息无关,只和当前所处状态有关联,即给定现在状态,将来与过去状态是条件独立的。因此可认为列车到达车站具有“无后效性”。利用列车的实际与计划到达时间差描述列车的到站状态,并做离散化处理,可以得到离散的列车到站状态集I={i1,i2,i3,…,in}。

2 连带晚点横向传播的马尔科夫模型

马尔科夫链广泛应用于具有随机过程系统的分析和建模中,它将时间序列看作一个随机过程,进而通过对事物计算同状态的初始概率与状态转换概率,确定事物变化趋势。

ŞAHIN[15]将列车出发和到达时间序列视为一个随机过程,利用马尔可夫链预测单线铁路中连续的列车状态变化,估计晚点传播概率。KECMAN等[16]将晚点随时间和空间的演变过程视为非平稳马尔科夫链,定义列车在连续车站内的到达/出发晚点为随机变量,并分类为“早、小、大”状态,预测晚点概率分布,预测准确率提高71%。以上研究均取得良好效果,但未能单独考虑连带晚点对传播过程的影响。

本文利用马尔科夫链分析连带晚点横向传播规律。研究假设为:1) 列车运行是按图行车,若列车间的晚点传播过程是确定的,那么列车的正、晚点状态一直保持不变,传播概率保持为1。但在实际运行过程中仍有随机干扰存在,如恶劣异常天气影响、设备故障和人为操作失误等,且存在司机操作差异、动车组牵引和制动性能差异的影响,以及列车运用冗余时间赶点运行的情况,这是在按图行车的基础上发生的随机事件,故晚点传播可以用概率描述。2) 冗余时间,包括车站、区间运行和追踪运行冗余时间等,主要用以控制晚点传播强度以及提高晚点恢复能力。本文研究列车晚点横向传播,晚点传播效应主要是指前后行连续几列车的关系,而连带影响主要是受到车站的间隔时间和冗余时间影响。对应于区间冗余时间,由于目前高速铁路列车在区间的速度标尺基本采用一致的,即前后行列车可利用的区间冗余时间基本相同,在晚点“赶点”时,区间冗余时间主要影响的单列车自身晚点的纵向传播效应。因此,本文在考虑列车晚点横向传播时仅考虑了车站冗余时间。

列车到站过程可被描述为马尔科夫链X={x1,x2,…,xn},其中xn∈I,n=1,2,3,…。n步状态转移概率的计算公式为:

式中:k表示时刻,i,j表示晚点状态。式(1)表明晚点传播的马尔科夫链在时刻k处于晚点状态i,再经过n个到站间隔后转移到晚点状态j的概率。

式(2)说明列车在n个到站间隔后的晚点状态完全是由其1个到站间隔后的晚点状态决定的。式(3)表示n个到站间隔后的晚点状态概率矩阵是一个到站间隔后的晚点状态概率矩阵的n次方。

针对列车的连带晚点横向传播问题,所使用的马尔科夫链的构成要素有:列车在某时刻的晚点状态、晚点状态转移矩阵、列车在下一时刻的晚点状态。若已知列车在任意状态间的转移概率,就可以确定整条晚点传播的马尔科夫链。

列车到站状态的状态转移概率的计算公式如式(4)。式中,fij表示列车在站内由到站状态i转变为状态j的概率,表示列车在站内的到站状态转移集合。在相邻2个车站间,pij表示为列车从第i个车站出发晚点状态到第j个车站的到达晚点状态的转移。因此对于相邻的2个车站,公式构成了整个晚点传播链。在一个车站内的列车到站状态分类的基础上,公式也可描述某一列车的不同到站状态到后行第1列列车的不同到站状态的转移,构成车站层面的晚点传播链。

特别地,若为齐次马尔科夫链,则模型具有唯一的平稳分布,判定方法为:

3 算例分析

3.1 数据描述

本文使用的列车运行实绩来源于中国铁路广州局集团有限公司管内的广深港高速铁路广州南-福田段,共有广州南(GZN)、庆盛(QS)、虎门(HM)、光明城(GMC)、深圳北(SZB)和福田(FT)6个车站(NODE),列车实际运营速度310 km/h。数据时间跨度为2016年1~10月,共计163 919条,内容包括车次、到站和实际到达时间等,部分原始数据见表2。

表2 原始数据格式示例Table 2 Sample of the original data format

本文只研究上行旅客列车,删除其中错误或不完整的数据,共计80 394条数据。热力图是二维数据表可视化的常用方法之一,如图2所示,以连带晚点发生的位置(车站)以及晚点发生时间(某时)分别作为横纵坐标,以连带晚点频数作为热力显示绘制热力图。结果显示,各区域颜色分明,表明各车站发生的连带晚点频数具有时空差异性,且连带晚点具有累积效应,随着时间和地点的推移,连带晚点随上行列车运行出现“阶梯状”下降分布的趋势。如在8:00~10:00间的深圳北至广州南区段,连带晚点频数逐渐增多,并在终点站广州南站出现峰值。

3.2 晚点状态对晚点传播的影响分析

根据图2热力图结果,选择8:00~11:00内深圳北、光明城、虎门、庆盛和广州南5个车站的列车运行实绩做晚点传播分析,车站间隔时间为5 min。由列车实际到达时间与图定到达时间之差得到列车到站时间差,并判定列车的到站状态:非晚点状态(SN),初始晚点状态(SC)和连带晚点状态(SL)。故晚点传播的马尔科夫链状态集可描述为I={SN,SC,SL}。列车到达车站的马尔科夫链模型可表述为:

统计各站的到站状态转移频数,并按下式转化成相应的频数矩阵。

由式(4)计算8:00~11:00间相应的一步转移概率矩阵p(1),并得到各站的一步转移概率矩阵的具体示意图。如图3所示,指向SN的曲线箭头表示列车早点或正点到达,并未受到前行列车影响;指向SC的曲线箭头表示由于受到新的运行干扰而未受到前行列车的影响,本列车发生初始晚点;指向SL的曲线箭头表示本列车受到前行列车连带晚点的影响而发生连带晚点。直线箭头则表示后行列车晚点状态受前行列车的晚点状态的影响。由于后行列车的连带晚点不可能由非晚点列车造成,而是初始晚点或连带晚点的传播导致,故示意图中均没有SN→SL。光明城、虎门、庆盛站中SL→SL概率分别为0.482,0.494,0.518,呈递增趋势,说明此三站内连带晚点传播程度逐渐加深,连带晚点更具有传播性。

以庆盛站为例,在8:00~11:00时段内,当第1列列车非晚点到达车站后,经过一个到站间隔后,即其下一列列车约有40.5%的概率会发生初始晚点,几乎不发生连带晚点;当第1列列车发生初始晚点,其下一列列车约有26.0%的概率同样会发生初始晚点,说明后行列车并没受到该列车运行间隔的约束,而是因随机干扰产生初始晚点的,发生连带晚点的概率约为32.2%;当第1列列车发生连带晚点,其下一列列车仍有51.8%的概率发生连带晚点。0.518>0.405>0.322,说明连带晚点所引起的晚点传播程度影响更深。

求得庆盛站分别在8:00~11:00间每小时内相应的一步转移概率矩阵并计算其之间的平均绝对误差MAE。结果分别为0.019 7,0.026 7和0.037 2,均在可接受误差(0.05)范围内,故可证明庆盛站晚点传播的马尔科夫链是齐次马尔科夫链模型。

式(8)表明当第1列列车发生初始晚点,其后行第2列列车连带晚点的概率为25.1%;若发生连带晚点,则其后行第2列列车的连带晚点概率为34.0%。式(9)表明第1列列车发生初始晚点,其后行第3列列车连带晚点的概率为22.9%;若发生连带晚点,则其后行第2列列车的连带晚点概率为26.6%。

结合图3,式(8)和式(9)的结果可以看出,无论列车是以初始晚点还是连带晚点状态到达车站,都易引起后行列车的连带晚点,但随着到站间隔的增加,后行列车的连带晚点概率逐渐减小。同时连带晚点所引起的晚点传播影响程度均大于初始晚点所引起的晚点传播影响程度,表明连带晚点更易造成晚点传播。

列车晚点状态的齐次马尔科夫链有唯一的平稳分布,由公式(6)可算出πj={0.467,0.320,0.213}。因此分别计算列车在非晚点p={1,0,0},初始晚点p={0,1,0}和连带晚点p={0,0,1}状态下的晚点传播概率分布,结果如图4所示。

当列车初始状态向量为p={1,0,0}时,随着到站间隔的增加,连带晚点概率逐渐上升,但连带晚点的概率始终小于其他2个晚点概率。当p={0,1,0}时,随到站间隔的增加,非晚点和连带晚点状态的概率逐渐下降,初始晚点概率逐渐上升。且该初始晚点列车的后行第1列列车最易发生连带晚点。当p={0,0,1}时,随到站间隔的增加,非晚点和连带晚点状态的概率逐渐上升,初始晚点概率逐渐上升。并该连带晚点列车的后行第1列列车发生连带晚点的概率也较高。

对比3张变化图,若齐次马尔科夫链从3种不同初始状态出发,经过6个到站间隔后,各列车到站状态的概率基本稳定。从而可以说明不论初始到站状态的分布情况,经过6次概率转移后,总会达到一个稳定的状态。也可以说明当列车的连带晚点传播范围为6列列车时,后行列车不再受到当前晚点状态的影响。

结合上述分析,由于广深线各个车站的状态转移概率不一样,在调度调整中就需要更关注晚点传播概率大,尤其是易造成连带晚点时长较长的车站,并组织列车在前方区间内赶点。由于连带晚点的横向传播范围为6列列车,且晚点时长与晚点发生的概率随后行列车数的增加而逐渐降低,因此需要重点关注初始晚点列车后行的第1与第2列列车。若第0列车造成的初始晚点时间过长,可安排后行第1列车和第2列车越行第0列车,尽量减少第0列车晚点对区段运输组织的影响,即减少区段内列车晚点总时长。

3.3 连带晚点强度对晚点传播的影响分析

本小节将各车站内的连带晚点分类,研究不同强度的连带晚点时长对晚点横向传播的影响。根据表2中庆盛的连带晚点时长分布统计结果,75%分位数值为4 min,说明有75%的连带晚点时长在(0,4]区间内,大部分列车发生4 min以内的轻度连带晚点,因此将在(0,4] min的连带晚点定为I级连带晚点。广铁集团《行规》规定动车组列车晚点10 min及以上须通知邻局行调,因此将时长大于10 min的连带晚点定为III级连带晚点,在(4,10]之间的定为II级连带晚点。故列车的到站状态集可以表示为以下详细分析不同程度的晚点的传播规律。

仍以庆盛站为例统计列车不同晚点状态频数,并计算在8:00~11:00相应的一步转移概率矩阵

从式(10)可以看出,当列车处于I级、II级和III级连带晚点状态时,其后行第1列列车非晚点到站的概率逐渐下降,而随连带晚点强度的增加,干扰后行列车发生连带晚点概率逐渐增大。其中,I级连带晚点列车几乎不引起后行列车产生II级和III级连带晚点;II级连带晚点列车易引起后行列车产生II级和III级连带晚点;III级连带晚点列车容易干扰后行第1列列车发生III级连带晚点。

综上结论说明在晚点传播过程中,连带晚点强度具有累积性。同时,随着连带晚点强度的增强,连带晚点被消除的概率越小,说明连带晚点越不容易被冗余时间所吸收。

从式(10),(11)和式(12)可看出当列车到站发生I级连带晚点,后行第1列列车同为I级连带晚点概率为0.391;后行第2列列车的概率为0.236;第3列列车的概率降至0.190;当列车到站发生II级连带晚点,后行第1列列车同为II级连带晚点概率为0.250;后行第2列列车的概率为0.107,第3列列车的概率降至0.066;当列车到站发生III级连带晚点,后行第1列列车同为III级连带晚点概率为0.524;后行第2列列车的概率为0.308,第3列列车的概率降至0.191。可以看出,不同程度的连带晚点对后行第1列列车的影响程度最大,且干扰程度随后行列车数的增加而减弱。

4 结论

1) 从高铁列车运行实绩入手,研究连带晚点横向传播过程。绘制的连带晚点时空分布热力图,有助于运输部门更好掌握连带晚点的发生情况,有利于调度策略的及时调整。

2) 晚点传播是由于车站内或列车间的随机运行干扰,导致由某一列车所产生的初始晚点造成其后行列车出现连带晚点的现象。马尔科夫链的“无后效性”适用于描述列车到站状态,故利用马尔科夫链和转移概率矩阵分析连带晚点传播过程。

3) 选择庆盛站为代表站,分析列车在I={SN,SC,SL}下的晚点传播过程。在分时段计算的一步转移概率矩阵满足误差的前提下,进一步利用齐次马尔可夫链求得8:00~11:00内的二步和三步转移概率矩阵。结果表明,前行列车以初始晚点或连带晚点到站后,都易引起后行列车的连带晚点,且连带晚点所引起的晚点传播影响程度均大于初始晚点,更容易造成晚点传播。随着到站间隔的增加,后行列车连带晚点的概率逐渐减小,当经过6个到站间隔后,各列车到站状态的概率基本稳定。

猜你喜欢
连带马尔科夫晚点
基于三维马尔科夫模型的5G物联网数据传输协议研究
晚点的火车(外三首)
马尔科夫链驱动的带停时的超前倒向随机微分方程的适应解
连带债务人实现追偿权的现实困境分析
基于叠加马尔科夫链的边坡位移预测研究
“晚点围巾”揭德铁伤疤
马尔科夫链在企业沙盘模拟教学质量评价中的应用
马尔科夫链在企业沙盘模拟教学质量评价中的应用
神秘错综的连带感觉
爱屋及乌