轨道交通信号系统中冗余技术研究

2022-02-11 07:04
铁路通信信号工程技术 2022年1期
关键词:双机主从信号系统

王 涛

(山东中车日立轨道通信信号有限公司,山东青岛 266000)

轨道交通作为运输效率高、绿色环保的交通出行方式,对于缓解城市拥堵,方便出行以及拉动地区经济增长都有重要作用。近年来,国家也高度重视轨道交通领域的发展,先后发布一系列轨道交通发展规划,均强调重点发展轨道交通装备等先进制造业。

1 信号系统的冗余设计

信号系统的作用类似于行车指挥的大脑,制定全线运营计划,监控全线列车运行,确保列车运行安全。由于信号系统高可靠性、可用性等要求,因此在设计时,会采用冗余、热备等设计方法。如在CTC调度集中系统,或地铁CBTC系统的ATS子系统中的服务器设备通常采用热备配置;信号系统的网络通常采用冗余方式。

地铁CBTC信号系统中,中心ATS子系统的典型结构如图1所示。ATS系统核心的服务器采用热备结构,主机进行输入、运算和输出,从机同时工作,但不进行输出。网络采用红蓝双网的结构,双网同时进行工作和数据传输,由节点设备的通信层软件来决定双网数据的取舍。

图1 中心ATS典型结构Fig.1 Typical structure of central ATS

2 双网控制

配置冗余交换机,同时节点设备(工作站、服务器等)采用多网卡方式组成完全冗余的网络。在该方式中,其中一个网络的异常不会影响系统通信,仍可保证连续的数据通讯。

2.1 网络划分

为满足冗余要求,两个网络配置C类IP地址,并分配不同的IP地址段,如表1所示。

表1 IP地址分配Tab.1 IP address allocation

2.2 通信层介绍

为满足两个网络同时进行数据收发需求,在网络节点设备(服务器、工作站、控制设备等)中通过软件的方式进行控制。同时,考虑到软件模块化、通用性、可移植性等要求,通常采用在系统层和应用层之间设置通信层(也被称为中间层)的方式,由通信层完成双网络的控制逻辑。同时,也可在通信层完成其他功能扩充,如实现铁路安全通信RSSP协议等。如图2所示。

图2 通信层结构Fig.2 Communication layer structure

由于通信层的存在,冗余网络对于应用层透明。应用程序无需关心具体的双网控制,只需与通信层发生数据交互。具体来说是由通信层向双网络发送相同数据,同时从两个网络接收数据。应用层和通信层的接口在软件设计时,可以考虑采用API或进程间通信等方式。

2.3 通信场景

1)通信正常

应用程序发送数据至通信层,由通信层向A、B双网发送相同数据,而接收节点可从两个网络收到数据,但只有先到达的数据会被采用,后到的数据将会被通信层丢弃。

如图3所示,节点1发送的数据通过A、B双网到达节点2后,节点2的通信层优先使用先到数据,后到数据被丢弃。

图3 正常时通信流程Fig.3 Normal communication flow

2)单网故障

在此场景下,由于在双网中同时有数据传输,因此当单个网络有故障时,会自动从正常网络获取到信息,无需进行切换,也不会造成时延。如图4所示。

图4 单网故障时通信流程Fig.4 Communication flow in case of single network failure

同时,通信层对两个网络的状态进行监视,如确定其中一个网络发生故障,则自动舍弃该网络,连续从另一网络收发数据。

2.4 控制逻辑

发送时,通信层将相同的数据向两个网络发送,进行双网传输。

接收时,通信层对两个网络的报文都进行接收,成功后向应用层返回报文。接收的流程如图5所示。

图5 通信层接收流程Fig.5 Communication layer receiving flow

可在软件中通过绑定INADDR_ANY 地址,即0.0.0.0的IP地址的方式,对节点设备来自A、B双网的数据同时进行接收。

通过CRC等方式对报文正确性进行校验,此校验也可不在通信层实现,由应用层进行校验。

通常序号范围可以从0x0001-0xFFFF,在每次报文发送时进行循环累加。正常情况下,接收到的序号应为累加状态。当序号相同时,说明接收的是双网络的冗余报文;当接收的序号变小时,报文传输可能存在问题,需根据不同情况来具体分析和应对。

3 双机热备

双机热备是在两台处理设备上运行各自独立的应用,当其中一台设备故障时,由另一台设备进行接管,提升整体的可用性。

如图1中的ATS结构,对于数据库服务器,通常采用配置商用热备软件的方式,来进行管理和确保数据的完整性;但对于其他如应用服务器、接口服务器等,为了更加灵活和方便的控制,通常由信号系统自行设计的热备软件来进行控制。

3.1 状态迁移图

双机热备系统中,其中一方为主系,另一方为从系。主系接收数据,进行运算后对外输出;从系接收数据,独立进行运算,但不对外输出。当主系出现故障时,系统将自动进行主从系切换,主从系的状态迁移如图6所示。

图6 主从状态迁移Fig.6 Main/standby state transition

图6中,为了标记,热备的两台设备分别被命名为1系和2系。正常运行时,两系为一主一从,当故障发生时,进行切替。

3.2 主从切替

双机间通过心跳线和互发心跳报文的方式监测对方状态。本文直接将双机设备接入至冗余的双网中,作为心跳线。主从切替如图7所示。

图7中,1系为双机中的主系,2系为从系,双方周期性互发心跳报文。当2系3个周期内未收到1系心跳时,判断1系故障,并根据图6中的迁移状态升级为主系,接替1系的控制。

图7 主从切替Fig.7 Main/standby system switching

除以上被动的心跳监视进行切替的方式,同时对本机状态进行自监视,当发现自身异常时,及时通知对方进行状态切替。

3.3 信息孤岛的处理

当1系与A、B双网的连接断开,会形成信息孤岛,如图8所示。此时由于1、2系都接收不到对方心跳,都会升级成为主系,因此当故障恢复时会造成双主状态,此种情况应避免。通过对本机的以太网状态进行监视,当发现A、B双网都为断开时,程序自动停止,需通过人工介入的手动方式才可恢复,避免故障恢复后变为双主状态。

图8 1系形成信息孤岛Fig.8 The system 1 forms an information island

3.4 启动流程

主从双方的心跳报文中包含本机的状态信息(即本机是主系或从系)。启动时,通过心跳报文的接收情况和状态信息来对自身状态进行设定。

如图9所示,本机启动时,状态初始为从系,并根据接收心跳报文的情况确定是否进行状态迁移:如对方离线,则直接切换为主系运行;如对方在线,且以主系运行,则本机作为从系运行,无需切换;如对方在线,且以从系运行,此时通过执行预先的默认配置来强制确定主从。如可默认双机中的1系为主系,2系为从系。

图9 启动流程Fig.9 Start-up flow chart

4 结束语

双网控制和双机热备的冗余技术在信号系统中有着广泛应用。本文所提出的通过软件实现双网和热备的控制方法,已在国内城市轨道交通线路中上线应用,通过实际应用证明,可满足系统的业务需求,并提升系统可用性和可靠性。

猜你喜欢
双机主从信号系统
液氧煤油发动机氧系统双机耦合振荡频率特性
轨道交通信号系统无线传输应用
地铁信号系统车站施工工艺研究
儿童气候教育者让成人开眼看气候
鸟类世界的爱因斯坦
地铁信号系统的维护方法与维修技术探析
双机、双桨轴系下水前的安装工艺
旋翼转速信号系统自转下滑状态故障研究
旋转位似的性质与主从联动法
利用TL16C554实现主从式多机串行通信