一起报文漏字的典型案例深度分析

2022-06-29 07:18王栋坤
装备维修技术 2022年6期
关键词:排故报文端口

王栋坤

引言

民航通信网是民航重要核心基础设施,为民航各级管理单位、空管系统、民航运输企业和机场等提供全面的通信传输服务。从2020年开始持续到2021年,民航通信网业务迁移工作开展如火如荼,其中转报业务作为民航重要基础业务,在民航通信网业务迁移中至关重要。浙江分局转报业务迁移,需对杭州至上海以及至四个地方机场的转报业务进行迁改。

一、背景

浙江空管分局在用自动转报系统两套,都为北京航管科技公司96路大型转报系统。分局转报业务迁改前5个ATM信道端口共用一个切换单元,并最终连接至两套系统异步单元上。其中上海速率9600,四个地方机场速率1200,在民航通信网转报业务迁改前后,使用原端口。根据统一规划,业务迁改后上海速率保持9600,杭州至四个地方机场速率由1200改为4800。业务迁改前,杭州与华东对进行过一次报文压力传输测试,确认TDM链路传输报文正常。与四个地方机场通过民航通信网链路互发测试报文,都正常。正式将四个地方机场转报迁改至民航通信网TDM链路传输后,义乌机场使用民航通信网作为主用链路,其他三个地方机场则作为备用链路,只收发定检报。

二、异常现象

转报业务迁改后几天,出现杭州接收义乌机场TDM路报文时偶尔有错报产生,错报报文中出现漏字现象,对方接收杭州报文则都正常。错报产生频率不固定,有时一天几份,有时几天一份。报文漏字现象主要出现在收电地址行、发电地址行以及电报正文内容。

三、故障分析及排故

由于义乌机场业务迁改前,收发报文一直是正常状态,迁改后转报系统端口没有变化,且杭州主备转报系统均接收到错报,我们判断不太可能两套转报系统同时出现问题,我们初步判断为中间传输问题,优先对变更的传输链路进行排查。切割前后拓扑如下:

1、第一阶段排故

我们首先联系TDM厂家工程师对杭州和义乌两端接入设备AR3260配置进行检查,确认中间运营商的传输正常,但发现杭州与义乌两台TDM设备的软件版本不一致。但将两地设备版本升级一致后,经过报文测试,仍然存在同样问题。

在义乌端TDM设备上软件打环和直接在义乌端TDM设备端口处收发短接,杭州端使用仪表HCT-6000A对转报接入节点的华为路由器端口进行远端环误码测试,经过多次长时间测试显示正常无误码。但拆除仪表后直接接入转报系统,仍然存在同样问题。

2、第二阶段排故

经过第一阶段的排查,排除了中间传输的问题,由于义乌机场在迁改前后更换了端口,让对方恢复回原端口,但经过测试还是存在同样问题。而恢复回原ATM路传输,经过长时间验证,报文传输都正常,排故陷入了一个死胡同。

3、第三阶段排故

经过前两个阶段排故,排除传输链路和义乌机场原因。由于正常的报文测试需要时间较久,我们在杭州备份转报系统设置每10s定时发报,进行大报文量模拟发报测试。在设备端短接,系统接收返回的测试报文这种方式进行验证。

杭州主备两套转报系统同时收到错报,可能是共用切换器端口有问题,但更换端口后,仍存在同样问题。脱开切换器,直接在接入TDM设备线缆处做短接,仍然存在错报。排除传输设备和线缆可能后,异步单元端口处直接进行短接测试和更换不同的异步单元,仍然存在错报。

排故到这个阶段,基本确定转报软件存在问题。重头梳理整个迁改过程,发现遗漏了一个不起眼的地方,虽然迁改前后端口配置都没有改变,但速率由1200改到4800,前期排故由于设备在同一机房,距离不到10米,且更高速率的上海信道9600,报文传输都正常,我们默认4800速率不会有问题。修改速率至1200,重新测试正常。进一步测试确认4800速率就会产生漏字现象,速率1200和9600都正常。

4、第四阶段排故

根据《民用航空自动转报系统技术规范》中RS232接口速率规定,4800速率符合自动转报系统技术规范,且华东空管局其他分局站使用该系统也有4800速率,没有出现类似现象,那肯定是杭州转报系统存在与其他分局站不同的地方。

经与北京航管科技公司工程师讨论研究,对方搭建测试环境模拟杭州实际运行状态,也存在类似情况,4800速率会收到漏字的错报。对杭州转报系统再进行深度分析,最终发现杭州自动转报系统上挂接一个双套监控软件,而厂家测试转报软件中则集成了双套监控的模块,双套监控软件会每秒采集各设备状态信息。

将双套监控软件与转报系统断开,用速率4800测试,经过长时间的报文测试,未出现漏字现象,确认是转报双套监控软件导致此问题。后续经过与厂家工程师沟通,确认转报双套监控軟件对2400,4800 和115200速率都会有影响,由于此前没有用到这几个速率,虽然双套监控软件一直使用,但没有实际影响。最终确定转报双套监控软件会影响北京航管科技转报系统部分速率接收报文,导致偶发漏字情况。

总结

回顾此次排故过程,对未来维护维修工作很有借鉴意义。首先通过此次排故发现以前一直忽略的辅助软件,可能会导致相应系统一些想不到的问题,而且因为是偶发现象,很难发现,需要在使用这些辅助软件时分外小心。其次,排故过程要充分考虑变量,不能因为该变量不起眼或者不重要而忽略,这次由于传输设备和线缆都改变这个大变量在,排故思路一直围绕大变量,而速率1200和9600都是正常的,想当然默认4800肯定没问题,导致排故走了很多弯路。最后通过此次排故,发现转报系统存在的bug,通过厂家软件优化,可以为分局即将新建的转报系统运维提供了更好保障。

参考文献:

[1]《民用航空自动转报系统技术规范》

[2]《民航空管自动转报系统设备配置规范》

猜你喜欢
排故报文端口
海法新港一期自动化集装箱码头电子数据交换报文系统设计与实现
基于报文类型的限速值动态调整
一种端口故障的解决方案
AIDS系统参数在排故工作中的高效应用
基于机电设备电气控制线路排故的仿真系统设计
用户设备进行组播路径追踪的方法及系统
为程序或设备在路由器上打开端口