提升传输系统故障工单压缩比

2017-10-24 03:27许云飞
科技与创新 2017年20期
关键词:压缩比工单系统故障

许云飞

(中移铁通吉林分公司,吉林 长春 130012)

提升传输系统故障工单压缩比

许云飞

(中移铁通吉林分公司,吉林 长春 130012)

随着传输系统故障集中化管理的不断推进,如何提升传输系统故障工单压缩比,从而提升传输维护人员故障处理的效率,这成为了传输故障集中化管理的第一课题。提升传输系统故障工单压缩比是传输系统集中化故障管理的关键因素,主要论述通过对传输系统的告警进行统计和分析,制订了方案,以提升传输系统故障工单压缩比。

闭环处理;故障工单;传输系统;维护系统

2013年,吉林移动全面推进集中化故障管理改革,全部传输系统告警由省网管中心监控室以故障工单形式派发至各地市一线维护班组进行闭环处理。随着传输系统故障集中化管理的不断推进,如何提升传输系统故障工单压缩比,从而提升传输维护人员故障处理的效率,成为了传输故障集中化管理的第一课题。

1 名词解释

告警(Alarm),是指对于网络设备、系统资源等出现异常的情况进行报告。故障工单是吉林移动特有的办公自动化系统之一,主要辅助维护人员对故障、投诉的闭环处理。

传输系统故障工单压缩比的计算方式为:(传输系统告警触发工单数-实际派发传输故障工单数)/传输系统告警触发工单数。

2 影响传输故障工单压缩比原因分析

2016年,平均每月传输系统告警触发工单数为35 151.90个、实际派发传输故障工单数为22 670.40个,传输系统故障工单压缩比为35.58%.

通过《电子运行维护系统》采集数据分析的方法,对影响我省传输系统故障工单压缩比的因素进行统计,影响因素所占比例依次为:电力原因占30.76%、光缆故障占18.80%、用户原因占18%、无效告警占17.3%、工程割接占8.16%、人为原因占3.13%、支撑手段不到位占2.81%、其他原因占1.04%.最终定位影响传输系统故障工单压缩比的主要原因为电力原因、光缆故障、用户原因、无效告警。通过数据统计,实现传输、动环专业跨专业成功率为20%,成功率较低,确定缺少跨专业派单规则是电力原因影响工单压缩比的主要原因。经统计,传输专业故障工单中,同一故障导致工单关联率低于20%,确定缺少智能衍生规则是光缆故障影响工单压缩比的要因。经确认发现,80%的故障工单为用户侧断电引起的无效工单,有效工单占20%.按照日粒度统计传输现网告警统计结果发现,四维告警所占比例均大于50%,确定四维告警所占比例大是无效告警影响工单压缩比的主要原因。

3 实施对策

3.1 制订跨专业关联规则

由于电力原因造成传输线路上报大量告警,产生了大量传输故障工单。因此,小组编写了跨专业告警关联规则,将动环、传输专业的不同告警有机联系在一起,并关联生成一张根源工单,通过省内动环、传输专业告警资源来搭建跨专业告警关联派单模型,有效提升了跨专业告警关联故障定位的准确性、及时性。

电力停电因素导致的月均工单量为6 974张,实施跨专业关联规则的手段以后,工单量减少至3 843张,工单量大幅度压缩,传输故障工单压缩比由35.58%提升至44.41%.

3.2 制订智能衍生规则

当传输线路中断时,除了产生主要告警外,还会产生大量衍生告警,产生大量故障工单,影响了传输工单压缩比。因此,应制订传输环一点中断衍生规则、传输同环多网元中断衍生规则。规则上线前,因光缆故障因素导致的月均工单量为4 262张,实施智能衍生规则手段以后,工单量减少至2 288张,工单量得到大幅度压缩,传输系统故障工单压缩比由44.41%提升至50.25%.

3.3 增加家宽关联告警字段

原有的家宽告警标准化字段缺少故障设备与场景、小区、用户的关联信息,工单只能体现出故障网元的类型、端口、板卡等一些基本信息,维护人员无法从故障工单中判断出设备场景、用户类型及影响范围等关键信息,且用户侧断电导致PON口类大量工单的派发,维护人员难以判定导致PON口故障的真实原因,耗费了大量的人力、物力来判断故障产生的真实原因,导致一线维护工作量大,影响了维护人员对重点区域、重点故障的快速响应。

通过对工单的分类分析,由于小区停电、用户侧断电导致的PON口中断类工单占55%以上。针对这一现状,小组成员重点对PON口中断类故障进行了深入分析发现,对判断PON口中断类故障有效的关键字段为“告警原因”“附加信息”。引起PON口中断的原因为小区停电、光缆中断等。因此,对不同因素导致的PON口故障进行了分类处理。

规则原理为:利用ONU掉线前回传给OLT其下线原因的能力,判断PON口中断的根本原因,PON专业网管通过“告警原因”“附加信息”字段呈现出来,故障管理系统通过对该字段的自动解析,抑制由于用户侧断电类故障产生的工单。上述措施实施前,因用户侧因素导致的月均工单量为4 080张,实施增加家宽关联告警字段手段以后,工单量减少至1 810张,工单量得到大幅度压缩,铁通代维故障工单压缩比由50.25%提升至56.71%.

3.4 解决大比例四维告警

告警是判断网络是否异常的重要标准,每日大量的过量、过频、过长、过短告警存在于网络中,甚至个别网元每日会产生超过千条的告警,大量工单堆积,难于判断出根本原因,导致传输工单量飙升,造成传输网络存在大量的安全隐患不能被及时处理。通过分析四维告警、数据统计、分析定位、处理建议等措施,实现了故障定位,进而提高了人工预处理的效率,保障了网络的健康、稳定运行。对全省传输网络过频告警top3告警及网元进行了统计,传输PTN网络中的ETH_LOS告警量尤为突出,小组成员通过对告警产生的原因分析,提出了合理化的解决方案,具体如图1所示。

对传输网络中过长、过短告警及网元进行了统计,查找到了主要原因,并制定了解决方案,如图2所示。

按照统计传输现网告警,小组经过告警溯源分析,确定了产生过量、过频、过长、过短告警的原因,对各地市进行了告警跟踪,通过维护人员进站维修、屏蔽无效告警、规范流程等,告警整治工作效果显著。上述措施实施前,因无效告警因素导致的月均工单量为3 923张,实施策略后,告警量及工单量得到大幅度缩减,工单量下降至2 288张,传输系统故障工单压缩比由56.71%提升至61.36%.

图1 合理化的解决方案

图2 解决方案

4 结束语

在实施完所有措施后,对工单压缩比进行了检查,针对2017-01—2017-03传输故障工单压缩比进行了统计,电力原因所占比例由30.76%下降至28.29%、光缆故障所占比例由18.80%下降至16.28%、用户原因所占比例由18%下降至13.33%、无效告警所占比例由17.3%下降至16.84%,故障工单压缩比从35.58%提升至61.36%.

通过采取对策,降低了无效告警量,减少了无效工单的派发,为传输维护工作节约了大量的人力、物力成本,提升了故障处理效率及维护成本。

U284.92

A

10.15913/j.cnki.kjycx.2017.20.107

2095-6835(2017)20-0107-02

〔编辑:张思楠〕

猜你喜欢
压缩比工单系统故障
某型水泵旋转系统故障分析
高压缩比射流点火天然气发动机燃烧及排放特性
高职院校计算机类专业“工单制”教学的研究与探索
基于RPA技术的机器人在配网调度工单发布工作中的应用
VC-Turbo超变擎300
可变压缩比技术在车用发动机上的应用浅析(一)
压雪机液压系统故障分析及诊断技术研究
基于分布式数据库Cedar的高效工单管理系统设计与实现
人工智能新探索 打造银行智能工单
小电流接地系统故障定位技术研究