铁路视频运维管理系统设计与实现

2022-02-11 07:04徐亚萍
铁路通信信号工程技术 2022年1期
关键词:网管运维管理系统

徐亚萍

(通号通信信息集团有限公司,北京 100070)

1 铁路视频监控系统运维现状及需求

2020年4月20日,中华人民共和国国家发展和改革委员会首次明确“新基建”范围,城际高速铁路占据“第三位”。视频运维管理系统应用互联网、大数据等技术,实现铁路视频监控的智能运维,是对铁路视频从传统基础设施向智能交通基础设施转型升级的响应。

铁路综合视频监控系统监控范围广,全路摄像机的接入容量已达到十几万路的规模,需要用户全天候监控,因此对运维监控的需求愈加强烈。现有运维平台包括视频图像质量诊断系统、视频专业网管系统,分别对视频图像质量评估和视频软硬件设备实时监控。但在现场运维过程中还存在以下4类问题。

1) 视频图像质量系统:算法太专业难理解、算法准确性不高;

2) 视频专业网管系统:优秀的底层开源框架设备监控,多渠道采集丰富的视频监控系统软硬件设备数据,并实现了可视化的监控数据展示,但存在数据简单堆叠呈现、故障无法定位并全周期跟踪的问题;

3) 未与生产管理相结合:系统对故障未提供流程化处理,故障工单派发处于手工纸质模式;

4) 缺乏指导分析决策:系统缺乏存储容量预测,无法通过系统决定相关的资源是否进行扩充,相应的业务部署是否需要调整。

同时,现场运维过程中还存在旺盛的考核评估需求:视频图像质量诊断系统已经成熟应用于铁路总公司,视频质量运用情况已经作为铁路部门的考核依据。更细化的考核手段将是用户深层次的需求:运维人员考核、系统厂商质量评价、设备厂商质量评价。

针对以上问题及需求,如图1所示构建集实时监控、质量评估、生产管理、分析决策、考核评估于一体的视频运维管理系统是本文的主要研究内容。

图1 视频运维管理系统思路Fig.1 Conceptual framework of video operation and maintenance management system

2 设计实现

铁路视频运维管理系统,覆盖设备层、实时分析层、平台层和应用层,如图2所示实现从底层运行支撑到上层业务运行的一体化运维管理。

图2 视频运维管理系统架构Fig.2 Video operation and maintenance management system architecture

2.1 设备层

铁路视频运维系统通过IPMI、SNMP、zabbix agent、铁标视频数据等接口,获取设备信息;将收集的数据进行数据处理:监控数据接入、接入适配、数据收敛;通过数据访问总线(MQ、TCP等接口)将数据信息推送实时分析层进行图像诊断、故障定位等;实时分析层产生的数据或服务支持引擎向上支撑应用层的用户业务功能。

1)数据采集

支持多协议采集,兼容性强,实现软硬件资源的整合共享与统一管理,将满足摄像机、服务器、交换机、存储设备、电源控制箱等基础硬件以及视频系统等应用服务的监控需求,如图3所示。平台 提 供 了 支 持 SNMP、IPMI、HTTP、TELNET、zabbix agent等多种协议的数据采集方式。

图3 数据采集Fig.3 Data acquisition

2)数据监控

网管数据监控设备及其监控项如表1所示。

表1 数据监控设备及监控项Tab.1 Data monitoring devices and items

2.2 实时分析层

1)实时监控

对系统监控对象进行资源入库管理及监控项管理,监控项需进行告警规则配置,如表2所示。

表2 告警规则配置Tab.2 Alarm rule configuration

2)图像诊断

融入深度学习技术,提高准确率,将视频丢失、亮度异常、偏色、对比度异常、雪花、模糊等作为不同的图像种类,设计卷积神经网络,将输入图像输入网络后,进行图像的质量判断;增加场景变更算法,利用深度学习的图像相似性进行判断;建立图像质量诊断库,进行算法的优化和评估。

抽象业务诊断算法,提高用户交互友好性,满足业务需要。

3)故障定位

通过数据分析,对图像质量诊断的诊断结果和网管告警信息进行故障关联,确定引起视频故障的原因,自动定位故障位置。第一类故障:无法获取实时视频图像故障。第二类故障:录像断点故障。录像出现断点时段内是否存在摄像机离线、服务离线、云存储异常等告警,进一步分析路线断点的根本原因是哪类故障造成的。

4)工单处理

智能故障定位的结果,自动生成工单,按照工区派发下去,运维人员解决故障并反馈归档,形成故障闭环管理,如图4所示(产生故障→报警→定位故障→确认形成工单→下派工区→解决故障→ 故障处理反馈)。

图4 工单处理流程Fig.4 Work order processing flow chart

5)预警分析

基于设备健康评估体系,为各种类型设备建立健康模型及适配算法,实现设备健康评估及趋势预测,整个存储容量的趋势分析,通过采集模块获取状态信息,设置阈值,系统预测模块可预测存储状态达到预测的时间,并上报用户提示用户扩容。实现预警分析,指导用户决策。

2.3 平台层

根据实时分析层不同模块的组合,按需分配给用户开放不同的产品形态,网管用户分配实时监控权限,向上提供实时监控应用;图诊用户分配图像诊断权限,向上提供质量评估应用;结合多模块故障定位、工单处理和预警分析模块向上支撑生产管理、分析决策和考核评估就是整体的视频运维管理系统。

3 系统部署方案

系统采用分布式部署方案,如图5所示。

图5 分布式部署方案Fig.5 Distributed deployment scheme

视频运维管理系统以核心和区域两级分布式部署,区域zabbix proxy可以代替zabbix server检查客户端的情况,将数据暂时保存在本地,之后统一发给server,减轻server的负担。

4 应用案例

目前,视频运维管理系统暂未在现场应用,与之相关的视频图像质量诊断系统及视频专业网管系统已成熟应用在现场。

1)视频图像质量诊断系统

如图6所示,图诊系统能够有效地对视频图像出现的视频丢失、偏色、亮度异常、视频图像对比度低等低质视频以及常见摄像机故障问题进行诊断,有效预防因硬件问题导致的图像质量低下所带来的损失并已应用至以下场景。

图6 视频图像质量诊断系统应用Fig.6 Application of video image quality diagnosis system

核心节点:国铁集团。

区域节点:北京局、武汉局、济南局、南昌局、广州局、兰州局、青藏公司、郑州局应急指挥中心。

线路节点:京沪高铁、京沈高铁、海南东环线、深茂线、广大线、昌赣线、杭黄线、青连铁路、京张高铁。

2)视频专业网管系统

如图7所示,网管系统可将服务器、交换机、摄像机、视频系统、存储容量等视频软硬件数据集中起来,实现资源的整合共享与统一管理。应用场景:京张铁路。

图7 视频专业网管系统应用Fig.7 Application of video network management system

5 展望

未来的视频监控系统,建立以业务为导向的一体化运维平台,充分利用大数据,以业务应用为中心,实现用户体验良好、高可用的实时监测和智能故障诊断,提供全局性、高效健壮、标准规范、自动化的监控解决方案并加以实现。

猜你喜欢
网管运维管理系统
基于大数据分析的智慧高速运营管理系统
基于大数据分析的智慧高速运营管理系统
基于James的院内邮件管理系统的实现
在线评审管理系统的建设与实践
SDN 网络管理关键技术应用分析与改进思路
基于GPS的电力运维轨迹定位系统
IT运维管理系统的设计及应用
北京市中小学网管教师培训需求研究
计算机网络管理维护探析
电子政务甲方运维管理的全生命周期