电能监测系统业务数据指标自动化运维工具研究

2018-09-14 02:27国网湖南信通公司易衍孜
大众用电 2018年2期
关键词:电能运维监控

● 国网湖南信通公司 易衍孜 黄 威 刘 星 凌 笑

1 电能质量在线监测系统应用现状

电能质量在线监测系统(以下简称“电能监测系统”)是一套具有数据采集管理、电能质量指标在线统计、电能质量指标在线分析、电网安全风险在线分析,以及质量监督管理等模块功能的电力信息化系统。电能监测系统的数据及时率和完整率不仅依赖于自身系统可靠性,而且依赖于PMS2.0供电电压、OMS、用电采集、数据中心等其它对侧系统是否及时传入数据以及传入数据是否完整。目前对业务指标的监控和运维,仅仅采用人工每日监测的方法进行,即一旦发现横向或者纵向业务数据传输不及时或者不完整,只能靠人工进行问题分析、排查、重新采集和补录。这种人工的运维方法不仅耗费大量人力物力,而且传输链路长,排查和分析耗时久,难以满足系统业务实时需求,直接影响电能监测系统传输及时率考核情况以及湖南省电力有限公司运营情况。因此,亟需开发一套面向电能监测系统的业务数据指标自动化运维工具,以保证系统数据传输的及时性。

2 业务数据运维相关研究

尽管目前惠普、南瑞以及Ansible等众多软件商都开发了一系列的软件部署、服务应用监控、主机监控、网络设备监控、网络连通性监控、网络访问质量监控、分布式系统监控、报警预设、监控图形化与历史数据等。但是,这些工具对于系统之间业务数据通道传输缺乏有效监控、智能化排错判断以及自动化修复等智能功能。例如,惠普公司的SciteScope监控软件虽然能够通过监控系统数据库中表格数据,判断系统间数据是否及时接入,但是不能实时判断数据是否传输接入,且无法监控和判断整条数据传输链路是哪个地方出现了问题,这样一来即使监控发现数据未及时接入,也需要逐个进行原因排查,并重新人工补传数据。因此,当前的自动化运维工具无法满足电能监测系统对于业务数据传输实时性监控和业务数据运维智能化的需求,这些工具在业务数据运维方面判断仍处在半人工、半自动的状态。

3 业务数据指标自动化运维工具设计

针对目前电能监测系统的业务数据传输运维技术的不足,本文提出一种面向电能监测系统的业务数据指标自动化运维工具,通过实时监控电能监测系统接入数据表、中转层系统情况,预警业务数据的指标情况,智能化判断电能监测系统的业务数据传输不及时原因并做出自动化操作。

3.1 体系结构

如图1所示,面向电能监测系统的业务数据指标自动化运维工具由业务指标监控部分和告警智能诊断维护两部分组成,其中:业务指标监控部分包括数据传输监测模块和消息通知模块;告警智能诊断部分包括智能决策模块和自动维护模块。

图1 体系架构图

数据传输监测模块定时自动检查数据是否及时完整地接入电能监测系统,以及根据告警智能诊断部分的判断,按需自动监测中转层数据(即数据中心系统、供电电压系统数据)是否接入电能监测系统运行情况。消息通知模块根据告警智能诊断部分的需求以及告警信息,将信息以短信方式通知运维人员。

智能决策模块根据电能监测系统数据告警情况以及系统运行或者中转层数据监控信息,做出相应的判断,触发自动维护模块和消息通知模块。自动维护模块根据智能决策模块指示,进行电能监测系统重启或者数据重新抽取,同时,将运维操作信息传输给消息通知模块。

3.2 功能模块设计

数据传输监测模块包括自主监测模块和按需监测模块。自主监测模块根据电能系统的数据接入规则,定时自动检查数据是否及时完整地接入电能系统,若出现不及时或不完整情况,触发智能决策模块和消息通知模块。按需监测模块按智能决策模块的指示,按需自动监测中转系统的数据是否接入或者电能系统运行情况,并将结果发给智能决策模块。

消息通知模块包括消息触发器、消息池模块和短信消息发送模块。消息触发器接收到智能决策模块、自动维护模块、自主监测模块传来的消息,编辑成短信,加入到消息池模块。消息池模块采用队列结构,缓存即将发送的短信。短信消息发送模块从消息池模块取出短信,调用短信平台服务webservices接口,发送短信给电能系统运维人员。

智能决策模块包括指令收发模块、决策控制模块和知识库模块。指令收发模块一方面接收来自自主监测模块或者按需监测模块的消息,发送给决策控制模块,另一方面,接收决策控制模块操作指令,将指令传输给自动维护模块。决策控制模块根据数据告警情况或者系统运行情况,启动知识库模块获取相应的知识,做出操作指令。知识库模块存储电能系统的运维知识,根据决策控制模块要求,给出相应的运维知识判断,反馈给决策控制模块。

自动维护模块包括系统运行维护模块和数据补传触发器。系统运行维护模块若接收到指令收发模块的重启系统指令,则自动重启电能系统,并调用按需监测模块监控电能系统恢复情况,然后按需触发数据补传触发器。数据补传触发器若接收到指令收发模块的指示,则按需自动补传数据;若接收到系统运行维护模块消息,则全部重新抽取数据到电能系统。

4 业务数据指标自动化运维工具实现

将本工具部署在一台虚拟机服务器上,实时监控系统数据集成、传输情况,根据告警情况,做出相应运维操作。根据电能监测系统集成规则,数据指标考核分成小时级指标、日级指标,因此,该工具也分为小时级数据监控和日级监控数据2组,进行电能系统的相关数据表接入监控。同时,由于电能系统一方面将通过数据中心集成源数据端OMS、用电采集系统侧数据,另一方面,通过webservices方式集成供电电压系统数据,所以自动化运维工具将按需监控与电能系统相关数据表数据接入情况,或按需监控源端供电电压系统FTP服务器上是否存放了当天需传入到电能系统的数据。

面向电能监测系统的自动化运维工具业务指标定时监控部分数据采集信息:每小时15分定时监测电能系统数据库中是否接入来自OMS系统的电网电压数据和电网频率数据;每天18:00定时监测电能系统数据库中是否接入来自PMS2.0系统和OMS2.0系统的设备台账数据;每天凌晨4:00定时监测电能系统数据库中是否接入来自供电电压系统和用电采集系统的数据。业务指标监控部分一旦发现数据传输不及时或者不完整,则将数据指标告警信息传给位于自动化运维工具的告警智能诊断维护部分,并以短信的方式告知电能系统运维人员。告警智能诊断维护部分结合日常运维信息,将传来数据指标告警信息进行智能判断分析,确定下一步分析策略,由此,按需调用业务指标监控部分获取的监控诊断信息,即包含当前系统运行情况或数据中心是否接入源端数据或供电电压系统是否采集到数据。接下来,根据业务指标监控部分反馈的监控诊断信息和数据指标告警信息,告警智能诊断维护部分智能排查告警原因后进行自动化操作,并以短信方式通知相应运维人员。如果原因是电能系统宕机,则自动重启电能系统,全部重新抽取;如果原因是电能系统从数据中心集成通道问题,则将自动发短信给通道运维人员,同时全部重新抽取数据;如果原因是源端系统问题,则自动发短信给源端系统运维人员,当源端系统数据恢复后,自动抽取缺失的数据。

5 结束语

面向电能质量在线监测系统的业务数据指标自动化运维工具采用监控和诊断维护两部分交互结构,共同完成运维操作。该工具实现了业务指标自动化运维,保证了业务数据传输接入的及时性、完整性。与现有技术相比,该工具可智能化判断系统的业务数据传输不及时原因并做出自动化操作,全程无需人工参与,提高了业务指标运维的高效性和智能化水平,最大程度地减轻了运维工作量。

猜你喜欢
电能运维监控
The Great Barrier Reef shows coral comeback
苹果皮可以产生电能
电能的生产和运输
运维技术研发决策中ITSS运维成熟度模型应用初探
你被监控了吗?
海风吹来的电能
Zabbix在ATS系统集中监控中的应用
风电运维困局
澎湃电能 助力“四大攻坚”
杂乱无章的光伏运维 百亿市场如何成长