国家级自动站故障率及相关影响因素分析与研究

2022-11-16 12:44何瑶黄玲
科学与信息化 2022年21期
关键词:可用性台站江西省

何瑶 黄玲

江西省大气探测技术中心 江西 南昌 330096

引言

随着气象观测业务经历几十年的发展,气象观测业务稳定运行,观测新技术新方法不断突破发展,但是,气象观测业务仍然存在管理制度不健全、不规范、制度执行不到位、监督考查制度不健全等问题[1]。江西省气象局为第一批气象观测质量体系推广建设单位,2019年11月顺利通过ISO9001质量管理体系初次认证,江西省气象局组织相关人员对涉及本单位的管理过程、业务过程、支撑过程体系文件进行梳理,编制了江西省气象观测质量管理体系的相关程序文件[2]。目前,我省气象观测业务已于2019年整体通过ISO9001认证,体系在省、市、县各级气象部门运行。2020年气象观测自动化改革正式运行后,自动气象站观测逐步取代了人工观测,已成为地基观测系统的重要组成部分[3]。综合气象观测系统运行监控平台(以下简称ASOM)于2016年正式在江西省业务运行,本文以ASOM平台监控江西省93套国家级自动站上传报文为基础,分析ASOM平台生成的可用性评估报告及台站填报的维修表单,着重研究在质量管理体系运行条件下,江西省国家气象观测站运维制度化对自动站故障修复率产生的影响,并提出可行性建议。

1 江西省气象观测质量管理体系

1.1 江西省气象观测质量管理体系介绍

我省质量管理体系建设是基于ISO9001的管理框架,通过梳理、完善和优化质量管理工作,建立一整套关于气象观测质量管理的方法论,让观测质量工作按照这套标准的程序和方法统一执行。在建立、实施质量管理体系时采用过程方法,以用户需求和用户需求变化作为质量管理的出发点和终点,并不断通过反馈互动,检查改进质量管理体系,最终实现用户满意。

1.2 观测设备维护维修控制程序相关规定

根据江西省气象局制定的“JX36-Y-QP-08观测设备维护控制程序”中规定:台站需依据规范、制度和设备的相关技术说明定期做好国家级自动站的日常维护工作,在维护结束后,在ASOM上填写设备维护单。

2020年江西省地面气象观测自动化改革正式运行以来,台站取消了人工定时观测工作,新增本站观测场地、气象业务设备、支撑保障设备、信息网络系统及辖区内其他观测设施的运行保障工作。“JX36-Y-QP-09观测设备维修控制程序”中明确,台站业务人员在收到省级监控部门设备故障告警信息后,需立即到观测现场确认故障现象、原因并开展维修工作。

维修结束后,需及时通过江西省运行监控业务系统(简称ASOM2.0)填报的单据,该单据内容包括故障开始、结束时间,各级故障维修过程,维修人员信息,更换备件情况等。

2 自动站运行情况分析

随着地面气象观测自动化进程的推进,基层台站观测员需要熟练掌握仪器维护,对仪器故障能迅速做出判断[4],以每月的自动站业务可用性报告为基础,结合故障单进行总结分析,不仅可以使台站技术人员不断积累维修经验,提高维修技术水平,缩短故障修复时间,还可为自动站故障原因分析提供依据,发现导致故障发生的诱因,提高日常维护质量,从而不断提高自动站的可靠性[5]。

2.1 国家级自动站业务可用性考核指标

依据中国气象局预报与网络司《全国地面自动站实时观测资料质量评估办法》(气预函〔2014〕23号)的要求,计算全国地面自动站(包括区域自动站)逐小时观测资料质量检验指标[6]。国家级自动站业务可用性[7]:

其中,应工作时次为国家级自动站每小时一份报文,一天应为24份;未到报时次为在应工作时次内缺少报文的时次;数据错误时次为在应工作时次内上传数据报文中未通过数据质量检查的时次;格式错误时次为在应工作时次内上传数据报文不符合编码规则,无法解析入库的时次[8]。

2.2 国家自动站近5年运行情况

自动站观测设备维护管理与技术保障工作在气象业务中起着至关重要的作用,设备的稳定运行直接关系到气象观测业务、气象预报以及其他各类气象业务的顺利开展[9]。自动站由软件和硬件两部分组成,软件包括业务软件和嵌入式软件,硬件包括采集器、传感器、外围设备和外部总线[10]。分析2016年至2020年故障单情况分析得知,2016年因雷击造成的设备故障共16起,占总故障的22.5%;设备自身故障共28起,占总故障39.4%;软件及供电和通信网络等故障27起,占比38%。2017年因雷击造成的设备故障共16起,占总故障的22.5%;设备自身故障共20起,占总故障28.2%;软件及供电和通信网络等故障35起,占比49.3%。2018年因雷击造成的设备故障共13起,占总故障的21.3%;设备自身故障共25起,占总故障41%;软件及供电和通信网络等故障23起,占比36%。2019年因雷击造成的设备故障共8起,占总故障的10.9%;设备自身故障共25起,占总故障34.2%;软件及供电和通信网络等故障40起,占比54.8%。2020年因雷击造成的设备故障共20起,占总故障的15.3%;设备自身故障共43起,占总故障32.8%;软件及供电和通信网络等故障67起,占比51.1%。

表1 2016-2020年设备故障原因

2.3 近五年来业务可用性情况分析

从图2-图4可看出,2016年至2019年国家级自动站的业务可用性得到了大幅度提升,虽然2019年至2020年业务可用性略有下降,但质量管理体系认证通过以来,通过观测设备维修控制程序的制订,故障单数量从2016年的几十条提升到2020年的上百条,12小时故障修复率也得到了大幅度的提升,24小时及以上的故障修复率大幅度减少,大部分故障在12小时内得到了修复。可以看出故障修复率得到了明显的提高。

通过上述分析可以得出以下结论:

2.3.1 除设备的自然损坏情况以外,软件问题、供电及网络故障约占故障总量的50%。多个台站多次出现计算机蓝屏、自动重启及软件部分功能无法正常使用的现象,有可能是由于电脑配置不够或杀毒软件误杀程序造成。平时除做好设备的日常维护外,电脑、网络、电缆、观测场环境的维护都是重要的环节。

2.3.2 雷击造成的设备故障仍旧占据不小的份量。因此,加强自动站的防雷措施是提高自动站运行效能的重要措施之一。

2.3.3 24h及以上的故障修复率造成的主要原因是等待备件。需建立合理的省、市、县三级备件库,进一步提高维修保障时效。

2.3.4 推进观测业务质量管理体系建设以后,填报故障单数量在逐年增加,故障修复时间在逐步减少。

2.3.5 需制定更加完善的设备故障应急预案以及设备日常维护维修工作制度。

3 结束语

我省于2019年通过观测质量管理体系建设,93个国家气象站全部通过ISO9001认证,并持续运行至今。近2年故障数量上升并非观测质量管理体系本身不好,恰恰相反,发现了许多过去没有注意的问题,使得许多隐患得以暴露,并及时处理。得益于体系有效运行,大大提高了故障修复效率,并从根本解决了同一问题的反复出现、修复、再出现、再修复问题。

同时我们也要看到江西省的观测质量管理体系虽然已完成搭建,但是运行过程中仍有不少问题,体系的可操作性仍有很大的提升空间,需要不断改进和完善;体系自身的完善仍是一项长期而艰巨的任务,仍需不断的宣贯,强化质量管理理念。

为全面实现观测自动化和全面深化气象改革,各台站除做好仪器备份,电力保障,通讯保障,安全防护等基础工作外,还需加强总结能力、分析能力,不断提高设备维修能力。市级省级除做好设备故障监测告警外,还须承担对设备故障维修的指导工作,并督促台站做好单据填报以及提高归纳总结能力。

猜你喜欢
可用性台站江西省
模拟成真
核电站DCS可用性测试应用研究
基于ETL技术的台站信息同步应用研究
面向移动应用的软件可用性研究综述
地震台站基础信息完善及应用分析
一种适用于高铁沿线的多台站快速地震预警方法
《江西省志•审计志》顺利通过验收
机构知识库网站可用性评价指标的计量学分析
考了个大的
一种具备干扰台站剔除的多台站定位方法