李光
摘 要:本文分析了某燃机电厂T3000控制系统PDS进程发生故障,导致新开画面均为坏点,影响机组监视异常情况,并给出了处理办法,对同类型的系统有一定的借鉴意义。
关键词:T3000控制系统;PDS进程;监视异常
0 引言
某电厂建设有两台F级一拖一多轴布置的燃气-蒸汽联合循环热电联产机组。机岛设备采用上海电气电站集团引进德国西门子技术生产的SGT5-4000F(4+)型燃气轮机;汽轮机上海汽轮机厂生产的超高压、三压、再热、反动式、双缸双排汽、LZC140-13.0/1.2/555/550型抽汽凝汽式汽轮机。燃机和汽机的控制系统TCS,采用的是西门子的T3000控制系统。
1事件经过
2020年6月14日,5号机组正常运行。15:40,5号机组T3000新开的画面均显示坏点,不能正常监视,维护人员检查发现PDS进程故障,16:50,完成处理,系统恢复正常。
2检查处理
2.1 15:50,维护人员现场检查情况如下:
(1)T3000报警信息为:“Connection to PDS lost!”,即PDS服务进程故障。
(2)5号机组T3000系统的交换机、服务器运行状态、所有操作员站运行状态正常。
(3)进入服务器桌面,检查T3000所有进程和硬件运行状态也全部显示为正常,其中PDS服务进程PDS-§-1400,也处于RUNNING状态。与(1)的报警存在冲突的地方,不能确定系统故障的原因。
2.2 机组处于高负荷运行状态,AGC投入,虽然已开的画面仍然能够显示机组的状态,但新开画面已不能监视,存在很大的安全隐患。为进一步确认故障原因,加快问题处理,立即联系西门子厂家咨询。
2.3 按照厂家意见检查历史曲线正常,检查服务器运行正常,检查逻辑运行正常。厂家根据检查情况,结合以往案例的经验,判断故障原因确为PDS(Plant Display Server)进程卡死。
2.4 处理方法:除工程师站外,所有T3000人机接口退出T3000系统;重启PDS进程,所有T3000人机接口重新开启软件客户端并登陆。
2.5 16:50分,T3000所有画面恢复正常。
3原因分析
3.1 T3000系统检查,历史曲线正常,服务器运行正常,逻辑运行正常。
3.2 日志文件检查,结果如下:
服务器冗余运行无报错;
操作系统正常运行,无异常记录;
PDS日志文件显示内存溢出(OutOfMemoryError),记录如下:
2020-06-14 15:38:32,357 WARN [READ-THREAD-SUBSCRIBER(0)[5]]com.pg.orion.basic.connect.ReadFromSocketThread -Exception in
run() of ReadFromSocketThreadjava.lang.OutOfMemoryError: Java heap space
log4j:ERROR No appenders could be found for category (com.pg.orion.basic.config.Configuration).
log4j:ERROR Please initialize the log4j system properly.
Exception in thread "RenewLeaseThread - //127.0.0.1:1099/monitor/ServiceFactory/EventManager#ORIGINAL"
Java.lang.OutOfMemoryError: Java heap space
3.3 因此T3000画面显示程序PDS服务进程故障的原因是内存溢出(OutOfMemoryError)。
3.4 PDS進程作用为在工作站上进行画面数据显示,不影响服务器和下层网络、DPU内逻辑的正常运行。因此故障期间只影响画面显示,未影响到机组运行。
3.5 目前PDS的内存分配设置为226MB,而5号机组共有4个工作站(两台工程师站,两台操作员站),目前每台工作站可以打开10个画面,如果长时间同时打开过多的画面,会大量占用PDS的内存,有一定概率导致内存溢出,发生故障。
3.6 综上,本次事件的原因为:长时间同时打开画面过多,PDS内存溢出,服务进程故障,新开画面失去监视。
4改进措施
4.1减少每台操作终端打开画面的个数,根据厂家建议,结合公司实际使用情况,限制每台操作终端最多能打开5幅画面。
4.2 加强工程师站T3000系统画面管理:工作结束后,及时关闭打开的画面。
4.3 利用机组检修的机会,完成如下优化措施:
(1)增加T3000画面显示程序PDS的内存分配,从目前226MB增加至380MB。
(2)对T3000系统软硬件进行隐患排查,安装T3000软件补丁,提高系统运行稳定性。将目前的T3000版本为07.1.11.11,升级至最新版本07.1.11.29。
(3)每年检修检修期间,T3000系统的维护时,将重启T3000服务器软硬件列为必做项目。
4.4 加强热控专业人员技术培训,深入的学习T3000控制系统原理及问题分析,提高T3000系统故障处理能力。
5结语
目前电厂的自动化水平日益提高,对控制系统得可靠性及运行维护人员的技术水平也提出了很高的要求,在做好日常检查维护的同时,良好的工作习惯,合适的参数设置,高效的故障处理能力,也是保证机组安全的重要条件。
参考文献:
[1]肖丽.西门子T3000型汽轮机组自启动控制步序解析[J].设备管理与维修,2018.
[2]韩翔.T3000系统在火电厂西门子汽轮机控制中的应用[J].热力透平,2012,41(3):236-239.
[3]郑玲红. 1000MW超超临界二次再热机组T3000系统应用分析[J]. 电力科技与环保, 2018, 34(06):22-25.