省级气象通信系统CTS搬迁方案设计与实施

2019-08-23 03:06乔文文黄伟郭捷孙周军
电子技术与软件工程 2019年13期
关键词:单机集群气象

文/乔文文 黄伟 郭捷 孙周军

1 概述

全国综合气象信息共享平台CIMISS(China Integrated Meteorological Information Service System)是由中国气象局主导研发的集数据收集与分发CTS(China Telecommunication System)、加工处理DPC(Data Processing Center)、存储管理SOD(Service-Oriented Database)、共 享 服 务GDS(Global Data Sharing)和业务监控MCP(Monitoring and Control Platform)于一体的综合软件,旨在解决全国的气象统一数据环境,规范化、标准化气象信息业务系统和流程。

其中数据收集与分发系统子系统CTS是广东省最主要的气象通信系统,高时效、低延时、7*24小时运行,承担全省各类气象资料的收集、业务处理、分发、补调和存档,并为CIMISS数据环境和数据中心内部业务系统提供数据和服务支撑。广东省气象通信系统CTS是各类气象观测、服务产品等数据的统一入口,它的稳定运行直接影响后续的气象业务开展。

2016年广东省气象预警信息中心机房正式启用,面临整体业务搬迁问题。数据中心遵守循序渐进的机房搬迁原则,即先易后难,先外围后核心,保证业务不中断的情况下实现业务搬迁。通信系统搬迁过程中需要停机断电,但为保证气象数据及时准确的传输并避免通信系统搬迁对其他气象业务系统造成影响,通信系统必须重建,但通信系统集群建设经费高、技术复杂,短时间内无法通过完全重建。因此对广东省气象通信业务进行了深入分析,设计基于单机临时接管的搬迁策略,实现通信系统的无中断搬迁任务,同时采用新一代国内气象通信系统作为降级备份,避免单机故障时业务中断的情况。

2 集群系统环境

广东省部署的CTS集群系统是分布式多机部署的全网系统,由4台IBM X3850X5服务器、IBM Storwize V7000、SAN交换机等组成,部署运行于Linux操作系统下,共享文件系统为赛门铁克VERITAS CFS(Cluster File System),另外CTS运行的服务器上部署了消息中间件客户端、J2EE应用中间件、FTP软件和数据库。省级CMACast小站接收服务器也接入了通信系统集群,共享磁盘阵列。

CTS负责收集全省与省际共享的观测数据、服务产品、CMACast广播数据以及部门共享数据,除将本省气象数据发送国家级CTS集群之外,会将所有收集到的数据一路添加业务规则后发送到CIMISSDPC系统进行加工入库和数据服务,同时一路发送到省内气象数据分发系统,即原新一代国内气象通信系统完成数据中心对内和对外数据支撑服务。其中,省内气象数据分发系统承担了收集CMACast广播数据、CTS推送过来的本省资料、省际共享资料和部门共享数据,并给中心其他业务系统提供数据分发工作。集群数据流程图如图1所示。

3 搬迁前的准备

3.1 单机业务流程设计

为保证数据传输的连续性和完整性,在集群关机过程中,拟构建一台CTS单机来暂时承担集群的工作。单机CTS上不安装CMACast卫星广播相关软件,由省内气象数据分发系统,即新一代国内气象通信系统将收集到的CMACast数据推送到单机CTS上,以保证CIMISS系统的数据完整性。设计单机CTS业务数据流程,如图2所示。

3.2 CTS单机构建

为了让单机能够承担数据收发工作,单机版CTS要与原集群系统的软件完全兼容,需安装SUSE Linux操作系统、VSFTPD 、MySQL、ActiveMQ、Tomcat、JDK、CTS应用程序等,主要的操作步骤和方法如下。

(1)安装操作系统SUSE Linux Enterprise Server 11,保证/home目录不小于20G,并创建/bcgz、/share等目录。

(2)为保证单机能够正常接收用户上传的气象资料,需要具备与集群系统相同的FTP用户以及权限属性。根据集群CTS的用户和组信息,编写批量创建用户的脚本,并在单机上执行,保证单机上用户和组与集群上保持一致。安装VSFTPD软件,并将集群上/etc下VSFTPD配置文件拷贝至单机相同目录下。

(3)为保证CTS单机服务器的监控网页、收发策略配置网页能够正确读取到相关配置文件,需安装5.5.35版本的MySQL,版本和集群上保持一致,将集群上的MySQL数据库进行全备份,并全部导入到单机MySQL数据库中。

(4)CTS业务运行过程中的收集分发、采集日志、日志入库、分发任务处理进程之间的信息交换基于Active MQ消息中间件进行,其中涉及到的消息队列由相关进程启动时自动创建,所以在单机CTS服务器上直接用集群上原来的安装包直接安装Active MQ并能够正常运行即可。Tomcat、JDK也直接用集群上的安装包进行安装。

(5)Rsync是一个强大的远程数据同步工具,配置并启动CTS单机和集群上任一服务器上的Rsync。CTS应用程序因已更新多次,无法使用原始的安装包安装,使用Rysnc同步集群服务上/home/cts、/bcgz/cts和/usr/local/src/apache-tomcat-6.0.29/webapps等目录下的所有文件,/bcgz/workdir下的目录结构到单机,同步时保持文件的权限、时间、软硬链接、所有者、组等信息。此次数据同步也完成了本省自研资料打包程序的部署。

(6)验 证。运 行ActiveMQ、JAVA_WEB、收发进程等,并模拟台站传输资料,查看资料的传输情况。

3.3 制定应急方案

图1:CTS集群数据传输流程

图2:CTS单机数据传输流程

在单机CTS实际运行过程中,若发现负载过重,则暂停新一代国内气象通信系统给单机推送CMACast资料,待搬迁完毕后从数据下载服务平台补调数据。

如果单机CTS出现故障,则由新一代国内气象通信系统负责收集本省观测资料、省际和部门共享数据,并将本省资料发送北京和分发中心内部业务系统。但新一代国内气象通信系统为上一代气象通信系统,无法给CIMISSDPC发送添加业务规则的数据,所以会导致CIMISS系统的缺少数据。这需要在搬迁完成后从数据下载服务平台补调数据到CTS集群。为保证新一代气象通信系统能够正常接收、上行和分发数据,需要提前配置与CTS集群系统相同的FTP用户、资料收集目录和分发主机别名策略。

4 搬迁具体实施方案

为了保障省级气象通信系统CTS的搬迁能顺利进行,搬迁后设备能正常运行,具体搬迁的实施步骤如下:

(1)利用CIMISS的负载均衡设备将CTS单机的FTP到添加到CTS服务组中,然后逐个关闭集群CTS服务节点,以便于FTP服务的平滑切换。启动单机CTS系统所有服务,包 括MySQL、VSFTPD 、ActiveMQ、Tomcat、cts_app_parallel及cts_app_ha。

(2)启用新一代国内气象通信系统将CMACast资料到CTS单机的推送配置,完成CMACast资料的接入。

(3)在VCS中下线CTS集群的各个节点,检查单机的运行情况。集群CTS服务共对外提供以下服务:CTS_MYSQL_VIP、CTS_TOMCAT_MON_VIP和CTSMQ。为避免CIMISS其他子系统与单机CTS对接修改IP地址的麻烦,将以上3个服务的IP地址绑定到单机CTS服务器,利用单机CTS提供对应的服务。利用单网卡绑定多IP地址解决CIMISS MCP与CTS之间的Web监视切换问题。

(4)硬件拆迁包括盘阵关机、主机关机、拆卸拖车、运输、硬件预警中心机房上架、硬件加电,这些操作由专业搬迁公司完成,完成后检查集群每台服务器的网络、系统及软件运行情况。

(5)集群CTS的机器启动后会自动加入集群,这时应在VCS中立马下线集群上所有应用。然后停止单机的cts_app_parallel和cts_app_ha应用,解除单机CTS上的多IP绑定,再在CIMISS负载均衡中启用CTS集群的各节点。

(6)在CIMISS负载均衡中禁用CTS单机节点,停止新一代国内气象通信系统给CTS单机的CMACast资料推送,在VCS上启动集群系统中的所有应用。

(7)启动CTS单机的cts_app_parallel、cts_app_ha应用,让积压的文件继续处理完毕。

(8)检查集群上ActiveMQ消息队列,查看MCP各类资料收发情况,查看MySQL数据库是否正常,查看服务器磁盘空间、Eimon日志等,即完成了搬迁工作。

5 总结

省级气象通信系统CTS是CIMISS的数据源头,并为众多气象业务系统提供数据服务。为保证其他气象业务系统的正常运行,省级气象通信系统的搬迁工作,要细化每一个环节,做好详细的应急准备,以保证方案的成功实施。针对广东省气象通信系统的数据传输流程,为保证气象资料的正常收发,制作了CTS单机,利用了新一代国内气象通信系统作为降级备份,设计了合理的实施步骤,从技术层面有效地保证了搬迁在2017年2月27日的顺利完成。此次搬迁工作还为以后主机实时备份和故障恢复提供了应急保障,是一次值得借鉴的经验。

猜你喜欢
单机集群气象
气象树
热连轧单机架粗轧机中间坯侧弯废钢成因及对策
《内蒙古气象》征稿简则
海上小型无人机集群的反制装备需求与应对之策研究
宇航通用单机订单式管理模式构建与实践
一种无人机集群发射回收装置的控制系统设计
大国气象
美丽的气象奇观
Python与Spark集群在收费数据分析中的应用