一种大型数据中心基础设施综合管理系统的设计与实现

2014-11-06 03:18潘宗霞
机电工程技术 2014年7期
关键词:数据中心基础设施管理系统

潘宗霞

(深圳中兴网信科技有限公司,广东深圳 518057)

0 前言

数据中心起源于20世纪60年代,发展至今,数据中心先后经历了计算中心、信息中心和服务中心的三个发展阶段[1]。信息服务的集约化、社会化和专业化发展使得因特网上的应用、计算和存储资源向数据中心迁移[2]。随着云计算和移动互联网的快速发展,数据中心作为核心服务载体,需要稳定可靠的运行环境,及时发现事故隐患,增强事故处理能力,优化资源利用率[3]。所以有必要建立一套完善、智能、可靠的综合管理系统,对数据中心的环境进行集中监控、统一管理,真正做到实时化、智能化、网络化。

数据中心综合管理系统的范围可涵盖物理基础设施和IT资产管理、业务运营等所有功能模块[4]。但在实际应用中,因基础设施和IT架构、运营通常是不同专业团队运作维护,且交叉较少,两大功能模块的相对独立部署更有利于简化系统、增加可靠性,因此本文仅讨论基础设施部分的管理系统。

1 需求分析

基础设施综合管理系统是对数据中心的各类动力设备、机房环境实施集中监控管理的系统,通过遥测、遥信、遥控、遥调,实时监视动力设备和机房环境的运行状态,记录和处理相关数据,通过智能分析预防故障、快速排障,提高系统的可靠性及数据中心设备的安全性。

本论文引用项目的基本情况是:建筑面积共计14 340平方米,其中包括室外场地1 910平方米(室外油机房820平方米、室外地下水池220平方米、冷却机组占地860平方米、室外储油罐10平方米)。数据中心共规划60个微模块,900个服务器机柜,平均每机柜6.5 kW。综合管理系统需监控的设备和系统如表1所示。

表1 数据中心监控管理对象及测点举例

2 综合管理系统设计

2.1 系统概述

基于上述需求分析,数据中心基础设施管理系统采用动环视频一体化监控的解决方案,在动环监控量的采集和视频信号的采集上做到功能互通,在传输上采用一体化组网,在监控中心也采用同一平台进行动环和视频的管理,实现数据中心基础设施的综合管理。

该方案依托IP网络,采用分布式部署的系统架构,可以实现对机房内所有环境设备的统一集中全方位监控管理,提供美观友好的监控管理、查询界面,受控设备若出现异常情况,系统即自动通过网络,通过声光、短信、电话、语音、桌面、邮件等方式及时报警,并直观地锁定异常或故障部位,确保机房管理维护人员第一时间掌握机房的异常状态,及时启动应急预案,迅速排除故障,确保系统的可靠运行。

2.2 系统结构

基础设施综合管理系统采用分布式架构,监控平台采用标准接口,可灵活扩容和增加系统,提供双机热备以保障高可靠运行,现场处理单元采用嵌入式设备,避免机械故障。管理系统逻辑上包括信息采集子系统和信息管理子系统。系统结构参见图1。

信息采集子系统主要包括监控主机及末端信息采集设备。每台监控主机提供12路AI/DI通用采集通道、2路DI通道、4路专用通道、4路数字控制量输出DO通道;通用AI/DI或DI通道可连接各种传感器,如压差传感器、水浸传感器等,专用通道可直接测量温度、电池总电压以及烟雾告警,DO通道可以通过相关控制器对设备进行控制,如非智能空调开关、照明开关等设备。主机具备6路智能协议转换口,在同一时间段可以对多个智能设备进行监控,本项目中智能电量仪、高压直流系统、UPS、空调、门禁系统等都将连接到监控主机的智能接口。在主通讯接口方面,监控主机提供2个IP接口,同时内置有HUB,既可通过IP接口进行上行通讯,也可通过IP接口接入智能设备或视频设备;另外,监控主机可提供1个RS232接口作为主通讯串口。

信息管理子系统即监控中心,由安防台、前置台、业务台、报表台、数据库服务器、安防应用服务器、动环应用服务器、大屏幕、多媒体交换单元、网络接入设备或监视器等设备构成。监控中心使用局域网,采用TCP/IP协议,此技术手段符合工信部关于本地网网管和监控系统的技术要求,且容易实现与其他监控系统的相互联接。

2.3 信息管理子系统设计

信息管理子系统各设备功能介绍如下。

(1)数据库服务器:用以存放系统监控的所有数据,其中包括各监控量的历史数据、报警阀值、报警记录、安全及操作员权限管理信息、配置信息、操作维护记录等。数据库可以响应各业务台发出的请求(如读出、查询、写入等操作),在执行请求的过程中各业务台以客户端的方式访问数据库服务器中的数据,此方式在很大程度上提升了数据库处理数据的速度。在同一时间段允许多个客户进行访问,实现了数据库的实时性。同时,该数据库还具有文件存档功能,文件存档以后可以在硬盘上保存一年,还可以导入其他存储设备(如:磁带等)进行存储。

图1 基础设施综合管理系统结构

(2)动环应用服务器:用以集中监控中心所有服务软件模块,并完成该监控系统的所有应用服务功能,例如:数据转发、用户鉴权、数据库存储和备份、系统管理、WEB服务等。

(3)业务台:用以提供用户界面并实现多种用户交互的监控功能,包括监控数据的实时显示、报警信息的显示和处理、报警过滤和屏蔽的设置、监控量属性修改、历史数据的查询、遥控功能、生成统计报表、查询和打印报表、以及其他定制监控功能的实现。根据系统规模可以设置多个业务台,根据不同属性的登录用户,业务台可以具有不同的监控范围和操作权限。此外,可以通过远程接入的方式设置具有与位于监控中心的业务台相同功能的反拉终端或者远程分控台。

(4)报表台:用以提供报表操作界面并支持对历史监控数据的查询,提供系统各设备报警统计报表或图表(包括曲线图、直方图、饼图)的导出等服务,实现各种报表的生成、查询和打印等功能。

(5)前置台:用以交替访问各监控数据,对数据进行处理后发送到节点台、业务台和数据库,并接收从监控中心发出的命令请求,根据地址将各命令请求转发至各监控端局,对端局设备进行查询、控制或调节。同时,前置台还支持N+1备份功能。

(6)中心接入设备:根据不同的组网方式和传输资源选择不同的网络接入设备,进行不同接口之间的数据转换,最终将监控数据送至局域网上的前置台。

(7)安防应用服务器:该服务器是视频一体化和安防一体化监控系统的数据中心,为智能门禁、出入管理、基站防盗等子功能提供数据中心的各项服务,并提供各视频监控设备的接入、各媒体信息的接收、转发和存储等功能。

(8)安防台:作为视频一体化和安防一体化监控系统的客户端,提供门禁控制、出入管理、防盗报警管理等安防管理功能,以及摄像机控制、视频浏览、录像回放等视频监控功能。

3 综合管理系统实现

本项目采用中兴通讯自主研发的数据中心综合管理系统DcNumen 3000,实现了以下功能:

(1)实时监控及界面显示;

(2)告警管理;

(3)报表管理;

(4)PUE计算与测量;

(5)配置管理;

(6)安全机制;

(7)视频管理;

(8)门禁管理;

(9)互联互通。

综合管理系统从使用者的角度考虑,操作简单、维护方便。用户只需有一定的计算机基础,对用户的编程技能没有要求,只需要进行少量培训即可熟练的使用该管理软件。该系统还设有智能容错机制,用以防止用户因操作失误而导致的系统失控,通过该机制可以导入系统原来的设置使系统恢复到发生错误操作之前的状态,这在一定程度上降低了对维护人员专业技能的要求,使系统更易于维护与管理。

数据中心作为能源密集型产业,能耗成本和碳排放是评估数据中心等级的关键指标。综合管理系统实时显示PUE值,结构化方式显示各设备的能耗,分项、分类、分区域计量,直观定位问题点,有效改善了高能耗、低效率的弊端。

4 结束语

本系统采用分布式结构,各组件功能清晰,全面监测数据中心动力设备、机房环境、安全、消防等基础设施,有效预防故障,稳定可靠地支撑用户的业务和发展。PUE数据的实时显示对能耗管理和绿色环保具有积极意义。

[1]余侃.云计算时代的数据中心建设与发展[J].信息通信,2011(6):100-102.

[2]魏祥麟,陈鸣,范建华,等.数据中心网络的体系结构[J].软件学报,2013,24(2):295-316.

[3]邓维,廖小飞,金海.基于虚拟机的数据中心能耗管理机制[J].中兴通讯技术,2012,18(4):15-18.

[4]王聪,王翠荣,王兴伟,等.面向云计算的数据中心网络体系结构设计[J].计算机研究与发展,2012,49(2):286-293.

猜你喜欢
数据中心基础设施管理系统
酒泉云计算大数据中心
农业基础设施建设有望加速
基于James的院内邮件管理系统的实现
公募基础设施REITs与股票的比较
浅析数据中心空调节能发展趋势
基于LED联动显示的违停管理系统
振动搅拌,基础设施耐久性的保障
海盾压载水管理系统
充分挖掘基础设施建设发展潜力
基于云计算的交通运输数据中心实现与应用