现代数据中心运维管理系统规划与设计

2015-06-03 12:50李瑞军吕江智霆
科技创新导报 2015年9期
关键词:数据中心运维架构

李瑞军 吕江 智霆

摘 要:近年来,随着大数据、云计算等新兴技术的飞速发展,各类信息系统对于基础设施环境的依赖和要求越来越高。在此趋势下,国内电子信息机房的建设规模和建设速度显著增加,各类型与规模的数据中心不断投入使用,因而通过对数据中心的运维体系与管理模式进行仔细研究,规划设计出合理可靠运维管理系统与运维体系框架,保障数据中心长期运行的安全与稳定,具有重要的现实意义。

关键词:数据中心 运维 管理系统 架构 设计

中图分类号:TP391 文献标识码:A 文章编号:1674-098X(2015)03(c)-0010-01

1 数据中心及其运维管理系统现状

自从1946年世界上第一台电子计算机诞生之日开始,计算机机房伴随计算机的发展已走过近70年的历程,从最初以计算为核心,逐步转变发展为计算、传输和存储全面发展,名称也逐步转变为数据中心。数据中心全生命周期从始至终分为五部分,分别是:需求分析、规划设计、施工安装、检测验收与运维管理。其中运维管理作为数据中心生命周期的末端,历时最长,其周期从交付使用开始,直至数据中心结束使用。从整体上,数据中心三成在建设,七成靠管理,通过科学管理,可以为业务提供信息系统服务、收回投资,达到预期目标。近年来,随着大数据、云计算、互联网等新兴技术的飞速发张,我国数据中心建设的步伐也在逐步加快,拒不完全统计,目前国内在建和已建成的各类电子信息系统机房或数据中心已有几十万个。

2 数据中心运维管理系统匹配设计的基本原则

规模、可用性等级、类别,分别是系统与数据中心的匹配设计的组成部分。

第一,数据中心基础设施的可用性等级的应与系统可用性设计相一致,在确立数据中心基础设施的可用性等级的基础上,运维管理系统的可用性设计等级应该与之匹配或提高。同一个数据中心中,如不同业务机房重要性有区别,则应区别设计可用性,并与之匹配等级相符的运维管理系统。第二,数据中心系统设计与数据中心类别相关,且功能与架构等方面都要进行相应的设计与匹配。因此,EDC与IDC的管理功能模块与系统设计就会产生相应的区分,这是由于两者的核心和管理重点的不同所导致。第三,运维管理系统的设计方案取决于数据中心的设计規模。运维系统的处理能力、运维监控点、运维压力这三项指标会随着数据中心规模的增大而增大。因此,总控中心系统已经成为大中型数据中心的标准配备,而对于小型机房则只需要实现基本信息采集监控功能即可。

3 数据中心运维管理系统架构设计与具体功能

数据中心组织管理架构与运维管理系统的架构设计应该具备一致性,以便充分发挥运维管理系统的信息化工具功能。为了使工作人员履行职能,在系统功能设计时必须全面周到,满足管理、维护、监控及其他操作的需要。数据中心运维管理系统设计技术点较多,包括网络通信技术、传感技术、数据库技术、工业自动控制技术、计算机软件技术等,该系统通过采集、分析、处理等操作,及时跟踪各种非智能和智能系统及设备的信息参数,获取运行状态,从而实现全面监控数据中心基础设施的目的。通过实时掌控的数据中心运行状态数据,通过对相关信息与资源进行分析并提供可能的决策建议,可以及时发现并处理故障,高效的对数据中心进行运维,保障数据中心的安全性与可用性。数据中心运维管理系统从功能结构与层次上划分为四个部分,分别是监控系统、运行管理系统、总控中心系统以及基础服务系统。

3.1 监控系统

监控系统由两大子系统组成,主要完成对基础设施的监控工作:(1)信息采集子系统。每个独立的信息采集子系统均响应上层信息处理子系统的控制命令,同时又是下层信息处理子系统的前驱系统,负责将标准格式的信息传输到下层信息处理子系统,这些信息主要包括对安防、环境、供配电等监控对象的参数、状态、设备属性、配置、数据等。(2)信息处理子系统。信息处理子系统主要完成信息的汇聚,并作相应的处理及存储。信息处理子系统数据来源于信息采集子系统,通过对数据进行处理与加工,按照告警规则产生新的告警信息,对告警信息进行分类并做过滤、关联、压缩操作,实现故障定位与数据中心的一体化监控。总控中心系统负责收集并显示重要实时监控信息,信息处理子系统存储其他数据并形成供运行管理系统调用的历史资料库,并输出统计分析报告。

3.2 运行管理系统

运行管理系统利用一体化监控系统汇聚的数据加上用户输入的一些必要的管理信息,实现数据中心运维管理、能耗管理、资产管理、容量管理等,完成数据中心运行的“故障预防性管理”、“故障恢复性管理”及旨在降低运维难度与成本,提高工作效率的日常运维工作的信息化管理,使数据中心在高效运转的同时,尽可能不发生故障或少发生故障,提高数据中心可用性,降低运行成本。

3.3 总控中心系统

总控中心又称ECC,包含展示子系统与服务台子系统两部分。(1)展示子系统。展示子系统提供监控系统、总控中心系统、运行管理系统的统一门户,提供了各种丰富的展示终端,如总控中心大屏幕系统、移动监控终端系统;提供丰富的信息展示方式与技术,如3D虚拟现实,温度场等方针组态技术等;提供丰富的报警信息输出方式,如声光、短信、电话语音等。(2)服务台子系统。运维值守与管理人员能通过服务台的各种通信方式收集记录用户使用信息,借助知识库,回复或解决用户常见问题;分发、跟踪复杂、疑难问题;通过监控展示信息,分析、发现异常运行情况,移动、跟踪处理流程,回访服务结果。电话呼入型子系统是服务台子系统的重要构建,通过其接听来电,并对来电进行自动分配,记录和存储所有来话信息。

3.4 基础服务系统

系统日志、统一权限认证、在线帮助、系统管理等都属于基础服务系统提供的功能,是为上层功能构件提供的一些公共性基础服务。

4 结语

降低运营管理成本与提高可用性是数据中心管理永恒的主题。通过数据中心运维管理系统的建设与实施,能够有效帮助管理者增强数据中心可用性、提高运维效率并降低运维成本。随着信息技术的不断发展,运维管理系统已经成为现代数据中心必不可少的信息化工具,在数据中心的运行、维护、管理等方面,不断发挥着越来越重要的作用。

参考文献

[1] 魏晓玲.银行设备管理系统的设计与实现[D].西安电子科技大学,2010.

[2] 敖翔.银行设备维护管理系统的设计与实现[D].湖南大学,2008.

[3] 张亮.基于数据仓库的银行数据提取与应用研究[D].江西师范大学,2008.

猜你喜欢
数据中心运维架构
基于FPGA的RNN硬件加速架构
酒泉云计算大数据中心
功能架构在电子电气架构开发中的应用和实践
运维技术研发决策中ITSS运维成熟度模型应用初探
民航绿色云数据中心PUE控制
LSN DCI EVPN VxLAN组网架构研究及实现
基于ITIL的运维管理创新实践浅析
基于云计算的交通运输数据中心实现与应用
一种基于FPGA+ARM架构的μPMU实现
Overlay Network技术在云计算数据中心中的应用