高校数据中心容灾技术的探讨

2015-12-02 02:59宋文功蒋新华
关键词:灾备容灾备份

宋文功, 蒋新华

(中南大学信息中心,长沙 410083)

0 引 言

随着高等院校的应用不断发展,其数据中心可能是个私有云架构,整个学校信息化建设对数据保护和系统可用性有更高的需求,建设一套高性能、高安全性、可靠性、可扩展性、可管理性的数据保护系统成为了高校数据中心及其重要应用信息化建设的当务之急.

1 概 述

1.1 数据级容灾

数据级容灾系统只保证数据的完整性、可靠性和安全性[1].衡量容灾系统的技术指标主要有两个:RPO(恢复点目标)和RTO(恢复时间目标),RPO表示灾难发生时允许丢失的数据量,RTO表示系统的恢复时间[2].也就是对RPO有要求,对RTO基本不要求.对于数据级的应用容灾技术主要是备份.对于有远距离校区的高校,由于要将数据备份到远距离的容灾中心,中间的链路带宽一般是低带宽的,当数据量较大时,要求传输的数据量要少.现在成熟的新的备份技术是重复数据删除[3]技术.该技术可以用较小的链路带宽来完成远程备份.

1.2 应用级容灾

应用级容灾[1]系统能够提供不间断的应用服务,让服务请求能够透明地继续运行,保证数据中心提供的服务完整、可靠、安全.对于学校中的一些重要应用,如校园网主页,不仅对RPO有要求,而且还对RTO有较高要求.这样,只做数据级备份,已经无法满足生产的要求.对于这些应用,要做应用级容灾.应用级容灾包含有同城容灾和异地容灾两种.

1.3 双活

当有的学校应用对学校工作影响非常大,要求RPO和RTO都为零时,如校园一卡通应用,生产中心和容灾中心的双活[4]情况就应运而生.

双活是指生产中心和灾备中心之间并没有明确的主备之分,每个中心都有生产、互为灾备的任务.其具备以下4大优势.

一是实现最高级别的可用性.双活中心[4]可以实现数据零丢失、实时切换.

二是提高设备利用率.双活中心不再设置专用的灾备资源,不同中心的资源同时承担生产和灾备.

三是保障运维资源的灾备接管能力.由于日常双活中心的运维资源都在进行工作,当一个中心发生灾难时,其他中心所有的流程、职责、设备资源、系统资源都不需做大的改动即可接管,只是运维工作量有所增加.

四是双活中心的技术要求高.传统模式一般只做数据层面的同步、异步复制,在其他技术层面不需要互联太多,而双活中心要求在信息系统的各个层面都要紧密互联、互动.还要求双中心间的链路带宽有充分保障.

2 容灾技术

实现数据级容灾[5]的主要技术有虚拟带库和重复数据删除;虚拟带库是磁盘阵列硬件设备,但是在软件功能上却模拟磁带备份的形式.虚拟磁带库主要有以下几点优势.

(1)相对于机械磁带,虚拟磁带库使用了兼容磁带备份管理软件以及传统备份流程,这使得设备的可用性以及备份的可靠性得到了大幅提升;

(2)性能大幅提高,可支持接近磁盘阵列极限速度的备份以及恢复速度.而且免疫病毒,数据安全性等同普通磁带库;

(3)恢复工作极为简便,如果所需数据存在VTL当中,则不会涉及任何机械工作,恢复工作就像磁盘备份的速度一样;

(4)虚拟磁带库采用基于RAID保护的磁盘阵列,从而将备份的可靠性较常规磁带备份提高了若干量级.封闭式结构的磁盘介质本身的MTBF(平均无故障间隔)一般为开放式结构磁带介质的5倍以上;

(5)兼容性好,标准的FC、SCSI或iSCSI接口设备,兼容流行的主机设备和操作系统;

(6)实用性好,与现有磁带库应用方式一致,不用更改现有存储应用软件的管理策略,保护用户投资;

(7)虚拟磁带库用电子化的“机械手”和“磁带驱动器”,代替了机械磁带库中裸露、易损的装置,基于RAID保护的磁盘阵列具备降级工作能力,且具自动报警和在线热恢复能力.

从以上虚拟磁带库的优势可以看出,虚拟磁带库不仅解决了传统磁带库维护负担高、备份失效率高以及备份恢复能力不佳的问题,而且也改变了磁盘备份容易被误删除或被病毒感染以及不便于在SAN环境中统一管理和优化使用的劣势.

重复数据删除一种数据缩减技术,通常用于基于磁盘的备份系统,旨在减少存储系统中使用的存储容量.它的工作方式是在某个时间周期内查找不同文件中不同位置的重复可变大小数据块.重复的数据块用指示符取代.高度冗余的数据集(例如备份数据)从数据重复删除技术的获益极大;用户可以实现10∶1至50∶1的缩减比.重复数据删除技术可以允许用户的不同中心之间进行高效,经济的备份数据复制.

实现应用级容灾的主要技术有集群技术[1]和CDP(持续数据保护)[1]技术.对于异地容灾,采用低带宽就能实现的CDP技术较为普遍.在低带宽的环境里,精简复制技术(Microscan)将传输的最小数据单元缩小到512字节(一般的软件级别技术在1个block4 096字节,硬件级别技术在block16 000字节),可以在极小的带宽传输较大的数据量.CDP自动连续快照技术,可以快速恢复当前及历史数据.可以大大降低系统恢复生产的时间.连续I/O记录技术可以将数据恢复到任意历史轨迹(秒级和I/O级均可).数据一致性保证技术在指定的快照点和复制点产生数据库的校验点刷新,从而确保数据库日志与数据文件的一致性,实现快速启动数据库的目标.这些技术可以使远程容灾中心可以满足的RPO和RTO做到相对小的程度.

如果要做到RPO和RTO为零,就要采用两中心双活的方式.实现生产中心和容灾中心双活,要实现完备的双活架构,需要在信息系统的各个层面进行双活设计.我们将数据中心的信息系统技术架构分为7层:访问接入层、Web层、应用层、数据库层、系统平台层、存储层、网络层.

为满足双活中心的需求,访问接入层必须使客户端的请求在多个中心之间进行智能选择,实现业务的连续性(性能最优/故障切换/按需连接).实现站点选择通常有两种方式:一是传统站点轮询技术;二是站点负载均衡技术.

Web/应用层双活实现机制主要有3种:一是基于主机集群技术;二是基于中间件软件自身集群实现功能;三是基于负载均衡设备方式.

数据库层的双活技术主要有两种:一是数据库集群技术;二是数据库复制技术.

操作系统层的双活技术已经较为成熟,可以采用HA和集群技术进行实现.目前虚拟机的相关技术有比较大的发展,可以充分利用新的漂移、灾备切换等技术进行操作系统层的双活部署.

存储双活实现机制主要有4种:一是基于主机卷复制技术;二是基于存储虚拟化技术;三是基于存储复制技术;四是基于SAN网络复制技术.

双活模式下的网络互联既需要保证IP网络的高可用性,又要保证能够满足既定双活要求:如果大量使用虚拟化的漂移等技术,需要双活中心间网络大二层互通;对于高校,不同校区间一般是同城部署光纤通道,保证数据同步;要求实现IP网络高速互通,保证不同数据中心间的双活和数据复制.以下是某高校拟建的双活数据中心的拓扑图:

图1 双活数据中心容灾系统拓扑图

3 结束语

高校数据中心容灾技术的采纳,是一个需要经过数据保护效果,和实现该效果的经济代价之间平衡的考量.当应用需要有不间断工作的要求时,双活中心是考虑的重点;当有一定的RPO和RTO的要求时,应用级容灾是考虑的重点.而数据级容灾是数据高可用的最后一道防线,它只能满足数据丢失、数据破坏时的数据恢复目的,不能提供实时的业务接管功能.选择适合自身发展的架构和技术需要根据实际情况进行全面分析.此外,建设容灾数据中心,技术仅仅是其中的一个方面,在服务、管理、流程、人才培养等方面都需要做大量的研究和部署工作;另外一个重要方面是应用改造,存在的困难较多,也给研究者和建设者带来诸多挑战.

[1] 李春晟.数据中心灾备系统的分类[J].智能建筑与城市信息,2010(11):31-33.

[2] 王德军,王丽娜.容灾系统研究[J].计算机工程,2005,31(6):43-45,113.

[3] 杨天明.网络备份中重复数据删除技术研究[J].华中科技大学学报,2011(7):47-49.

[4] 肖良华.云数据中心双活技术浅析[J].金融电子化,2012(2):59-61.

[5] 黄大川.数据中心容灾架构的两种新方案[J].中国金融电脑,2013(10):88-88.

猜你喜欢
灾备容灾备份
“备份”25年:邓清明圆梦
VSAT卫星通信备份技术研究
创建vSphere 备份任务
高速公路收费中心容灾备份系统建设方案分析
关于建筑企业容灾备份系统方案的探讨
基于中兴软交换的电力通信网络容灾系统建设
旧瓶装新酒天宫二号从备份变实验室
企业级信息系统应用级灾备建设与应用
轨道交通清分系统灾备升级方案研究
基于数据容灾技术在企业信息系统中的应用研究