基于业务数据库的容灾系统应用研究

2012-11-27 08:59张顺仕窦光芒张旭
电脑知识与技术 2012年29期
关键词:灾备容灾异地

张顺仕 窦光芒 张旭

(1.安徽南瑞继远软件有限公司,安徽 合肥 230088;2.安徽省烟草公司合肥市公司,安徽 合肥 230022;3.安徽电力天长供电有限责任公司,安徽 天长 239300)

摘要: 该文阐述了省级电力信息网络系统面对灾害,为了保障全省电力信息网络业务在短时间内恢复正常运行和电力应急服务的正常开展,保障电力业务的持续性,建立远程电力信息容灾备份系统的必要性,并对容灾备份系统中的关键技术进行了分析。重点讨论了几种异地容灾技术和数据复制技术,指出了各种技术的优劣和局限,对基于数据库复制的灾难恢复技术进行了深入研究。

关键词:容灾;异地灾备;实时复制;灾难恢复;Goldengate复制

中图分类号:TP311 文献标识码:A文章编号:1009-3044(2012)29-6901-03

灾难备份是通过在异地建立和维护一个备份存储系统,利用地理上的分离来保证系统和数据对灾难性事件的抵御能力。灾难备份建设是一项周密的系统工程,也是一个全新的危机管理领域。灾难备份建设不仅需要进行灾难备份中心建设和系统设备购置。更需要有灾难备份技术、危机管理、风险管理、业务连续计划制订、灾难演练和灾难恢复等灾难备份专业领域知识。此外,灾难备份也是业务流程的延续,它需要建立完善的灾难备份中心运营管理体系,需要不断保持业务连续性计划的有效性,以保障灾难备份中心能持续发挥灾难备份功能。

按照行业通俗的说法,灾难备份从保障的层次上一般分为三个级别:数据级、应用级和业务级。应用容灾是在数据容灾的基础上,在异地建立一套完整的与本地生产系统相当的备份应用系统(可以是互为备份),在灾难情况下,远程系统迅速接管业务运行。数据容灾是抗御灾难的保障,而应用容灾则是容灾系统建设的目标,业务级则考虑到IT系统之外的业务因素,包括备用办公场所、办公人员等。本文主要探讨数据级容灾。

随着国家电网公司信息化工程和重要业务信息系统陆续完成建设和逐步投入运行,各项业务和关键数据实时在线并高度集中,系统和数据的安全已成为突出问题,灾难备份中心的建立成为应对重大灾难或者遭遇突发公共事件的重要手段。

1 数据级远程备份容灾关键技术

1.1 复制模式的“异”和“同”

灾备的实时性由数据复制模式决定,可分为同步复制和异步复制。一般而言,硬件级灾备同时可支持同步复制和异步复制,而软件级灾备只提供异步复制模式。

1)同步复制(实时灾备)

同步复制模式中,本地系统必须确认数据已成功写到异地系统,才能执行下一个 I/O 操作。同步复制可保证本地和异地的数据完全一致,达到最高的数据保护级别,尤其适合于核心和关键业务,如要求RPO/RTO接近于零的应用。

同步复制模式对网络的性能和稳定性要求较高,如高带宽和低延时,而延时又取决于距离和中间设备的协议转换时延。因此,同步复制只适用于短距离(不超过200公里)的FC-SAN灾备系统,同时须采用硬件级灾备技术。

2)异步复制(非实时容灾)

异步复制模式中,本地系统无须等待异地系统确认即可进行后续I/O处理,大幅提高了数据复制效率,但代价是异地数据和本地数据可能存在不一致。

和同步复制相比,异步复制模式大大降低了对网络性能、带宽和距离的要求。因此,不仅适用于所有的IP-SAN灾备场景,也适用于FC-SAN长距灾备场景(超过200公里)。

1.2基于存储备份容灾技术

存储系统型异地容灾备份系统就是基于存储系统(光纤磁盘阵列、NAS)进行备份容灾的模式。通过存储系统内建的固件(firmware)或操作系统,通过IP网络或DWDM、光纤通道等传输介面连结,将数据以同步或异步的方式复制到远端。

基于存储备份容灾的优点是对主机的性能影响比较小。由于运行机制大多是利用镜像(mirror)来复制数据,并能有效借助高速缓冲存储器加速I/O存取,加上存储自身具备的容错能力,大大提高了整个容灾系统的性能和可靠性。

虚拟化容灾备份系统方式是一种网络存储型远程容灾备份系统架构,是在前端应用服务器与后端存储系统之间的存储区域网络(SAN),加入一层存储网关。由于网省公司内部存储不统一,需要利用存储虚拟化技术对存储进行虚拟化,然后才能对数据进行存储复制。

1.3基于数据库备份容灾技术

数据库备份容灾产品比较多,目前市面上有代表性的有Oracle的新贵GoldenGate、DSG公司的RealSync与Quest公司的SharePlex数据库复制软件。这三种软件的原理都是一样的,都是基于数据库的日志进行复制。由于本文选用的是Goldengate软件,所以重点介绍Goldengate软件。

OracleGoldenGate(以下简称OGG)软件是一种基于日志的结构化数据复制备份软件,它通过解析源数据库在线日志或归档日志来获得数据的增量变化,再将这些变化应用到目标数据库,从而实现源数据库与目标数据库同步。因为GoldenGate在标准配置下,是通过源端抓取进程向目标端发送队列文件的方式传输数据的,但在实际应用中,会出现这么一个关于安全方面的问题:如果上级机器的安全策略不允许外网直接往里发送数据,如何进行数据同步配置?

GoldenGate提供一个由目标端主动“申请”源端进行数据传输的方式,以保证内外网不同安全域下的数据安全保障。解决方案的体系架构如下:

主要是通过目标端一个额外的alias Extract进程,实现由目标端(可信任域)主动请求、向源端(未信任域)提供数据传输的连接的过程。

2 数据级容灾技术比较

2.1 如何选择适合自己的复制方案

选择数据复制解决方案要从几方面着手:

首先,应从业务影响分析入手,来确定所需要的恢复时间目标(RTO)和恢复点目标(RPO)。

成本,不是所有的系统都有必要追求RTO和RPO的趋零,没必要高射炮打蚊子。

对于不能接受数据丢失(RTO等于零)的应用,则需要同步复制。请注意同步复制的延时,因为它将拖累应用I/O的性能。如果存在任何延时风险或不可靠的带宽,或是对于超过一定距离(50到300公里)的复制,异步复制是比较理想的选择。

除了复制模式外,应用性能也会受到复制平台的影响。基于主机的复制会与应用争夺宝贵的处理器、内存和I/O资源。用户需要了解数据复制对带宽的需求、对带宽费用的影响以及会给其它应用和用户造成什么影响,可考虑采用广域网(WAN)优化设备来保持带宽。

以下针对数据级容灾技术做了比较。

2.2 GoldenGate软件复制与存储复制技术相比

我们在最初产品和技术选型时,根据网省公司应用和数据库特点,关键业务系统数据级容灾采用Goldengate软件复制,其它业务系统数据库采用存储复制技术,另外由于业务系统的存储不统一,我们借助了存储虚拟化技术,保证异构存储环境下存储复制的顺利进行。

3 企业级数据级容灾系统技术实现

灾备中心的建设是一个系统的综合工程,企业级灾备中心需要综合考虑安全管理、制度完善、数据库管理、运维管理、存储管理等诸多方面,从而确保灾备系统的正常运行,不会因为其中任何一个环节发生问题而受到影响。我们在咨询国际一流公司后,决定采用如下的实施线路:

1)首先对各业务系统进行调研,重点调研数据库、操作系统方面的信息,并形成调研表格。

2)根据调研表格收集的信息,针对各业务系统制定详细的实施方案和应急预案。

3)做好实施前的方案评审工作。

4)充分做好实施前的准备工作,如:操作系统和数据库补丁安装,操作系统内核参数和数据库参数调整等。

5)对实施方案进行相关测试和验证工作,并做好确认工作。

6)按照既定方案实施。

4 结论

电力信息容灾备份系统的建设,能进一步提高全省信息网络系统的安全性,推进电力信息资源的整合,促进电力信息网络系统与信息共享业务的发展,为全省信息网络和部门内外的信息共享技术的研发和试验提供平台,进一步提升公共应急服务能力。

国网公司三地容灾中心的成立在很大程度上提高了公司信息系统的可用性、技术创新和业务连续性,对数据复制方法的深入研究有利于下一步应用级灾备的开展。在技术方面没有采用单一技术,而是根据生产实际的需要,根据不同应用场景灵活采用存储复制和数据库复制相结合的技术,提高了灾备系统的可靠性、安全性和连续性。

参考文献:

[1] Richard barker、Mark Erickson.企业重生-信息系统的灾难恢复[M].北京:机械工业出版社,2004.

[2] 牛云,徐庆,辛阳,数据备份与灾难恢复[M].北京:机械工业出版社,2004.

[3] 康春荣.数据安全项目案例:存储与备份SAN与NAS容错与容灾[M].北京:科学出版社,2004.

[4] 孟敬,刘寿强.银行灾难备份系统解决方案解析[J].计算机安全,2003(12).

猜你喜欢
灾备容灾异地
关于建筑企业容灾备份系统方案的探讨
基于中兴软交换的电力通信网络容灾系统建设
推进医保异地结算 稳字当先
企业级信息系统应用级灾备建设与应用
轨道交通清分系统灾备升级方案研究
如何开拓异地市场?
破除异地结算的地方抵制
应用级灾备系统的研究与设计
实施存储虚拟化及应用容灾保障医院信息系统业务连续性