医疗行业信息系统文件备份与恢复的分析

2020-10-20 04:48元溢凌庞子轩韩俗
医学信息 2020年17期
关键词:数据恢复信息化平台数据备份

元溢凌 庞子轩 韩俗

摘要:随着信息技术的快速发展,国内越来越多的医院正加速实施基于信息化平台、HIS系统等的整体建设,以提高医院的服务水平与核心竞争力。本文基于四川大学华西第四医院数据备份系统设计的实际案例,通过对数据备份策略进行分析,推荐备份策略,并介绍一款开源的跨平台网络备份工具bacula,提供基于企业级的C/S的备份解决方案,另基于Windows平台搭建rsync同步工具,提供实时同步重要文件数据的基础,为医疗行业信息系统建设提供参考。

关键词:数据备份;数据恢复;信息化平台

中图分类号:TP399                                文献标识码:B                                   DOI:10.3969/j.issn.1006-1959.2020.17.003

文章编号:1006-1959(2020)17-0010-05

Abstract:With the rapid development of information technology, more and more hospitals in China are accelerating the implementation of overall construction based on information platforms and HIS systems to improve the service level and core competitiveness of hospitals. Based on the actual case of the data backup system design of West China Fourth Hospital of Sichuan University, this paper analyzes the data backup strategy, recommends the backup strategy, and introduces an open source cross-platform network backup tool bacula, which provides enterprise-level C/S Backup solution, and build an rsync synchronization tool based on the Windows platform to provide a basis for real-time synchronization of important file data, and provide a reference for the construction of information systems in the medical industry.

Key words:Data backup;Data recovery;Information platform

随着计算机的普及和信息技术的进步,数据安全的重要性日趋明显,尤其在医疗行业,不仅要求数据的完整性,还要求数据的时效性,任何人为错误、硬盘损坏、电脑病毒、断电或是自然灾害等都有可能造成数据的丢失,只有进行了必要和科学的备份,在数据资源系统发生损毁丢失后才能够提供恢复的依据,而合理的备份策略是简捷、有效地恢复整个数据的基础[1]。华西第四医院经过数年的信息化建设,HIS、PACS、LIS、EMR、HERP等各种信息系统陆续上线,数据体量不断增加,大量重要数据以多种形式分布于不同的信息系统之中,这些数据可分为两大类,分别为基于数据库管理系统的数据和基于文件的数据。本文主要针对文件类型的数据备份与数据恢复进行分析,以期为医疗信息化建设中的数據安全提供一个应用层面的解决方案。

1备份方式

1.1完全备份  完全备份是对所有数据元素的备份,是任何备份的起点,增量备份和差异备份都是以完全备份作为参照的。特点是备份的数据大部分都是重复的,会占用大量的存储空间,在拷贝期间,为了保证数据的完整性和一致性,不可以对原文件进行写操作。备份所需时间最长但恢复较容易,只需最近的一次备份[2]。

1.2增量备份  由于完全备份存在数据冗余缺点,如果每次都进行完整的数据备份,备份恢复将耗费大量时间,而且需要为进行数据备份而专门停止业务服务。与完全备份相比,增量备份只备份与完全备份相比较增加或被修改的部分,这种方法使用的存储空间少,所需的时间短[3]。

1.3差异备份  差异备份可以看作是完全备份和增量备份的折中方案,它针对上一次成功的完全备份,仅对完全备份以后发生变化的数据进行备份。比起增量备份,差异备份速度更快,所需的存储设备少,缺点是需要更多存储空间和更长的时间[4]。

1.4安全有效的备份策略  由于完全备份、增量备份、差异备份各有优缺点,一般采用3种备份方式协作的工作模式来部署备份计划,从时间点A完成一次完全备份,在经历相对较长的一段时间后,在时间点E再完成第2次完全备份。为了保证两次完全备份之间不产生相对较多的增量备份,在增量备份达到一定数量时完成一次差异备份[5]。这样的备份模式兼顾备份的有效性、系统的可用性,占用的计算资源又相对较少,且恢复数据的方式相对简单,还可以将数据恢复至任意的备份时间点[6],见图1。

2搭建Bacula备份系统

以Bacula为工具,在网络中搭建备份服务器,完成Windows 32、Windows 64、Linux系统下的文件定时备份,并恢复备份的数据。

2.1 Bacula介绍  Bacula是一款可媲美商业备份软件的开源跨平台备份软件,它采用模块化设计,基于C/S架构,可以将多台服务器中的数据备份到任意一个或多个远程主机上[6]。Bacula由Director Daemon(DIR)、Storage Daemon(SD)、File Daemon(FD)、Console(管理控制台)、Monitor(进程监控端)等5个部分组成[7]。

2.2环境介绍  在医院内网搭建一台Centos6.8安装bacula-7.0.4,作为备份的服务器端。体检登记电脑的D盘存储着体检人员的照片文件;病案扫描服务器上的E盘保存着病案扫描文件;内网Nagios服务器/usr/local/nagios/etc/目录下保存着监控的配置文件。在这些服务器上部署bacula-fd,将以上目录中的文件定期备份到Bacula服务器上,见图2。

2.3 DIR配置  DIR端的配置文件默认存储在/usr/local/bacula/etc/bacula-dir.conf中。理解配置文件bacula-dir.conf是从Job对象的定义开始的,每个备份任务都会对应到一个Job的定义。由于多个Job可能会有一定的共性,可以将具有共性的Job属性定义成一个JobDefs对象,供Job调用。在Job的定义中,主要涉及备份的FD、计划任务、存储等相关信息的定义,而这些信息的定义,一般通过Client、FileSet、Schedule、Storage、Pool、Message等对象定义,其详细信息见表1。

2.3.1 Client的定义   Client是定义需要备份的目录,本实验环境中见图3。图中省略了Password属性的配置,每个Client里面Password的配置要和对应的FD。

2.3.2 FileSet的定義  FileSet是定义需要备份的目录,体检登记的XP系统备份D盘,病案扫描Win2008R2服务器备份E盘,Centos备份nagios配置目录,具体配置见图4。

2.3.3 Schedule的定义  本实验环境中定义在每周五的1点5分执行完全备份,每天晚上0点进行差异备份、每个小时增量备份,具体配置见图5。

2.3.4 Storage的定义  Storage定义备份文件存储的SD信息,即将备份的文件写入SD,具体Storage配置见图6。

2.3.5 Pool的定义  Pool定义备份文件存储格式、大小、任务容量、回收属性等,具体配置见图7。

2.3.6定义Restore任务  对于linux、windows不同的平台,由于路径方式的不同,需要定义不同的恢复任务,这里分别配置Windows平台的恢复目录为E:/baculaRestoreDir。Linux系统恢复目录为/tmp/bacula-restores,具体配置见图8。

2.4 SD配置  SD主要是bacula备份架构中存储端配置,是定义备份数据存储相关信息的配置。将对应Device对象的Archive Device属性修改为想要保存的目录即可,其他配置不变,SD端的配置文件默 认存储在/usr/local/bacula/etc/bacula-sd.conf中,  本案例中保存到/home/bacula-data目录,具体配  置见图9。

2.5 FD配置

2.5.1 Win32XP-FD、Win2008-FD的配置  Windows系统运行安装程序过程中配置DIR端信息见图10。这里的“DIR Name”,需填写对应DIR服务器的Name属性值;“DIR Password”的值,需填写对应DIR服务器的Password属性值;“DIR Address”填写Bacula服务器地址为172.16.0.167。

2.5.2 Centos6.8-FD配置  配置Director对象,Name和DIR端一致,Password和DIR端的对应Client一致,具体配置见图11。定义本地运行端口等信息见图12。

2.6 bconsole的使用  bconsole是控制dir客户端的bacula工具,可以通过这个控制台连接到Director Daemon进行管理备份与恢复操作,bconsole常用功能,见表2。

2.7手动恢复  根据备份策略的不同,数据恢复的方式有所差别。对于完全备份,需在原有系统重新搭建后,将备份作业对应目录中最新生成的备份文件恢复到原有系统;对于差异备份,需要首先恢复最后一次的完全备份作业产生的数据,再恢复最后一次的差异备份产生的备份数据;而增量备份需要在恢复最后一次完全备份的基础上,恢复该完全备份后所产生的每一次的备份文件[8]。由于Windows权限的关系,Bacula在Windows系统上恢复数据时,需要先创建恢复目录,首先在bconsole下查询对应FD备份任务运行的任务号,bconsole手动恢复命令为:bcosole->status->3->[对应FD],XP备份任务列表见图13,恢复job选择操作见图14。然后,根据备份策略恢复数据的方法为:使用最后一次备份、最后一次差异备份、差异备份之后的所有增量备份。启动恢复任务,手动输入所有备份任务列表:“34,159,160...196”,然后“mark *”选中所有文件;“done”确认执行;选择恢复任务Job;选择需要恢复到的FD实例,待恢复任务结束,在XP主机的E:/baculaRestoreDir目录下查找恢复的数据。

3 rsync同步工具

rsvnc是remote synchronize的缩写,意为远程同步,是Unix系统下的一个开源的、以增量的方式快速、方便地使一个文件系统与另一个文件系统保持同步更新的数据备份工具[9]。它能快速同步两处计算机的文件和目录,主要原理是计算和传输文件中差异部分[10]。

3.1环境介绍  病案服务器是一台MSSQL数据库服务器,MSSQL创建了自动备份任务,备份的文件在E:\baSQLdataBackup下。为保证数据的实时同步,利用sysnc将E:\baSQLdataBackup下的数据实时同步到172.16.0.166主机的E:\17216250目录下,见图15。

3.2服务器端配置  服务器端配置文件位于"C:\Program Files (x86)\ICW\rsyncd"目录,可在Windows服务管理器中启动和停止RsyncServer服务。

3.3同步的客户端  客户端的同步是通过如下命令完成,--port=28950指定服务器端监听端口号,-vzrtopg和--progress显示同步过程详细信息,--delete指从客户端目录中删除与服务端目录中不同的數据,保证两边数据完全一致,baSQLbackup 为服务器端的定义的同步实例,/cygdrive/e/17216250是指定同步到的本机E:\17216250的目录。

4总结

本研究基于Bacula备份和rsync同步的设计方案,使用组合备份策略,能够在最大程度上保证数据的安全性,主要适用于实时备份外的一种补充备份方案,目前在实际运用在应用软件备份、配置备份、图片影像备份、数据库文件备份、内外网指定文件同步等,长时间运行稳定,为文件型数据安全增添一份保障,供医疗信息化建设的同行们参考。

参考文献:

[1]徐子娟.档案部门数据备份问题[J].兰台世界,2018(10):83-86.

[2]同方知网(北京)技术有限公司.一种面向文件目录的完全和增量的备份恢复方法:CN201910767887.X[P].2019-11-19.

[3]耿倩.一种数据冗余增量备份方法探索[J].中国金融电脑,2015(9):49-54.

[4]李帅,刘晓洁,徐兵.一种基于目录哈希树的磁盘数据同步方法研究[J].信息网络安全,2019(2):53-59.

[5]叶爱兵,张明,沈维幸.Bacula备份系统在高校多业务系统中的应用研究[J].华东师范大学学报(自然科学版),2015(z1):293-297.

[6]周立剑,郭立群.论数据备份的控制点[J].信息系统工程,2019(10):131-132.

[7]张鹏.企业数据集中备份与恢复平台搭建与应用实践[J]. 信息与电脑(理论版),2018(12):9-12..

[8]张旭明,李曼丽,赵永平,等.航天信息化数据集中备份管理平台研究[J].航天制造技术,2017(4):60-65.

[9]宾璐.基于RSYNC实现TeamCenter系统文件数据迁移[J].技术与市场,2019,26(7):171.

[10]郑轲,董睿.基于Rsync算法的预测性改进[J].信息通信,2015(5):56.

收稿日期:2020-04-02;修回日期:2020-05-27

编辑/杜帆

猜你喜欢
数据恢复信息化平台数据备份
泉州高速公路收费系统远程数据备份研究
海洋数据备份平台的设计和实现
No.4 IDC:2019年上半年数据备份与恢复市场同比增长10.0%
体验设计导入校园网人事管理信息化平台建设之初探
信息化建设下多媒体教室管理的新模式初探