对电子化归档全流程管理的若干认识

2018-01-23 22:04王肖波浙江省档案局
浙江档案 2018年4期
关键词:档案局信息系统

王肖波/浙江省档案局

“增量电子化”工作是今后档案工作发展的重点,其目的是使档案馆新接收进馆的档案全部为电子档案,以实现电子(数字)档案资源建设的总目标。因此,有必要对电子文件形成、收集、积累、鉴定、归档到电子档案移交、存储、利用、备份等实行全过程管理,确保归档的电子文件收集齐全、整理有序、命名科学、格式规范、元数据合理有效。笔者试从电子文件归档的角度,结合电子文件归档的工作实践,谈谈对电子化归档全流程管理的认识。

1 对电子文件归档紧迫性的认识

一是电子数据比信息系统更有价值。电子文件归档系统是信息系统的有机组成部分,然而目前大多数信息系统缺少这项功能,就算有也与《电子档案移交与接收办法》的要求相距甚远。如果信息系统中的电子文件不按照电子档案长久保存的要求进行整理归档,日后将无法按照档案移交接收的要求进行导出迁移,电子数据的安全也无法保证,今后如遇信息系统升级、平台改造或者数据迁移时,极易造成珍贵数据丢失或历史记忆断层。有观点认为,各业务系统中所有电子文件资料和过程结果信息在系统中都可以查询、检索、展示,所以只要备份好或以数据库形式归档保存就行。但备份并不等于归档,信息系统如不具备电子文件(业务数据)定期在线或离线的归档功能,没有电子档案的长久保存措施,可能会出现数据安全风险。笔者认为,一定要按照归档要求,将信息系统中的电子文件进行有序化和系统化处理,组织整理导出(脱离)原有信息系统进行归档。一定要从档案资源建设与信息安全的双重角度,对电子文件和电子档案进行科学管理和控制。

二是以事件为单位进行归档。目前对“关系数据库+附件”类型信息系统的电子文件进行归档,主要思路有两种,一是以信息系统数据库为归档对象,按照《档案关系型数据库转换为XML文件的技术规范》(DA/T 57-2014)进行整库归档,笔者认为这样的方式并不利于电子档案的管理与有效利用;二是以信息系统所处理的事件为对象,以事件为单位组织电子文件归档保存。浙江省档案局经过调研并考虑无纸化电子文件归档与管理的需要,选取第二种思路。以2014年6月25日浙江省正式开通的浙江政务服务网为例,该网实现省市县统一架构、三级联动并覆盖全省,总计收纳省市县三级3300余个政府部门、6万余项行政审批事项,基本实现了权力事项集中进驻、网上服务集中提供、数据资源集中共享。截至2018年3月,汇聚的办件已超4200万件。随着行政审批办件越来越多,系统数据库越来越庞大,完成行政审批电子文件归档任务也越来越急迫。2016年,浙江政务服务网行政审批电子文件归档列入省政府下达给省档案局的重点工作内容,并列入对各厅局的考核。浙江省档案局在多方研讨后将行政审批以事项为单位,按“一事一卷”进行电子文件组卷,提出浙江政务服务网行政审批电子文件一般以办理事项为单位,按“一事一卷”原则整理归档,内容包括该件审批事项的基本信息描述、办理流程和相应的申请、受理、办理、办结、送达等环节的所有电子文件,也包括各种表、证、单、书等文本、数据材料及图像、音频、视频等多媒体材料。事先由各厅局准确界定电子文件的归档范围并划分保管期限,设定正确的归档路线和技术规范标准,开发统建模式电子文件归档系统(归档模块),电子文件归档功能设计在行政审批事项办理完毕之后的办结操作环节,办理人员可以使用“办结并归档”的“一键归档”模式。该功能隐式地设计在原先审批环节的办结操作之中,预先设置好档号自动生成规则、电子文件归档范围和分类排序、保管期限判定等,事件办理完毕后由审批办理人员将审批事项电子文件直接进行归档,自动完成归档电子文件整理、归档数据打包,系统会及时捕获电子文件归档形成电子档案。目前该网已成功归档行政审批原生电子档案65万多件(卷)。

三是明确电子档案的结构组成。电子文件归档时“一事一卷”的“卷”在逻辑结构上指一个归档文件夹,文件夹内存放该行政审批基本信息描述、办理流程、存档信息以及申请、受理、办理、办结、送达等环节的所有材料(.xml、.jpg、.pdf等各种格式),包括各种表、证、单、书及其他附件材料。文件夹(电子档案卷)以室编电子档号命名,档号命名规则为:全宗号(或部门权力代码)—权力事项类型代码—权力事项大类代码—权力事项小类代码—年度—保管期限—事件流水号。归档文件夹内的各种电子归档文件要求能够在脱机状态下正确地读取与打开,数据格式以政务服务网上保存的原始文件格式为准。《档案关系型数据库转换为XML文件的技术规范》(DA/T 57—2014)指出:为实现档案信息的格式开放、不绑定软硬件、文件自包含、格式自描述、持续可解释和可转换,应将档案关系型数据库转换为XML文件进行存储。档案关系型数据库转换为一组XML文件,数据库的用户、角色、权限、数据表结构、数据表关系、视图、存储过程、约束、索引、触发器等元数据信息存储在一个XML文件中,数据库每个数据表的数据分别存储在不同的XML文件中。

四是电子文件的归档和电子档案的管理是一个横跨两个信息系统的工作。各单位在信息系统建设中总是以解决各自专业业务工作需求为导向,目标是业务系统建成上线并能正常运行,不会主动考虑电子文件的科学归档。同时由于档案部门对各个系统无法进行深入了解,缺少技术上可操作性的指导,导致上述要求中的很多内容很难被具体执行与操作。过多地收集软件型号、名称、版本号和相关参数手册、说明资料并归档,经常让信息化工作人员、软件开发技术人员一头雾水,导致电子文件归档一拖再拖,这个现象是普遍存在的。数字档案资源建设是数字档案馆建设的核心内容,包括电子文件接收、传统载体档案数字化、资源整理加工和建立数字档案资源库[1]。档案馆究竟是接收电子档案还是电子文件,这在一系列文件和规范中并没有予以明确,实际工作中大家都各执己见,也没有形成统一思想。笔者认为,档案馆的职能是收集、保存和利用电子档案,而档案局的职能则是制订电子文件归档软件的技术要求、数据的标准规范,以及加强对电子文件归档的业务指导、技术培训和监督检查。

2 对综合统筹电子文件归档的认识

第一,各单位的办公自动化和信息系统建设迅猛发展与数字档案室、数字档案馆系统建设不配套、不同步,导致许多电子文件和电子业务数据停滞在各个系统的末端。国家曾花费了大量人力、物力和财力组建了若干个电子文件管理中心(ERMC),笔者认为由于每个中心的定位、模式、功能、标准、技术和方法各不相同,如何处理好ERMC与数字档案馆的数据交换关系并厘清二者之间的职能、标准和方法等,一直没有突破性进展。从电子文件管理中心转变为电子档案管理中心,需要综合考虑电子文件形成、收集、积累、鉴定、归档到电子档案移交、存储、利用等全过程管理,因此形成正确的、可靠的和安全的电子文件数据和电子档案数据流向图显得非常重要。从全国范围来看,目前对电子文件的管理还是缺乏必要的、有效的监督与控制。笔者认为,没有从电子档案管理的全流程来综合统筹档案信息化建设目标与要求、切实加强电子文件的归档,是档案部门档案信息化建设实施起来成效不显著的一个重要原因。

第二,电子档案管理一方面要遵从电子环境下相关管理工作的规律和要求,另一方面要遵从档案管理的一般规律和基本要求[2]。现在摆在档案工作者面前的是不同系统产生的不同类型数据、各式各样的电子文件和电子档案,因此一方面要做好各个信息系统电子文件的归档工作,另一方面要有一个电子档案管理系统作为支撑,依靠人工进行管理的方式必须尽快改变,要实现有效管理各立档单位产生的电子档案的目标,没有一系列妥善的、科学的制度、方法和实施路径是不行的。电子文件归档客观上依赖于电子文件归档系统(或各种信息系统的归档模块)和电子档案管理系统,电子档案质量很大程度上取决于电子文件的质量,还取决于电子文件的归档质量。要树立新观念、新思维,统筹考虑电子文件及时归档、技术检测、电子档案移交接收进馆、电子档案长久保存和提供利用。

第三,电子文件归档后应该组“卷”。电子档案卷的“卷”我们套用了案卷的“卷”字概念,“卷”在某种意义上可理解为纸质档案的“卷”,也可理解为一个事件(或一个公文)的归档电子文件的集合。传统概念上一个纸质文件或一份档案我们是很清楚的,但在电子档案管理中一个电子档案往往是由若干个电子文件组成的,所以这个概念很难让人理解。应归档的电子文件(电子档案)往往是由若干个电子文件组成的,包括这个电子文件的签发稿、版式文件、拟稿单或承办单、归档文件元数据、附件,以及单位名称、电子文件号、责任者、正题名、主题词、文件编号、日期、主送、抄送、密级、页数等。电子文件经“四性”检测合格就会形成一个电子档案卷(也可称电子档案组合)。电子档案卷也可按全宗、年度、机构、问题(事件)、保管期限、密级等因素进行分类,相对集中进行管理。有了电子档案卷我们还需要给它起个名字,可以叫“电子档案号”,类似于传统意义上的档号。

第四,为了保证电子档案卷相对集中、便于管理和正常流转,一般情况下电子档案卷需要进行打包或封装处理,以便于电子档案的移交、接收和流转。笔者认为,可自主选择使用目前的两种主流打包方式zip或rar。完成打包或封装就相当于完成电子档案组卷并给予 “电子档案卷皮”,也可称之为电子档案数据包或存档信息包,电子档案数据包一般以“电子档案号”命名。

3 对归档电子文件“四性”检测的认识

首先是对归档电子文件准确性的认识。笔者认为,电子文件准确性主要取决于各单位信息系统的电子文件归档系统(归档模块)的功能,各单位要准确界定电子文件的归档范围和保管期限,按《电子档案移交与接收办法》的要求将应归档的电子文件适时捕获。获取电子文件及其元数据的方法与过程都是由归档系统自动完成的,很少会有人工的干预,而规则基本上是由各单位档案室根据档案行政管理部门的要求制定的,并由信息化部门执行。因此,电子文件的准确性主要依赖于系统事先的设置规则与要求,只要符合预先制定的规则,准确性就会有保证。档案馆在接收电子档案时对准确性的检测,笔者认为最主要是确认正规的途径、手续和来源。

其次是对归档电子文件完整性的认识。参照《浙江省省直单位电子公文归档与电子档案管理暂行办法》,归档电子公文内容应包括签发稿(包括修改痕迹)、版式文件、拟稿单或承办单、归档文件元数据、附件等。签发稿指发文机关领导人对电子公文进行最后审定、签署印发的稿本;版式文件指正式公文发文的印制稿;拟稿单或承办单指公文流转单或签批单,各项要素内容可一并在归档文件元数据集中记录;元数据文件包括单位名称、电子文件号、责任者、正题名、主题词、文件编号、日期、主送、抄送、密级、页数、附件、附注、收发文类别、定稿时间、文件大小、格式信息、电子签名标识、业务行为、处理人员、处理部门、处理时间、处理意见等;如有附件也需归档。笔者认为,电子文件的完整性检测光依靠人工来执行是不可能完成的,只能依靠电子检测系统来完成。检测系统能检测应归项目内容是否存在,但并不能检测内容的对与错,如果有缺漏项检测系统就会报错,提示应补齐项目内容,管理人员可手工操作进行重新归档。如内容出错,目前系统还无法检出,只能依靠人工抽查。

再次是对归档电子文件可用性检测的认识。可用性检测其实就是检测电子文件的格式是否存在非主流格式的文件,如有则需要转换成主流格式,以方便读取和使用。因此要重点关注电子文件格式登记,建立电子档案长久保存库的所有格式登记清单(总表),其目的是为了在将来某些格式被淘汰且技术无法支撑、系统无法识别时,进行电子档案长久保存格式的技术转换。

最后是对归档电子文件安全性检测的认识。安全性检测主要是应用专业的安全产品对归档电子文件进行安全扫描,一旦发现病毒即进行杀毒处理,然后再进入归档环节。

目前,电子文件检测已经成功地在“浙江省档案局电子文件归档与接收系统平台”“浙江省档案局电子档案接收进馆与长久保存基地”“浙江省档案局数字档案馆系统”进行了应用。

4 对电子档案全流程流转的认识

其一,电子档案从产生起就处于各个信息系统内部归档模块之中,电子档案数据包如何流转?笔者认为,第一步是流转到单位的档案管理系统,一般有在线和离线两种方式,两种方式的性质都一样,其中在线方式需要信息系统和档案管理系统做一个数据交换接口调用或采用数据推送方式送达,离线方式则需要对数据包进行下载处理并加载到档案室档案管理系统;第二步由于档案室档案管理系统无法直接利用电子档案数据包,因此在收到电子档案数据包后需要进行解包处理,解包后可先将电子档案描述项中XML文件取出加载,也可理解为传统的档案条目信息加载;第三步再将电子档案数据包中的结论性文件取出或转换成为版式文件(也可以在归档时就转好),与电子档案描述项相关联(挂接),提供正常使用;第四步可将电子档案数据包移交到档案馆进馆保存,当然在各个环节尤其是进馆移交过程中,可加上数字签名或电子印章或进馆时间戳等技术手段加以进一步验证,原始数据包进行长久保存;第五步进行解包处理,在数字档案馆利用系统中提供正常利用。

其二,对引入可信时间戳技术保证电子文件原始性的实践应用流程的认识。浙江政务服务网电子文件在归档形成电子档案的同时加盖了可信时间戳,具体操作是先将电子档案包经过SHA-1算法得出HASH值(数字摘要),把该数字摘要和系统身份标识通过浙江政务网发送到浙江省档案局部署在政务外网的可信时间戳在线保护系统,提出盖戳请求。时间戳在线保护系统在通过身份验证后将请求信息通过政务外网的互联网出口,转发给联合信任时间戳服务中心,由该中心与国家法定时间绑定并签发TSA可信时间戳证书,再将证书传回到浙江省档案局时间戳在线保护系统,供归档单位下载。归档单位可将返回的可信时间戳文件与归档电子档案数据包文件并列或关联存放,以便日后进行原始性校验。这样从操作上既完成了“一键归档”,又为今后电子档案的移交接收提供了“四性”检测依据。通过这种方式既可在电子文件归档过程中增加浙江省档案局认可的行政行为,使浙江省档案局及时了解和掌握电子文件归档的实时状况,也为今后电子档案的移交接收创造双方共同认可的原始凭证,同时为“浙江省档案局电子文件归档与接收系统平台”“浙江省档案局电子档案接收进馆与长久保存基地”项目建设提供了良好基础。

其三,对电子档案移交数据构成的认识。电子档案移交首先要保证真实、完整、可用和安全这“四性”要求,其次要符合数字档案馆及档案资源共享等后续管理利用平台的技术要求。《电子档案移交与接收办法》规定,电子档案移交与接收可采用离线或在线方式进行,必须遵循工作流程并办理交接手续,电子档案移交数据要达到基本要求后才能移交。电子档案数据构可成分两方面,一是内容数据构成,二是技术构成。电子档案内容构成反映了电子档案的主题信息,如文书类电子档案主要包括过程稿、签发稿、审批过程信息、元数据等。电子档案元数据是电子档案必不可少的组成部分,它体现了电子档案的原貌性、完整性,并能保证电子档案可靠和可用。国家档案局发布的文书类电子档案的元数据标准都可以参照。为保证电子档案的完整性和有效性,从有利于电子档案有效管理和长期保存等角度出发,今后还会陆续推出各种数据类型的电子档案元数据工作方案。对于业务类电子档案,由于其内容数据构成差异性大,建议以浙江政务服务网行政审批电子文件归档为例,归档文件夹内存放该行政审批的基本信息描述、办理流程、存档信息(.xml保存)和相应的申请、受理、办理、办结、送达等环节的所有内容(.xml、.jpg、.pdf等各种格式),包括各种表、证、单、书及其他附件材料。电子档案技术构成指电子档案内容组织和存储方式,技术构成是电子档案体现的电子化特征,以行政审批事项为单位为例,归档时一个审批事项形成一个归档文件夹,归档文件夹内的各种电子归档材料要求能够在脱机状态下正确地读取与打开,数据格式以政务服务网上保存的原始文件格式为准。在政务服务网上以关系数据库形式存放、显示时以临时抽取组合方式形成的归档电子材料,如审批单等,应转换成PDF或XML或HTML等易于读取和显示的格式保存;以数据链接形式存放的归档电子材料,须下载保存真实数据文件。完成归档时,将归档文件夹进行归档数据打包,每个归档文件夹分别打成一个ZIP文件包,ZIP格式的归档数据包先在网上集中有序(分单位、年度、审批类别等子目录)存放,并在行政审批事项列表中记录存放地址。

总之,要从电子文件形成、归档和电子档案移交、接收和利用的全流程管理来综合统筹档案信息化建设,促进档案信息化事业健康发展。

注释与参考文献:

[1]国家档案局.数字档案馆建设指南[Z].2014.

[2]蔡学美.《电子档案移交与接收办法》解读[J].档案工作,2015(2).

猜你喜欢
档案局信息系统
企业信息系统安全防护
基于排队论的信息系统装备维修保障效能分析
雷厉风行 立即落实已蔚然成风
——省档案局馆及时传达省直机关作风建设推进会精神
陕西省档案局关于表彰陕西省首届“解读档案传播文化”优秀征文的通报
基于区块链的通航维护信息系统研究
正定县档案局恢复挂牌
信息系统审计中计算机审计的应用
河北省档案局“健步走活动”走出新风采 展示新风貌
石家庄市档案局开展第二批次重要档案数据异地备份工作
基于ADC法的指挥信息系统效能评估