面向多源异构航天电子档案的元数据方案设计

2023-11-17 01:38田红
北京档案 2023年10期
关键词:元数据

田红

摘要:在建设数字航天背景下,数字资源日益成为航天企业重要的战略资源和核心资产。面对档案管理对象的不断扩展、资源类型的愈加复杂与资源集成共享的迫切需求,亟须制定一套标准统一的元数据方案。论文在阐述元数据方案构建必要性的基础上,结合电子文件的流转过程和航天档案资源体系的特点对元数据进行了分析,提出了航天电子档案元数据设计思路与描述方法。

关键词:多源异构 航天电子档案 元数据

随着信息技术手段在航天设计、生产、制造等活动中的广泛应用,电子公文、CAD图纸、三维模型等电子文件急剧增长,电子文件归档势在必行。面对多源异构的海量电子文件,如何确保不同系统、不同阶段的数字资源特征得以描述、电子档案管理过程得以记录,是航天企业档案部门面临的一个重要课题。元数据作为描述文件背景、内容、结构及其管理过程的数据,是电子档案真实性、完整性、可用性和安全性的重要保障。构建一套标准统一、兼容性强的元数据方案,对于实现电子档案科学、规范、有序的管理具有重要的意义。

一、元数据方案构建的必要性

在建设数字航天背景下,数字资源日益成为航天企业重要的战略资源和核心资产。构建科学合理的元数据方案是加强航天企业数据管理、规范电子档案管理和实现资源交换共享的内在需求。

(一)航天企业数字化转型的要求

当前,在建设数字航天背景下,航天企业科研生产数字化能力和经营管控数字化能力全面提升,不论是数字化建模、仿真、三维设计还是企业运营监控、战略管理、智能预测等都依托于数字资源,数字资源已成为航天企业重要的战略资源和核心资产。然而由于各类资源形成于不同的业务系统,因此缺乏数据存储、管理和共享的统筹规划,导致数据集成困难、交互复杂,在很大程度上影响了数据支撑科学决策的效能,因此加快推进以数据管理为核心的电子档案管理,日渐成为航天企业数字化转型的迫切需要。而实现多源数据的汇聚融合、互联互通、交换共享,其首要前提就是要构建标准统一的元数据方案,明确航天电子档案形成、交换、收集、移交、保管、利用等全过程元数据设计、捕获、著录的一般要求。

(二)电子档案科学高效管理的要求

元数据是关于数字档案资源描述的数据,也是数字档案资源真实性和可读性的重要保障。无论是传统载体还是数字化的档案资源,都需要对资源和数据的外部与内容特征等进行揭示和描述,才能进行有序化的组织。随着企业协同产品研制、科研管理、经营、财务、人力、设备与物资等一系列信息化系统的应用,各类文本、视频、音频、图像、二维图纸、三维模型等海量异构分布的数字档案资源呈指数级增加,其体量巨大、类别复杂、来源广泛、管理要素多等特点进一步增加了管理难度。为确保不同系统、不同阶段的电子档案特征得以描述和记录,亟须建立科学合理的元数据方案,为实现电子档案规范、有序的管理提供依据。

(三)适应航天数字档案馆建设的要求

《“十四五”全国档案事业发展规划》明确指出“深入开展企业数字档案馆(室)建设,完成50家企业集团数字档案馆(室)建设试点”,航天企业紧跟新形势、把握新机遇,全面启动了航天数字档案馆建设。元数据标准作为数字档案馆标准体系建设的重要内容之一,不仅是数字档案馆实施的指导方针,也是其运行维护的重要依据。当前,航天企业关于元数据管理的顶层标准主要有《航天档案数据采集规定》和《航天档案数据元》,规定了航天档案数据采集、描述的原则和要求,但这两个标准已有十余年,其内容已不能满足当前电子文件管理的新要求,无法为航天数字档案馆应用框架构建提供支撑,亟须建立一套完善、有效的元数据方案,为实现电子档案在航天数字档案馆的统一管理、交换、共享提供指导。

二、航天电子档案元数据方案构建

电子档案元数据方案构建的前提是分析电子文件流转过程,明确元数据的构成,同时结合档案资源体系构成,对通用和专用元数据进行整合、聚类,最终形成具有航天电子档案资源分类和管理特点的元数据方案。

(一)基于电子文件流转过程的元数据分析

元数据随着业务活动、管理活动的开展而不断产生、积累,元数据方案的构建首先要明確电子文件全生命周期的管理过程。在文件形成阶段,由设计人员在业务系统中创建文件并送审,系统自动捕获文件内容属性、流转等相关元数据,如文件编号、题名、编写人、编制日期、签名人等;文件审批结束后,电子文件经格式转换进入电子档案管理系统进行归档,电子档案管理系统自动捕获电子文件元数据信息,并由档案人员对文件进行接收、分类、整理,增加档案管理过程元数据,赋予文件特定的档案标识,形成移交人、移交单位、立卷人、立卷日期、档号等元数据;在存储与处理阶段,系统自动记录电子档案保管相关元数据,如格式信息、文件创建程序、电子文件状态、存储位置等;在利用阶段,根据借阅利用流程,自动捕获电子档案利用申请、审批等元数据。电子文件全周期管理过程如图1所示。

(二)面向航天档案资源体系的元数据分类

航天档案的类别众多,包括文书、经营、科研、航天产品、民用产品、质量、基建、设备仪器等16个类目,电子文件类型主要为文本类、图像类和声像类。由于各类电子档案的形成环境、技术特点和管理要求存在差异,其形成的元数据也各具特色,按照元数据的通用程度,可以将其分为通用元数据和专用元数据。通用元数据即各类电子档案都具有且需要设置的元数据,例如文件编号、题名、编写人、档号、归档日期、格式信息、存储位置等。专用元数据即各类档案特有的元数据,例如航天产品档案不仅涉及型号技术文件,还包括图纸、光盘、三维模型等,其专用元数据包括型号名称、型号代号、版本号、模型名称、模型中间格式等;科研档案专用元数据包括项目代号、子项代号、项目名称、课题负责人、成果批准号等;照片档案专用元数据包括单元号、单元名称、拍摄时间、拍摄者、色彩空间、分辨率、内容描述等。

(三)航天电子档案元数据方案的构建

元数据方案的设计既要考虑电子文件形成、归档、保管、利用过程元数据项的特点,又要考虑不同类别档案元数据的通用性和特殊性,通过对同类性质元数据进行整合、聚类,将其分为内容属性元数据、外部特征元数据、保存行为元数据、管理活动元数据和利用控制元数据五个维度,针对个别专业特点鲜明的档案,每个维度下可增加专用元数据,最终形成电子档案元数据体系。

内容属性元数据用于对电子档案基本属性进行详细、全面的记录,便于电子档案的检索和利用,提高档案资源的组织效率,例如文件编号、题名、页数、密级等。外部特征元数据用于描述电子档案管理过程的外观信息,突出电子档案的形成特点,为保管利用提供依据,如案卷名称、立卷人、立卷日期、档号等。保存行为元数据用于记录电子档案背景、结构、存储等属性信息,包括格式信息、计算机文件名、计算机文件大小等。管理活动元数据是记录电子签名等业务行为的元数据,包括签名规则、签名时间、签名人、证书等。利用控制元数据是用于描述电子档案授权利用的元数据,包括借阅申请人、借阅申请时间、借阅审批人等。结合上述设计思路,表1展示了以航天产品档案为例的元数据方案。

(四)电子档案元数据描述方法与要求

在构建元数据方案时,需要结合元数据捕获、存储、维护和利用过程,明确各个元数据项的设置规则,以便数据的统一收集、管理和利用。参考《文书类电子文件元数据方案》(DA/T 46—2009)等行业标准,结合航天电子档案的特点,可以从编号、中文名称、英文名称、定义、约束性、数据类型、值域、信息来源、注释等方面对元数据项进行描述。关于随业务系统流转的元数据,需明确元数据捕获节点和捕获要求。针对电子文件形成过程中产生的、业务系统自动生成且不可人工干预的内容属性元数据、管理活动元数据,归档时由档案管理系统自动捕获元数据信息;针对电子文件归档和电子档案管理过程中产生的、有值域要求的外部特征元数据,可通过预定义值域列表的方式,由移交、歸档人员选择著录或手工著录;针对存储和利用过程产生的、系统自动记录的保存行为元数据、利用控制元数据,由管理电子文件的系统自动捕获。

三、结语

在航天企业数字化转型过程中,数字档案资源急速增加,档案利用需求不断增强,对航天档案工作紧密融入科研生产、经营管理等中心工作,不断提升档案信息资源管控能力提出更高要求。构建航天电子档案元数据方案为多类型、多来源、多要素数字资源的科学描述、有序管理提供了统一规范,为航天企业电子档案的集成交互、共享利用提供了依据。随着航天数字档案资源的快速增长、档案管理与科研业务流程的深入融合,推动数据统一流转、融合使用将是档案部门面临的新课题,航天电子档案元数据方案也将在实践中不断丰富和完善。

参考文献:

[1]李芳芳,吴玉龙,米捷,等.机关电子档案元数据体系构建及元数据库建设研究[J].档案管理,2019(5):13-15.

[2]宋欣.贝叶档案数字化建设中的元数据研究[J].浙江档案,2021(3):27-30.

[3]罗婷予.面向智能资源发现服务的城市记忆资源元数据方案构建[J].图书馆建设,2021(5):98-106.

[4]郭留红,高爱民,齐云飞,等.公路建设项目电子文件元数据标准构建研究[J].档案管理,2022(3):65-67.

[5]谢锋,徐悦,王磊.地方性建设电子档案元数据方案构建——以苏州市为例[J].档案与建设,2022(8):58-61.

作者单位:北京空间飞行器总体设计部

猜你喜欢
元数据
元数据国际交换共享的客家古民居数字记忆工程建设
基于来源的组织机构元数据构建研究
元数据与社会化标签在微视频搜索中的应用
高等院校智慧校园建设规划与实现
利用VB读取中国知网过刊数据提取元数据的研究
财会信息资源元数据标准的研究
基于隐语义模型和用户信任的个性化推荐模型
基于关联数据的语义数字档案馆框架设计研究
基于角色控制的异构数据展示在企业门户中的应用
基于元数据映射机制的异构数据操作