装备保障数据体系构建与应用

2022-11-26 12:51李建涛
舰船科学技术 2022年19期
关键词:装备数据库质量

唐 琳,李建涛,郭 勇,黄 猛

(1.中国人民解放军91977 部队,北京 102249;2.海军装备部,北京 136100)

0 引言

随着信息化的发展,数据资源已经成为获取战场信息控制权的要素之一。战场态势感知、任务规划、自主协同等都取决于海量数据的获取和处理[1]。大数据的竞争已经成为影响世界局势和主导权的关键因素[2–3]。当前,种类繁多的海量装备数据资源仍以原始形式存储在各单位和部门中,物理分布在不同地域,难以得到有效地组织和利用,存在管理系统多、兼容互通少,动态数据多、采集方法少,数据采集多,分析利用少等问题[4]。因此,建立合理的装备保障数据体系,实现装备保障数据的规范管理,对于提高装备保障信息化水平具有重要的现实意义。

1 概念及作用意义

1.1 概念

装备保障是“为使所配备的武器装备顺利遂行各种任务而采取的各项保证措施与进行的相应组织指挥活动的统称”[5–8]。装备保障数据体系是能够完整描述武器装备从研制、生产、试验、部署、训练、作战、维修、报废整个生命周期内所有信息的数据集合,主要包括描述装备生命周期的各类元数据、物理数据和文件[9–11]。

装备保障数据涉及到装备全寿命过程的各个阶段,具有以下特点:

1)多源性。由于保障方式和获取手段的多样性,导致了保障数据的多源性,数据精度和数据格式有较大的的差异,数据结构较为复杂。

2)多态性。由于保障数据的多源性,也导致了保障数据存在形态多样,包括格式化和非格式化数据,这也增加了数据处理的难度。

3)多样性。保障数据包含的信息类型较为庞杂,给数据管理增加了难度。

4)关联性。孤立的数据发挥的作用甚小,而通过装备保障数据可以将机构、人员、装备、装备保障过程和时空环境串联在一起,形成一个有机的整体,以最大化发挥装备保障数据的优势。

1.2 作用意义

信息系统建设是现代化装备保障发展的需要,装备保障数据体系建设的意义在于整合“数据孤岛”,使海量的保障数据发挥整体功效。构建一个含装备研制、试验、交装和后期使用与保障的全寿命装备保障数据体系,对于提高装备保障信息化水平具有重要意义[5]。具体在以下2 个方面发挥着重要作用:

1)提高保障数据的共享程度。完善的装备数据保障体系能够充分发挥保障数据的应用价值;装备保障数据是装备信息化建设的数据基础,完善的装备数据保障体系可以提高信息资源规划管理能力,适应装备保障高效的管理新模式的需要。随着装备信息化建设越来越依赖装备保障信息的支持,加强装备保障数据体系建设,建立和完善装备信息资源基础,可以大幅度地提高装备信息资源的总体开发利用水平。

2)在装备保障数据体系建设中,按照特有的访问控制机制对数据信息进行保护控制,能够确保装备信息资源的完整性、保密性、真实性和可用性。

2 装备保障数据体系构建

装备保障数据体系作为装备保障数据的系统级集成,是装备保障和业务应用的纽带,装备保障数据体系的构建应遵循以下原则[12–13]:

1)完整性。应包含装备保障所需要的的各种类型数据,能够支撑装备保障各类业务;

2)合理性。数据描述、引用及关联关系合理准确;

3)独立性。各模块功能具有相对独立性,完成某个应用的数据支撑服务;

4)一致性。不同来源的数据描述应一致;

5)稳定性。数据总体结构应有稳定性,在不大范围变动的情况下可持续更新完善。

装备保障数据体系总体上分为原始层、基础层、综合层和共享层4 部分,如图1 所示。

图1 装备保障数据体系Fig.1 Equipment support data system

2.1 原始层

原始层包含了所有的数据来源,数据类型、格式呈现多样性。文件类型包括文本、二进制数据、XML文件以及应用系统文件。从结构上又分为结构化数据、半结构化数据和无结构数据。其中最大数据来源是标准数据集,标准数据集是一种半结构化数据,用来描述装备保障过程中得到的各类记录数据。数据源结构如图2 所示。

图2 装备保障数据源体系结构图Fig.2 Equipment support data source architecture diagram

2.2 基础层

基础层由数据集库、标准数据库、专业数据库以及基础元数据组成。其中数据集库管理文件类型数据,标准数据库和专业数据库对数据集库进行关系化存储,元数据保存XML、代码、日志等。

1)数据集库。存储标准装备保障数据文件,装备保障数据通常会由一个或多个数据文件组成,数据集库对这些文件汇集处理,集中管理,与其他基础数据形成一个整体,方便备份恢复。

2)标准数据库。标准数据库包括基础代码、基础信息和数据字典,用于装备保障信息的共享交换。

基础代码主要包括组织机构代码、装备目录代码、国防科研生产单位代码、企业化修理工厂代码、仓库目录代码等数据。

基础信息主要包括单位信息、装备信息、人员信息、仓库工程和标准规范信息。其中,单位信息主要包含生产单位、研制单位、修理工厂的信息;装备信息主要包含装备基本性能信息,主要包括装备通用信息、配套信息、性能、保障指标等信息;装备唯一标识信息主要包含装备基本特征信息、唯一码等信息;人员信息主要包含人员通用信息,国防科研生产单位技术人员,企业化修理工厂技术人员,专家人才等信息;仓库工程信息主要包含装备储备单位及其规模、分布、库容和保障能力,以及储备装备的品种、型号、数量、质量、分布等信息;标准规范信息主要包含所遵循的国家标准、行业标准等相关标准。

数据应用字典主要包括标准应用字典和数据属性定义字典两类。标准应用字典指在装备保障过程中涉及到的、内容相对固定的枚举型分类数据,为业务应用系统提供共用的基础标准数据支撑。数据属性定义字典是对装备保障过程中的共性数据项名称、类型等进行规范化描述的字典数据。

2.3 综合应用层

综合层由整合数据库、专题数据库和元数据组成,为数据分析、应用和决策提供服务。

1)整合数据库。基础数据经过提取、转换、汇集等处理后形成。

滑坡区地势整体北高南低,覆盖层厚度小,山坡坡顶边坡可见基岩出露(图1)。滑坡后缘五星学校施工现场地面高程151~152 m,前缘高程122 m,相对高差29~30 m,一般坡度约为30°~35°,滑坡平面形态上呈半椭圆状,后部呈弧形。滑坡纵向上坡度大体相等,前缘-中部陡,后缘缓。滑坡体宽约170 m,纵长约55.5 m,滑坡体体积约9.4×104 m3,滑坡主滑方向115°,滑坡类型为小型浅层牵引式土质滑坡。

2)专题数据集。在整合数据库的基础上,针对特定领域创建的数据视图,由用户自定义创建并维护。

3)整合元数据库。通过添加整合数据库、专题数据集的背景数据,对基础元数据进行重新整理形成整合元数据库。

2.4 共享层

共享层汇集原始层、基础层和综合层产生的最终数据,包括基础数据、元数据等最终产品。

数据产品通常按照加工程度和应用角度分类,一般分为中间产品、最终产品或常规数据、服务数据。

中间产品指经过部分处理,例如各类装备在保障过程中各类过程数据就是中间数据产品。最终产品可以直接使用,它可以是一个数据视图或是一个计算、统计结果,产生来源可以很多,包括数据库读取或数据分析挖掘的结果。

常规产品指日常数据处理生成的数据,其生产模式、时间和数量较为稳定,使用范围较广。在常规产品基础上,根据用户需求生成的定制数据称为服务数据产品。

3 关键技术

3.1 体系结构规划技术

装备保障数据体系结构的作用是从整体上构建装备保障数据应用的软件框架和软件总线标准,对系统的功能模块、接口、软件、信息流程、人机交互进行统一规范。体系架构采用SOA 方法,各功能模块独立设计,通过服务总线进行集成。系统中的所有模块和业务流程都需要调用数据,因此一个模块的功能不能仅限于某一个具体的业务过程,其功能应该是通用的、独立的,一个具体的业务流程应该是对这些功能模块的再组合,从而实现业务功能动态重组。

SOA 本身是一个多层的服务平台,包含了各个信息中心的业务模块,并基于共享服务平台提供服务的共享和信息的互通。各个数据中心的共享服务平台端点,不管其部署位置,都通过中间件连接到SOA 服务,并通过服务总线实现信息交换、服务调用。

3.2 数据质量管控技术

数据质量是装备保障数据体系能否实现建设目标的关键因素之一[14],其质量优劣直接影响到装备全寿命管理任务的完成质量,主要包括数据质量评估技术、数据清洗技术、数据集成技术、数据审核技术、数据增强技术等。

1)数据质量评估技术

采取一种数据质量绩效管理方法,有利于呈现数据质量管理与组织信息相关活动的衔接情况。许多组织面临的挑战是,数据管理的发展与功能应用需求一样,往往是事后弥补。数据分析员开始作为企业资产来评判数据的组织价值,暴露的差距说明了烟囱式业务应用收集的功能需求和良好数据管理实践之间的分歧。评估并解决这种分歧的一个方法是评价与数据质量实践相关的当前成熟度等级,之后设定一个最能满足组织需求的目标成熟度等级。反之,这种方法将此愿景定为一种比较标准,用于对一个组织的成熟度与其他组织的工作方法进行比较,找出不足,并寻求提高。

针对具体的装备数据质量评估任务,首先要构建适当的数据质量指标体系,指标体系的构建可以看成对完整的数据质量维度分层结构进行选择或裁剪的过程。数据质量评价方法主要有定性方法、定量方法和综合方法[15]。

2)数据清洗技术

由于大量数据已脱离数据获取环境,不可能重新获取或返回修改,需要通过数据清洗提高数据质量。数据质量问题包括重复记录,逻辑错误、异常数据等。数据清洗一般流程包括数据检测、错误分析、数据修正。数据清洗是一个代价高昂的过程,需要花费大量的资源,相当的工作需要人工交互式地完成,如何提高数据清洗效率、增加数据清洗的自动化水平是数据清洗技术的研究重点之一。

3)数据审核技术

数据审核是数据质量管理与控制的手段之一。数据审核通过制定审核规则(数据一致性、完整性、规范性等),对数据进行校验审核,发现错误并修正。在装备保障数据建设时,按照确定的数据需求,一方面通过数据采集工具进行新录入数据的采集,另一方面对需要的历史数据进行转换集成。因此我们需要有一个部署于系统之上的数据审核角色来推动数据审核过程的不断发展,并与管理决策层建立起必要的沟通渠道,以不断完善数据管理规范,并促进全面数据质量管理体系的建立。

4)数据增强技术

在数据应用过程中,各种应用会频繁复制修改数据,导致数据出现大量重复使数据质量严重下降,为了提高数据质量,基于多源数据的数据增强技术,通过寻找多数据源之间的共性,采用基于冲突值的质量评估方法合并重叠数据源来提高数据质量。

4 装备保障数据体系应用

4.1 在装备保障指挥中的应用

装备保障指挥是一项集战场技术侦察、装备维修、器材弹药供应等工作的指挥决策于一体的复杂性工作,保障数量多、型号多、环节多、时效性要求高、决策难度大[16]。随着装备保障信息化建设大力发展,装备保障数据量成指数级增长,信息类型繁多,对数据的处理能力提出了更高的要求。通过构建装备保障数据体系,实现海量装备数据的积累,快速完成数据的价值提炼,筛选装备保障指挥的有效信息,为指挥员科学决策提供支撑。

以装备维修保障指挥为例,流程图如图3 所示。下级报告当前装备损坏及分布情况,系统进行自动战损评估,计算出当前各级所需维修能力;系统根据各级维修力量的数量及分布计算出各级现有维修能力;根据当前各级现有维修能力和所需维修能力,并结合当前战场态势及首长决心,通过装备保障数据体系,系统能够快速生成优质的装备维修保障方案。

图3 装备维修保障指挥流程图Fig.3 Equipment maintenance support command flow chart

4.2 在装备故障预测中的应用

装备故障预测是指根据装备当前的使用状态,结合装备的参数特性、使用环境及历史参数,对装备可能出现的故障进行分析预判,列出可能出现的故障类型、严重程度、故障位置、故障原因和可能后果,以便采取措施,预先消除隐患,保障作战和训练任务顺利完成[17–18]。

随着装备保障信息化水平的不断提高而带来的海量的装备故障信息,给开展装备故障预测工作带来了新的挑战。通过构建装备保障数据体系,对海量装备信息进行聚合,采用统一规范的方式进行数据整合、数据管理、数据提取、去伪存真、去粗求精,消除数据误差,挖掘出数据的潜在价值和数据关联性,建立定量数据模型,掌握装备故障发生特点规律,对故障进行提前预测。装备故障智能预测流程如图4 所示。

图4 装备故障智能预测流程图Fig.4 Flow chart of intelligent prediction of equipment failure

5 结语

装备保障数据体系构建是一项全局性的系统工程,站在装备全过程数据管理全局、数据服务全局的高度,进行多方位、多视角的审视,对装备保障数据的建设进行全盘的设计,形成一个完整的、涵盖了装备全寿命过程的装备保障数据体系,能够为提升装备保障信息化水平提供理论和技术支持。

猜你喜欢
装备数据库质量
哪些装备为太空之旅护航
这些精锐与装备驰援泸定
港警新装备
二年级下册期末质量检测(一)
数据库
数据库
数据库
数据库
睡个好觉
演习中的阅兵装备