测量与绩效管理中的数据质量保证实践

2023-06-18 07:14周山山
管理学家 2023年11期
关键词:数据质量

周山山

[摘 要]在各企业推行数字化转型的时代浪潮中,如何做好数据治理是各企业面临的一大难题。数据治理中最关键、最重要的一环就是数据质量管理。文章详细解读和探讨了GJB 5000B中测量与绩效管理实践域关于数据质量的管理实践,通过分析数据质量的来由,旨在探讨做好软件质量管理中的数据质量管控和推广,并为相关工作者提供借鉴和参考。

[关键词]数据质量;软件管理;数据质量管理;测量与绩效管理

中图分类号:TP311 文献标识码:A 文章编号:1674-1722(2023)11-0001-03

在探讨数据质量之前,首先需要清楚什么是数据质量。从20世纪70年代开始,关于数据质量的研究工作逐渐兴起,其主要经历了萌芽、形成和繁荣三个阶段,经过几十年的研究发展,形成了许多理论、技术和方法[1]。在软件开发管理领域,测量与绩效管理是GJB 5000B版标准中的重要实践域之一,该实践域的目的是运用测量和分析的方法管理工作和业务绩效,确保在实现业务目标的同时,组织能力和绩效得到同步提高。

数据质量是测量与绩效管理实践域的一项重要实践,做好测量与绩效管理工作的基础是做好数据质量的管控。没有数据质量,任何数据分析工作便没有了基础,基于数据分析开展的决策就会产生偏差,进而影响组织的业务目标实现。高质量的数据已经成为企业增强市场竞争力、制定正确决策的战略资源之一[2]。文章通过讨论数据质量的定义、发展过程,分析各企业如何做好数据质量管控,以便为各企业的数据质量管控工作提供治理方向。

一、数据质量

在数据质量的发展过程中,数据质量包括绝对值质量和过程质量。《信息技术 数据质量评价指标》中对“数据质量”一词作出了明确定义:数据质量是在指定条件下使用时,数据的特性满足明确的与隐含的要求[3]。

数据质量关注如绩效和测量信息的齐全性和准确性等方面的内容,数据质量需要保证数据测量要遵循的操作定义及数据存储的完整性。

GJB 5000A-2008《军用软件研制能力成熟度模型》将数据质量作为一条子实践提出了要求,即在测量分析过程域“SP 2.1采集测量数据”中的子实践“尽可能靠近数据源进行数据完整性检查”[4]。该子实践仅要求检查数据的完整性,既不全面,也不具备较强的可操作性,间接导致了各企业在落实GJB 5000系列标准的过程中,对于数据质量的管理不够重视,缺乏有质量的数据,数据分析、数据治理工作无法有效开展。

因此,GJB 5000B-2021在换版过程中吸取了GJB 5000A推进过程中的经验教训,将对数据质量的要求提升至测量与绩效管理实践域中的一条独立实践,即“MPM3.2建立并维护保证数据质量的准则”[5]。大数据时代比任何时候都更加注重数据质量。该标准对实践提出了具体操作要求,便于标准落地实施,为各企业发挥四级的软件能力成熟度水平打牢数据基础,体现了数据质量是后续开展量化管理的基础,必须予以高度重视。

二、数据质量管理的意义

高质量的数据是分析、预测和开展软件开发活动的基础。随着软件开发相关数据越来越多,社会大众逐步认识到了数据质量的重要性,并发现了一些潜在的数据质量问题[6]。

在企业推进GJB 5000系列标准的过程中,经常会出现两类关于数据质量的典型问题。一类是测量数据缺失。例如,某软件项目提交的测量分析报告,由于部分数据不完整,导致数據质量不高、存在大量空值,进而影响组织级测量项的偏差,导致组织过程改进项未得到准确识别,影响组织过程改进。另一类是测量数据不准确。例如,某项目采用软件产品线的方式研制软件,大量使用了软件模块,但是在采集部分测量数据时,仍旧采用常规计算方法,导致出现测量数据不准确的情况,即对软件按照新开发的方式计算工作量,往往使软件的生产率显著提高或严重脱离实际。

因此,数据质量管理具有重要意义,其重要性主要体现在以下三个方面。

第一,数据质量管理是实施数据治理的必要环节。数据治理是数据资源及其在应用过程中相关活动的集合。数据治理主要包括数据战略、数据架构、数据质量、数据交换和数据安全等诸多方面。数据质量是其中必不可少且关键的环节。同时,数据治理的目的是保证产生、提供和使用高质量的数据。

第二,数据质量管理是数据资产建立的重要保障。数据资产是指由组织拥有或者控制、为组织带来利益的数据资源。数据是组织重要的、核心的、宝贵的资产。数据价值的高低由数据质量的好坏直接决定。

第三,数据质量管理是数据应用服务的基础条件。数据应用服务是数据资产价值的重要表现形式,与组织的业务息息相关。高质量数据提取才能生成高价值的信息。数据质量直接影响数据应用服务的效果。

三、做好数据质量管理的策略

(一)数据质量标准定义

《信息技术 数据质量评价指标》关于数据质量的评判标准给出了明确的规定[3],如图1所示。

1.规范性

规范性是指数据符合数据标准、数据模型、元数据、安全规范、业务规则或权威参考数据的程度。数据测量项应满足本企业规范中的测量项定义。

2.完整性

完整性是指按照数据规则要求,数据元素被赋予数值的程度,一般以数据采集到的程度衡量数据的完整性,即应采集的数据和实际采集到数据的比例。测量项采集人应按测量分析计划的要求采集数据,保证数据的完整性。

3.准确性

准确性是指数据准确表示其描述的实际对象真实值的程度。采集人在数据采集时,测量项的量纲、精度、值域、测量函数、采集存储方法及采集时机应满足本企业规范中的测量项定义。

4.一致性

一致性是指数据与其他特定上下文中使用的数据无矛盾的程度。单个测量项只能有一个采集源。当同一测量数据多处存在时,数据之间应保持一致。

5.时效性

时效性是指数据在时间变化中的正确程度。在不同阶段,测量项应按测量分析计划要求进行采集、分析和存储,应定期(根据项目要求)或事件触发时(出厂质量评审、内外部检查等)更新测量数据。

6.可访问性

可访问性是指数据能被访问的程度。数据经采集分析后应按企业规范中的测量项定义进行存储,确保能被访问。同时,数据在需要采集时,应保证能被授权人员访问。

(二)数据质量监控与评估

数据质量监控的目的是满足数据质量要求,消除或减少异常数据。主要方式是利用已定义的规则定时进行批处理,及时发现问题,提高输出数据质量。数据质量监控一般采用信息化手段实施,保证监控效率和监控质量。数据质量评估则是利用数据质量标准和评估方法,评估数据质量,得到评估结果,为提升数据质量提供参考和依据。

通常情况下,可以按照数据质量各维度的标准制定符合要求的计分準则,最终评分则按照各个标准的满足情况进行评分加权,加权后的结果作为数据质量的优劣评判依据。需要注意的是,数据的优劣与数据的特性、数据的应用场景及业务发展阶段息息相关。

(三)数据质量原因分析

数据质量原因分析的主要工作是准确描述问题和具体分析问题。首先是呈现问题,准确描述问题是分析解决问题的首要条件,问题描述清楚的过程也是分析解决问题的一部分。其次是针对具体问题展开具体分析,通常采用可视化的方式,分类统计数据问题,分析数据质量的变化趋势,找出其中常见的问题。

数据质量分析不能只停留在发现问题本身,而是需要追根溯源,找到数据的源头系统。影响数据质量的因素一般涉及技术、业务和管理三个方面。

技术因素主要表现为由于数据处理各技术环节异常产生的数据质量问题,主要包括数据模型设计、数据采集过程、数据源和数据存储等。

业务因素主要表现为由于业务系统作业流程和人工操作流程设置不当而产生的数据质量问题,主要包括业务需求不清晰、业务端数据输入不规范、业务需求的变更和数据作假等。

管理因素主要表现为由于人员能力及管理机制等方面原因产生的数据质量问题,主要包括缺乏数据思维、缺乏明确的数据质量目标、缺乏有效的数据管控机制和质量问题处置机制等。

(四)数据质量改进与提升

数据质量改进与提升可以采用PDCA循环过程这一方法。PDCA循环又称戴明环。该方法是由质量管理专家休哈特率先提出的,通过管理专家戴明的宣传并普及,其成为全面质量管理的思想基础和方法依据。

PDCA循环分为策划(Plan)、实施(Do)、检查(Check)和处置(Act)四个步骤。它可以使我们的思想方法和工作步骤更加条理化、系统化,反映了企业管理业务的一般规律。在质量管理过程中,各项工作通常按照制定计划、实施计划和检查效果展开,然后将成功的实践纳入规章制度,未获得成功的工作留到下一循环继续解决[7]。

根据PDCA循环,数据质量改进与提升的通用步骤可以分为以下五个方面。

一是明确质量提升改进目标,围绕企业业务,定义数据质量管理的需求和提升目标。

二是建立组织体系保障,构建数据质量管理的组织体系,包括制定相关业务规则、目标和指标等,确保数据质量管理得到组织体系的保障。

三是实施考核体系,建立数据质量KPI,确定数据质量水平和警戒值,通过常态化开展数据质量考核,评估数据质量管理情况。

四是制定问题解决方案,根据数据质量的提升改进目标,制定数据质量问题处理策略和计划并付诸行动,落实问题整改和纠正,解决数据质量问题。

五是确认数据质量提升效果,通过不断监控和评估数据质量,确认数据质量提升效果。

四、展望

文章从数据质量的含义、意义及工作内容等方面展开了实践探讨,结合GJB 5000B《军用软件能力成熟度模型》的换版思想及GB/T 36344《信息技术 数据质量评价指标》的规范性要求,为企业实施GJB 5000B四级或是数字化转型提供了数据保证。

数据质量保证是一项基础且繁复的工作,文章仅是笔者从实践的演变角度对标准的简单分析和研究,不能保证完全深入透彻地描述其背后的复杂情况,有待后续随着标准的进一步实施,发掘更多的优秀实践,指导各企业开展数据质量治理工作。

参考文献:

[1]蔡莉,梁宇,朱扬勇,等.数据质量的历史沿革和发展趋势[J].计算机科学,2018(04):1-10.

[2]甘似禹,车品觉,杨天顺,等.大数据治理体系[J].计算机应用与软件,2018(06):1-8.

[3] GB/T 36344-2018,信息技术 数据质量评价指标[S].北京:中国标准出版社,2018.

[4] GJB 5000A-2018,军用软件研制能力成熟度模型[S].北京:总装备部军标出版发行部,2009.

[5] GJB 5000B-2021,军用软件能力成熟度模型[S].北京:国家军用标准出版发行部,2022.

[6]涂菲菲,周明辉.软件开发活动数据的数据质量问题[J].软件学报,2019(05):1522-1531.

[7]周强.PDCA循环理论在外汇数据质量管理上的应用研究与实践[J].微型电脑应用,2017(01):62-66.

猜你喜欢
数据质量
电子商务平台数据质量控制系统及仿真模型分析
基于大数据背景下提高供电局数据质量对策分析
强化统计执法提高数据质量
浅析统计数据质量
金融统计数据质量管理的国际借鉴与中国实践
浅谈统计数据质量控制
企业统计工作之我见
统计信用与统计数据质量研究