云端数据治理定义解析

2017-08-23 06:36程广明李尧刘小茵
科技创新导报 2017年16期
关键词:数据治理云计算大数据

程广明 李尧 刘小茵

摘 要:分析了云计算环境下的数据的特点,提出了云端数据治理定义,并将该定义分解成三个部分进行深入解读,最后对比了云端数据治理与传统数据治理和大数据治理在概念上的区别与联系。

关键词:数据治理 云端数据治理 大数据 云计算

中图分类号:TP274 文献标识码:A 文章编号:1674-098X(2017)06(a)-0185-02

在传统数据治理领域,国际数据管理协会(DAMA)、数据治理研究所(DGI)、IBM、CMMI研究所、Gartner、普华永道等组织提出了多种数据治理框架或数据治理模型[1]。云计算环境下数据特点发生了很多的变化,尤其是数据在云端的操作给数据治理带来了很多新的内容,如云端数据来源的多样性、云端数据的远程存储与传输、云端数据的合规要求更复杂性、云端数据面临的安全威胁更多等,都超越了传统数据治理的范畴。

1 云端数据治理定义

云端数据治理是以云端数据为主要治理对象,制定与云端数据战略、数据管理、数据优化、数据安全与隐私保护等相关策略,指导组织规划、构建、评估和优化数据治理体系的活动集合。

我们将上述云端数据治理的定义分解为以下三个部分。

(1)云端数据治理的主要治理对象为云端数据。

随着云计算的广泛部署和深入应用,现阶段及未来相当长一段时间内,根据数据的存储位置划分,数据可以分为本地数据和云端数据。数据本地存储是互联网发展起来之前数据存放的主要形式,此时的数据量是相对较小的,组织对其管理也相对比较容易。随着互联网、云计算等技术的广泛应用,越来越多的用户选择把数据存储在云平台上。

云端数据主要来源于两大部分:一是组织本地数据向云端的迁移,二是云端自身数据的聚合。从数据成分上来看,云端数据除了是传统格式化数据外,更多的是半结构化和非结构化数据。

(2)云端数据治理关乎云端数据战略、数据管理、数据优化、数据安全与隐私保护等相关的策略。

云端数据治理关乎策略策的制定,这些策略成为开展数据治理的指导文件和措施依据,包括数据治理战略、数据管理策略、数据优化策略、数据安全与隐私保护策略等。

战略是一项活动的宏观性纲领,是一种从全局考虑谋划实现全局目标的规划。数据治理战略是对数据治理活动的顶层设计和远程规划,其目的是在数据治理活动得到数据治理相关者的理解和认同前提下,对未来一段时间内数据治理活动规划。

数据管理是对数据进行基础规范以支撑数据治理整个活动的实施,涉及业务术语、元数据管理和主数据管理等。业务术语是数据治理的基础,是为了获得组织对某项事情有个统一的认识。例如,对数据治理成本的进行估算时,究竟是采取以“万元”为单位还是以“元”为单位,又或是当进行数据整理时,小数点后数值保留几位,要不要“四舍五入”还是“取整去零”等。

云端数据必须优化,不是所有数据都是可以直接使用的。一方面,云端数据拥有大数据所具有的特点,数据体量大、结构复杂,造成数据价值密度低,所以必须对云端数据进行优化。另一方面,为了最大程度上发挥数据的价值,也必须对数据进行整理优化,通过数据聚合分析发挥单体数据所不能体现出来的价值。数据质量管理、数据操作、数据架构都是为了实现数据优化而进行的数据治理措施。

(3)云端数据治理是一套包含规划、构建、评估和优化的活动集合。

云端数据治理是依据制定的各项策略对云端数据进行治理的活动集合,为此组织需要建立一个完整的数据治理体系,覆盖统筹和规划、构建和运行、监督和评估、改进和优化四大阶段[2],促进云端数据治理的落地以实现既定目标。组织云端数据治理体系基本框架如图1所示,该图展示了云端数据治理的四大阶段,以及每个阶段组织需要开展的主要工作。

统筹和规划阶段是云端数据治理活动的前期准备阶段,其目标是要统筹和规划数据治理目标和任务,谋划必要的治理环境,做好数据治理实施的准备。构建和运行阶段是云端数据治理策略的实施阶段,其目标是构建数据治理实施的管理机制,确保数据治理实施的有序运行。监督和评估阶段是云端数据治理实施效果评估的阶段,其目标是监督云端数据治理的实施过程,评估云端数据治理实施的符合性和实施的质量。改进和优化阶段是云端数据治理的过程和结果提升阶段,其目标是促进组织持续改进云端数据治理实施的过程,提升治理实施的有效性。通过策划、实施、检查和调整(PDCA)的活动循环,持续改进云端数据治理体系,因此云端数据治理是一系列活动的集合。

2 云端数据治理与传统数据治理的区别与联系

云端数据治理本质上也是数据治理,是数据治理在云计算环境下的一个新发展方向,但是由于治理对象特点的差异,二者又存在着诸多的不同。表1简要概括了云端数据治理与传统数据治理和大数据治理在概念上的关系。

3 结语

云端数据治理是数据治理理论在云计算环境下的最新发展,但是治理对象的差异性特点使得云端数据治理被赋予更多新的内涵。首先,云端数据治理的对象主要为聚集在云端的数据;其次,云端数据治理关乎云端数据战略、数据管理、数据优化、数据安全与隐私保护等相关的策略;再次,云端数据治理是一個包含规划、构建、评估和优化的治理管理体系。

参考文献

[1] 程广明.大数据治理模型与治理成熟度评估研究[J].科技与创新,2016(9):6-7.

[2] 李尧,程广明.云端数据治理初探[J].科技创新导报,2017 (1):96-97.

猜你喜欢
数据治理云计算大数据
实验云:理论教学与实验教学深度融合的助推器
大数据治理模型与治理成熟度评估研究
大数据时代城市治理:数据异化与数据治理