基于档案数据观的企业档案治理创新

2020-10-21 09:26谢国强黄新荣马云曾萨
档案与建设 2020年8期

谢国强 黄新荣 马云 曾萨

摘要:档案数据是企业档案治理的基石,对企业治理具有重要作用。文章在对档案大数据研究总结的基础上提出档案数据观的理念,指出档案数据观视域下企业档案数据治理的主要内容,分析档案数据对企业档案管理在管理理念、管理对象、工作流程等方面带来的挑战,提出通过治理理念创新、管理模式改革、技术手段升级、服务方式优化、合作方式改进对企业档案治理进行突破。

关键词:档案数据观;档案数据治理;企业档案治理

分类号:G270.9

大数据时代,各行各业竞相通过云计算、物联网、智慧工程等技术对数据资源进行收集、处理和利用,实现数据价值,提高组织的核心竞争力[1]。档案作为企业工作活动的记录,管理对象从传统的文件档案降维到数据,档案大数据、数据态等新概念不断产生,有必要更新档案观念和档案管理理论,提出档案数据观,以加强档案数据治理,提高企业档案创新能力。

一、档案数据观的提出

目前,檔案与数据有着密切关联已经是学界共识,提出档案数据观,有利于指导数据态环境中档案治理工作。

档案是人类在社会活动中直接形成的有保存价值的各种形式的历史记录,在不同时代有不同的表现形式,大数据时代,档案的表现形式之一就是数据。数据与档案数据并非无边界,只有在业务活动中直接产生、记录了业务活动过程的数据,才能成为具有记录性的数据即档案。传统的档案以模拟的文字和实物载体来承载信息,信息时代承载记录信息的形式和载体越来越多地表现为计算机能够处理的数据,具有记录作用的数据就是档案数据,档案和数据之间是一种交叉关系,档案数据即是以数据化形态表现出来的记录信息。

随着技术的发展,数据管理已经从小数据时代进入以云计算、智能分析、物联网为基础的大数据时代,档案管理的未来便是以数据为生产资料,以大数据技术为手段,以大数据分析为生产力,在档案数据观的指导下挖掘数据关联,对档案数据进行治理。因此,档案数据观实际上也是档案大数据观。

档案数据观重新定义了档案和数据之间的关系,认为凡是记录数据,也是档案,将数据纳入档案管理的范畴;档案数据观认为信息时代,档案管理的形态必将向数据管理方向发展,传统的档案必须由实体变为数字,进一步变为数据,才能方便利用和管理;档案数据观认为档案管理必须引进数据管理和大数据治理的先进技术和理念,才能胜任新时代记录保存工作。

二、档案数据观下企业档案治理的内容

档案数据观倡导档案管理向档案治理方向转变,《全国档案事业发展“十三五”规划纲要》也提出加快完善档案治理体系,提升档案治理能力[2]。档案数据观指导的企业档案治理,主要包括三方面内容。

1.对档案数据的治理

一是保障数据的真实性、可靠性。运用生命周期管理的理念对企业数据进行全程管理,利用元数据、区块链等技术,数据筛查、数据处理等手段保障数据的真实性、可靠性。

二是保障数据的全面性。企业各类业务系统中的记录数据、数字档案馆运行中的监控数据、档案用户的服务记录数据等亦是档案数据,和传统纸质档案、电子文件具有千丝万缕的联系,也是企业档案数据治理的重要对象。

三是关注数据的关联性。档案数字化基本完成了从实体管理到信息管理的转变,进一步的数据化更注重描述业务逻辑规则和管理规则,在海量的数据流中发现数据的关联,挖掘数据价值。

四是重视数据的可用性。既要有联通其他业务系统、数据库系统进行数据交换的能力,也要有融合交换所得的数据开展档案数据应用的能力,推进企业内部整体信息系统互操作能力。

五是注重数据实时价值和历史价值。既要实时传输数据,通过主动捕获引擎、嵌入式工具集进行智慧收集、监督,也要实现各种类型历史沿革数据永久在线,满足对历史数据的利用。

2.运用档案数据进行治理

传统的档案管理重视业务留痕、证据保存,而档案数据治理的核心是把数据变成资产,在原始记录数据的基础之上,对各类档案数据进行汇集,形成数据仓库,建立数据模型,发现数据之间的关系,为企业的各项业务提供支撑。原始数据是数据治理的基础,只有拥有海量、全面、可靠的原始数据,才能在此基础上构建中间层数据、建立模型、发现关系,进而影响决策。

运用档案数据进行治理要求档案部门盘活档案库存,构建企业数据平台,根据原始数据制定主数据库,挖掘不同主题数据,形成数据关联,深入到档案文本内知识单元挖掘,将档案由实体管理上升到知识管理。围绕主数据库,形成数据评价、维护、分析等数据治理模块,加速融入企业档案治理环境。

3.对档案数据环境的治理

档案数据自产生起就呈现多源化、多平台、多部门的特点,对于档案数据环境的治理强调顶层视角,要确立法律层面的保障、基础设施的投入等。从企业的角度,档案部门、业务工作部门、信息技术部门、数据分析部门等主体共同完成档案数据环境的治理。建立档案部门负责、各方面共同参与的档案工作体制,确保分工明确、密切配合,并支持企业、社会组织和个人依法设立档案事业发展基金的多元治理[3]。数据管理协会(Data Management Association,DAMA)的治理框架中同样包括基本的环境元素如角色和责任,支持性环境元素如实践方法和技术工具共七个环境治理要素[4]。许多企业已经探索在企业中设立首席数据治理官(Chief Date Officer,CDO)来应对越来越复杂的数据治理环境[5]。

三、档案数据观对企业档案管理带来的挑战

档案数据观不仅是把数据纳入档案管理的范围,更是要引进大数据治理的相关理念和技术对档案管理进行改造,档案数据观对传统企业档案管理的挑战如下:

1.管理理念上原始性与模糊性形成冲突

传统的企业档案管理在理念方面讲究保存档案证据价值,注重保持档案的原始性。档案数据观下,原始记录性仍然有其价值所在,只是随着企业工作中数据需求的增多,数据管理愈加复杂,海量数据呈现的相关关系具有模糊性,不如因果关系一般直接明了[6]。这种模糊性表面上使得原有的分类秩序被打破,实则是对捕捉到的可能有用的数据进行精确地计算,进而呈现出非一对一结果。比如搜索引擎页面上最佳位置的广告常常能激发用户兴趣,其实是通过用户偏好、地理位置、历史点击计算得出。凯文·凯利在《必然》中提到一切皆可追踪,但一切又在追踪的基础上进行重混[7],企业档案的原始数据面临的冲突正是如此,不同来源的原始数据虽然已经汇集,但更要注重构建数据集进行关联分析产生新的数据。未来以原始数据为底层,分析加工数据为中间层,可用数据为应用层的档案分层管理才是主流[8]。

2.管理对象上文件向数据单元的快速过渡造成矛盾

传统企业档案管理的对象是文件,模拟态环境重在维持档案文件实体的秩序,数字态环境重在对电子文件内容、背景、结构信息的可信保存[9]。目前的企业档案工作处于模拟态向数字态转化中,管理对象从模拟信号向数字信号变迁,再向大数据的管理单位——数据单元演化。外在表现虽是从文件到数据单元,内在核心则从载体延伸到规则,关注业务流程本身的逻辑规则。多态并存带来的冲突,以数据管理的不成熟性为主要矛盾,数据管理所需要的各类数据仓库都是来自各类业务数据库的数据记录,没有这些原始的数据记录,数据分析就成了无源之水,但这些海量的动态数据在长期保存时遇到许多新的模式,NoSQL、分布式存储、云计算和边缘计算等模式层出不穷,孰优孰劣还在被验证、审核。更忧心的是,ZB级乃至不断扩容的数据量的存储、引擎运算能力和运算速度的压力、数据迁移等环节的安全问题尚未解决,精细化的管理如摸着石头过河,在积攒经验教训中前进。

3.工作流程上保持原貌对创新需求供给不足

传统的企业档案管理在工作流程方面注重保持档案原貌,业务工作人员和档案工作人员在收集、整理、归档等环节强调档案外在形态的客观性,重点发挥其凭证、参考、情感三个基本作用[10],为解决实际问题、分享显性知识案例、激发认同情感等奠定了基础。而档案数据观要求档案工作和数据分析工作高度融合,档案工作者既是档案数据管理者,也是元数据的提供者,供给可靠、高质量的原始数据将纳入其责任范围。档案数据观注重对数据全生命周期管理,档案工作的重点从后端档案保存拓展到前端业务部分,需要前端参与业务规则、业务流程制定,过程中保障数据真实,后端提高数据质量,进行数据利用,创造数据新价值。创造档案的数据新价值,通过大数据分析技术完成数据作用的发挥满足多样化需求模式,对后保管时代的企业档案工作者提出了更多的要求。

4.工作时效上历史数据与实时数据侧重不同

传统的企业档案管理在工作时效方面偏重历史数据的管理,通常在每年3—4月对上一年度的档案进行整理或在业务项目结束后跟进整理。历史数据的整理时间稍显滞后,容易错过数据现行价值、半现行价值、非现行价值间的价值转化机遇。档案数据观下,实时数据在自动统计数据、跟踪项目进度情况、计算工作量和同步更新等方面的优越性展现出来,但随着企业业务工作范围的扩大,实时数据的井喷,如果不能及时保存关键实时数据,历史数据来源环境将会模糊,就会影响数据的完整性、可靠性,如果不将关键实时数据归档,大量历史数据的累积也会影响实时数据的效率。历史数据和实时数据都有其价值所在,都是企业数据资源池的重要组成部分,需对二者进行分类治理,相互关联,方能精准服务于决策。

四、档案数据观下企业档案治理的突破和转变

档案数据观下,企业档案数据是企业生产经营的重要资产,档案部门实现多态化管理,由文档中心、知识中心向数据中心转变,需要在理念、模式、技术、服务等方面进行突破。

1.治理理念创新

档案数据观将传统的档案拓展深入到数据颗粒单元,档案数据体量、范围、类型都随之扩大,对档案数据进行治理,应树立顶层治理理念,在顶层设计的框架下,对档案数据进行分类治理。

建立档案数据治理的顶层治理架构,形成企业档案数据治理金字塔体制。档案数据治理跨业务、跨部门、跨系统,需要跳出传统档案视野,站在企业全域的层次进行统筹。明确各个部门档案数据的治理责任,明确档案数据的治理效力,并将档案数据化纳入企业信息化发展规划与绩效考核。

针对档案数据,分而治之。档案数据可以形成多个分类:结构化数据与非结构化数据、历史数据与实时数据、系统数据与业务数据,对不同类型的档案数据治理,各有侧重,结构化数据注重元数据规范,非结构化数据注重数据规则,历史数据侧重盘活,实时数据侧重系统对接。

根据企业档案数据的实际,明确档案数据治理的内容,可以从管理层、业务层、技术层分层落实治理工作,管理层注重规则制定,业务层注重需求分析,围绕职能主题从项目、参与人员、产品、制度等进行多维分析,确定治理职责与范围。技术层根据档案数据生命周期,提供不同技术支持,如档案数据产生阶段,注重改变数据收集方式,档案传输阶段注重数据安全。

2.治理模式变革

档案数据观指导下的企业档案治理,在治理模式上需要变革,建立多中心协同治理新模式,以档案数据治理为契机,带动企业档案治理。

在档案数据治理方面实现多点多层级协同架构,以构建企业档案数据中心和区域分中心作为重点,建立“1+N+X”模式[11]。对于集团企业,可以在总部建设云模式的数据中心,保存业务数据,完成平台搭建、业务集成、规则构建、数据管理等工作。要求档案数据系统无缝嵌入日常业务系统,在档案管理平台与其他业务系统数据一体化采集接口的基础上,规范业务处理流程、数据采集标准。集团二级和三级单位建立N个档案数据管理网络,衔接总部数据系统,实现数据云保存、云利用,如中石油数据中心,包括集团级、区域级、公司级三个层级,横跨两地三中心,对接档案系统在内的多个系统,数字档案馆在云平台上进行设计、开发、建设及应用工作,统一由云平台提供数据计算资源和存储资源[12]。小型企业由于生产、管理、销售等业务的网络化,也逐渐将其業务系统云化,即采用SaaS模式对业务数据和档案数据进行管理。

以档案数据治理为关键,借助档案数据中心,实现企业全局档案治理变革。以档案数据生命周期为切入,定义业务问题,创建档案数据路线图,在组织蓝图的基础上,建立档案数据字典,利用元数据保障数据可用性,根据档案数据不同类型,定义度量指标,建立主数据库,划分管理人,分阶段实行档案数据评估,保障不同部门任务重点,实现不同部门的数据协同。

3.技术手段升级

万物互联时代,档案数据观要求将云计算技术、区块链技术、数据分析技术等与档案相结合,完成从纸质档案、电子文件到档案数据的降维治理。从节约治理成本的角度出发,大型集团更宜采用云模式的档案数据中心,将分布在本部和各级单位的计算机资源整合在“云”中形成一个整体,把硬件和软件作为资源封装为服务,通过网格计算、分布式计算、并行计算、网络存储等技术,满足员工直接通过网络按自身需求访问和使用。从克服企业档案数据的“信任危机”出发,弥补PKI/CA技术加密认证的不足,探索基于区块链平台的档案存证系统,借助Hyperledger(超级账本)和Fabric创建开源、分布式账本框架和代码库,搭建企业私有链达成各层级单位的协议[13],如中国交通建设股份有限公司可以选择北京、西安、武汉、成都、广州五个节点搭建私有链,对电子档案进行存证与验证,则归档、借阅、利用等信息都能基于关键值进行追溯。

档案数据治理从大处落脚,利用先进技术之外,也要着眼于细节,通过成熟的技术改善数据收集、数据处理、数据输出方式。如中石油研发基于安卓的井控信息处理系统,将传统的手工收集数据转变成规范化的原始的电子数据。利用手机APP等技术,集成企业多方面业务,实现一站式数据处理[14]。在治理过程中,注重元数据技术的应用,处理行政、业务、后勤各系统数据异构化的矛盾,避免数据重复录入,实现数据自由流通。

4.服务方式优化

档案数据观的精细化理念要求企业转变粗放的服务方式,做到线上服务和线下服务结合,查询服务和咨询服务结合,文档服务与数据服务结合。

为做好个性化、精准化服务,以需求为引导,建立用户基本信息、信息偏好、服务信息三个层次的系统用户模型,收集用户档案数据使用的体验、建议与意见,针对不同应用偏好,提供不同服务产品,不断改进用户体验。

根据大量档案数据与用户数据,优化线上服务方式,搭建具备智能语义分析、知识图谱关联、智能引导、自定义框计算等特色的智能档案检索平台,分析预测档案用户需求。

服务成果则从文档服务向智库服务过渡,梳理项目档案、政策文件、专家建议、专题档案等文档,借助机器学习、聚类分析、可视化等技术实现文本内知识挖掘,真正将历史数据盘活,贯彻信息、知识、数据(IDK)原则,真正实现DIKW模型所描述的智慧状态[15],为企业决策提供智力支持,真正做到用档案数据进行治理。

5.合作方式改进

档案数据治理建立起来的档案数据治理链条,搭建了企业业务部门沟通合作新桥梁,是企业全盘合作治理的过程。为提升档案数据治理水平,企业需要主动出击,与企业以外的机构展开多边合作。与高校、科研机构合作既可以开展企业档案专项、专题研究,撰写务实性论文,提升档案部门整体学术水平,也可以同高校达成长期协议,为学生提供参观场所、实习基地、调研地点,在理论和实践层面达成双赢,实现档案界产学研的成果转换。和软件公司合作则注重技术性业务,不断改进档案数据备份、恢复、修复、交换技术,甚至对部分档案数据存储归档进行托管,节约企业在软硬件设备投资的成本。

*本文系2017年中交第二公路工程局有限公司和西北大学档案咨询服务项目(项目编号:201701)阶段性研究成果。

注释与参考文献

[1]金波,晏秦.数据管理与档案信息服务创新[J].档案学研究,2017(6):99-104.

[2]国家档案局.全国档案事业发展“十三五”规划纲要[EB/OL].[2020-04-19].http://www.saac.gov.cn/daj/xxgk/201604/ 4596bddd364641129d7c878a80d0f800.shtml.

[3]国家档案局.关于加强和改进新形势下档案工作的意见[EB/OL].[2020-04-21].http://www.saac.gov.cn/daj/xxgk/201405/ 1d90cb6f5efd42c0b81f1f76d7253085.shtml.

[4]InternationalDAMA.TheDAMAguidetothedatamanageme ntbodyofknowledge[M].BaskingRidge,NJ:TechnicsPublications, 2009.

[5]Erwin.企业架构和数据建模[EB/OL].[2020-05-20]. http://www.erwinchina.com/uploadfile/2018/0720/2018072001112 0216.pdf.

[6]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代[M].杭州:浙江人民出版社,2013:88.

[7]凯文·凯利.必然[M].北京:电子工业出版社,2016:225-226.

[8]马云,黄新荣.论档案真实性的维护——基于欧盟GDPR“删除权”的分析[J].档案与建设,2019(7):8,9-13.

[9]钱毅.从“数字化”到“数据化”——新技术环境下文件管理若干问题再认识[J].档案学通讯,2018(5):42-45.

[10]丁海斌.档案价值论[J].档案学研究,2015(5):4-12.

[11]黄新荣,曾萨.边缘计算对智慧档案馆建设模式的影响研究[J].档案学研究,2018(6):78-84.

[12]何思源.当“概念”变为“现实”:跨上云平台的中国石油档案工作调研纪实[EB/OL].[2020-08-01].https://mp.weixin.qq. com/s/RZHiHlFia-iLe5c56ucM1A.

[13]李春艳,乔超.区块链技术在大型企业集团电子文件管理中的应用——以中国石化为例[J].档案学通讯,2020(1):13-20.

[14]王强,高强.数字转型单轨切换:中国石油数字档案管理系统特色与功能实现[EB/OL].[2020-07-17].https://mp.weixin.qq.com/s/fVRPEu4NFdMsQDcVw8KqRg.

[15]黃璜.数字政府的概念结构:信息能力、数据流动与知识应用——兼论DIKW模型与IDK原则[J].学海,2018(4):158-167.