档案数据内涵与特征探析

2020-10-26 06:56周可袁方王春芳兰日晶张雯
卷宗 2020年21期

周可 袁方 王春芳 兰日晶 张雯

摘 要:数字时代下的档案管理工作面临着诸多挑战,其中,对于档案数据的管理是保证企业档案管理工作顺利开展的基础。想要提升档案数据管理工作质量,相关工作人员首先需要对档案数据的内涵与特性进行了解。鉴于此,文章分析了档案数据的内涵,然后对其特征进行了深入研究,以供参考。

关键词:档案数据;内涵分析;特征研究

1 档案数据内涵解读

大数据时代,“档案数据”作为术语的独立性愈发显现,有必要对其内涵进行揭示和解析。第一,从内涵上看,档案数据首先属于档案信息,具备档案性质,满足档案的所有基本要求。“档案数据”是一个偏正短语,“档案”为“本”,“数据”为“形”,对于档案数据的定义应该以档案作为逻辑起点,切合档案管理范围,不能让“数据”的光环掩盖了“档案”的本来面目,以致脱离档案的性质而使其外延过于泛化和无限化。故而,“档案数据”一要具备档案的基本属性,包括原始记录性、历史性、社会性;二要具备档案的基本价值,包括凭证价值、参考价值,具有保存意义。第二,从外延上看,“档案数据”是一个广义的数据集合。由于档案数据来源构成的广泛、表现形式的多元,档案数据的外延比较广泛,不仅包括档案部门已经掌握和积累的各类数字化档案资源、电子档案等,还包括具有长久保存价值但还没有纳入档案部门保管范围的数据,如网络档案信息资源、社会档案信息资源、新媒体档案信息资源等;不仅包括内容、结构、背景等档案元数据,还包括档案部门在档案管理业务过程中产生的档案管理数据、档案利用数据、档案用户数据等累积性数据。第三,从形式上看,“档案数据”是数据化的档案信息资源,以数据形式记录和保存,能够为数据设备、数据技术识别和处理,在满足档案性质的同时也满足数据的一般属性,这是档案数据区别于传统档案信息的关键所在。本身就以数据形式存在的档案信息自然不需多加讨论,值得一提的是,对于传统类型的档案信息而言,只有经过数据化处理之后才可称之为真正意义上的档案数据。当然,定义一个新兴术语总是一件容易引起学术争论的事情,随着数据社会的深入推进,以及档案学与数据科学、档案工作与大数据的融合发展,档案数据的内涵可能还会出现新的阐释。

2 档案数据的特征研究

2.1 共生与互生性

档案数据就其来源而言虽然泛在而离散,但相关的档案数据本身却构成了一个共生共在的档案数据生态群落和生态圈。一方面,正如“传统数据源通常在最开始就被严格地定义。数据的每一个比特都有重要的价值,否则就不会包含这个数据比特”,档案数据百分之百是具有保存价值的数据信息记录,但是单条档案数据的价值密度往往较小,不足以反映问题全貌,发挥整体价值。“在大数据时代,无论是大数据还是所谓的小数据,以及各种各样不同来源的数据,彼此之间往往会存在互相依存和彼此验证的关系,彼此通过互相印证而实现各自的数据价值”,这其实与档案整理强调保持历史联系、维护档案齐全完整的精神是契合和相通的。档案数据同样需要保持其之间的有机联系,将同一活动中产生的一个个数据聚类成一个齐全完整的档案数据集。所以,档案数据应当关注以数据集为单位的价值密度较高的多元累积数据,特别在数据颗粒度较细、离散性较大的大数据时代,档案数据的這种共生性特点将体现得更为明显。另一方面,在共生之上,每一条档案数据其价值都与其他档案数据的价值以及其所在档案数据群落的整体价值相关联,每一个基于同一历史活动形成的档案数据在档案数据群落里进行着价值共享和互补,所有的档案数据群落又共同构成了档案数据生态圈,每一个独立分散的档案数据和分割的档案数据群落在档案数据生态圈中都发挥着独特的作用,相互关联、相互依存。档案数据的共生与互生性,要求档案数据管理必须重视档案数据整体价值作用的发挥,打造档案数据生态圈,实现档案数据的共享。一方面,挖掘档案数据之间的关联性,形成良性循环。档案数据关联的过程就是数据之间价值共享和互补、相互提升价值的过程,同时也是档案数据生态圈整体价值进一步提升的过程,实现档案数据价值创造的良性循环。另一方面,要注重档案数据的全体性,形成规模效应。档案数据价值的提升和增值需要从全体档案数据中挖掘和提炼,把各种分散的档案点数据和分割的档案条数据汇聚在特定平台和场景上使之发生聚合效应,构建块数据。“真正运用好全局数据,可以利用其进行合适的场景构建、匹配的场景连接和精准的场景洞察,这会真正赋予数据智慧。”所以,尽量收集全面而完整的档案数据,拓宽档案数据生态圈,打造档案数据资源体系,为档案数据关联提供更多空间和范围。

2.2 累积性

所谓累积性,即在累积达到一定程度后而产生状态改变、规模递增、程度加深及价值回馈等现象的演变过程。受数据化环境的影响,档案数据以相对独立的数据单元形式呈现更加明显,其累积性也更加显著。第一,从数据资源形态上看,在数据化时代社会活动当中形成的档案数据碎片化和细颗粒化明显,每一条档案数据都是反映数据时代真实活动面貌的组成部分,在同一活动当中形成的具有有机联系的数据经过不断累积从而形成数据群组,构成档案数据库。第二,从数据资源规模上看,由“数据”到“小数据”再到“大数据”的跃升,取决于数据累积,海量档案数据资源也正是通过对存量档案信息的数据化,以及有保存价值增量数据的不断采集、积累和沉淀而形成的,档案数据长期连续累积才能达到档案大数据的效果。第三,从数据资源价值上看,由档案数据全集中挖掘出的档案数据价值远大于单个档案数据价值之和,档案数据的累积性也就成为档案数据价值得以展现和提升的重要特性。此外,档案数据的累积性还从某个侧面暗示了档案数据的即时性和易逝性。“大数据时代的数据具有‘实时性,世界被实时记录的特征使得档案界不得不重视这些稍瞬即逝的具有社会价值的数据的长久保存。”大数据时代逝去的数据资源远比有意识保存下来的更多,有些甚至无法保存和抢救。由于数据记录的实时变化、社会活动的不断拓展、技术环境的更新换代及业务职能的更替转型等,档案数据生成变化加剧,如果不及时累积保存,便会造成档案数据流失和消逝,影响档案数据的完整性。档案数据的累积性作为其基本属性,是“档案大数据”建设的促成要素,也是档案数据价值充分实现的必要条件。档案资源建设应当在开展“存量数字化、增量电子化”的基础上逐步推进“总量数据化”,长期连续性地对传统档案资源进行全文本的数据转换、对电子文件和其他原生数字档案资源进行全要素的数据采集保存,积累丰富的、完整的、立体的档案数据资源库,建立档案数据生态集群,构建覆盖人民群众的数据档案资源体系。

3 结语

综上所述,加强电子档案的认知与管理工作,不仅关系到国家档案资源体系建设,更能够降低企业经营成本。企业领导在推进电子文件归档工作中,解决电子文件归档工作推进中的重点问题。同时,还应制定切实可行的管理制度来规范责任,明确职责,促进电子文件归档工作规范化、标准化、科学化。

参考文献

[1]赵春庄.大数据环境下档案职业发展研究[J].档案学通讯,2018(6):94-97.

[2]付启明.基于大数据理论的企业档案管理提升策略[J].档案天地,2018(11):31-33.

[3]周梅,查凤华,杨强.江苏核电电子文件管理信息化研究[J].档案与建设,2017(10):85-87,92.