基于U型曲线重新审视档案信息化工作

2023-07-06 13:06钱毅
档案与建设 2023年4期
关键词:档案信息化

摘 要: U型曲线展示了档案信息化进程中的主要资源形态的变化,包括模拟态、数字态、数据态、知识态、价值态在内的五态对象空间。文章基于U型曲线对档案信息化进行大图景的宏观指导与趋势分析,将档案信息化划分为实体管理、数据管理、知识管理与叙事管理四大领域,并提出了应用U型曲线指导工作应具备的连续观、内容观、平衡观、生态观等关键理念。

关键词:档案信息化;U型曲线;指导理念

分类号:G270.7

档案信息化工作要素繁多、内容庞大,其研究层面和触角也越来越丰富。学界对档案信息化的整体性研究日益升温,在标准体系[1-2]、生态研究[3]等方面都展开了较为深入的研究。但总体而言,这些大都属于“实然”层面,缺乏从“应然”视角进行全图景式的研究。档案信息化工作是需要统筹兼顾、上下衔接的漫长过程,从长期视角看,开展全图景研究可以帮助厘清工作的脉络和主线,避免阶段性的工作决策失误。

笔者曾聚焦技术变迁环境下档案资源形态的变化,在2017年的电子文件管理论坛上首次提出“三态两化”观点,其中的概念与提法也获得诸多同仁认可。但三态并没有涵盖档案信息化涉及的所有资源形态,尤其近年来数据科学、档案语义与智能化研究迅猛发展,在数据态的基础上有了更多的实践与理论探索。为此笔者进一步提出了“U型曲线”理论,希冀在更大的图景中更为全面地展示档案资源形态及其衍生变化。依托U型曲线整体图景视角,可以辅助进行技术的选型决策,推动技术发展与档案信息化工作同频共振,增强信息技术赋能与深度管理。

1 利用U型曲线对信息化进行大图景分析

1.1 档案信息化需要通过图景研究明确动力机制

档案信息化需要明确发展的动力机制,为此需要开展图景研究,而非单纯跟随技术趋势起舞。究其原因,其一是信息化已经成为业务工作的底座,为业务的开展提供了系统、平台、资源等基础,以至于将信息化与业务工作进行剥离基本是一件不可能的事情。由是信息化的整体发展方向兹事体大,对信息化走向的判断在很大程度上影响档案工作的整体发展。其二,快速迭代变化升级是信息技术领域的显著特征,导致档案信息化的工作内涵本身处于较为旺盛的新陈代谢之中,如何在变化中寻求“不变”就成了档案信息化宏观管理的内核问题,把握变化发展的方向就成为必需。

早期档案信息化研究中的阶段划分方法总体比较粗糙,相对陈旧,多以工作内容导向罗列为主,缺乏方向性指导。官方文本对信息化阶段的划分总体是缺失的、模糊的,近年来的档案规划对信息化阶段划分亦着墨不多,缺乏理论上的指导意义。学界对于信息化的阶段划分研究亦未能深度展开,多数穿插在资源场景与系统开发方法中。陈涛等[4]以图像资源为对象提出了“数字化—文本化—数据化—语义化—智慧化”的开发路径。牛力[5]和张卫东[6]聚焦数字人文环境,分别提出“发现—重构—故事化”的档案研究路径与“数据化—情境化—故事化”的红色资源开发理念和技术应用原则。曾蕾[7]通过图档博机构案例推演出“数字化—数据化—语境化”为主的文化遗产资源数据开发阶段。杨智勇[8]结合国家治理体系背景梳理了数字档案馆建设中“数字—数智—数治”三个阶段,王可欣[9]则进一步提出数字档案馆“数据化、知识化、智慧化”的差异化分层能力发展方向。总体而言,类似的阶段划分研究多数停留在概念层面,未对其内涵尤其是变化机制展开系统论证,大多是结合具体资源类型与场景,或者出于系统建设需要进行的工作划分,且均未能覆盖档案信息化结合的全场景,指导意义受限。

1.2 U型曲线从资源形态变化角度揭示了档案信息化工作的演化机制

笔者不揣冒昧提出了U型曲线(如图1),力图对档案信息化进行全景式定位与研究。该曲线阐释了档案资源形态从人可理解,到机器可处理,再到人机可共读的语义回归特征,展现了数字化、数据化、语义化、故事化的递进式处理,以及从物理实体控制、概念实体表达与记忆实体再現的发展脉络。U型曲线呈现了档案信息化进程中的主要资源形态,包括模拟态、数字态、数据态、知识态、价值态在内的五态对象空间,也集中体现了相关技术与研究的迭代,包括从模数转换、对象描述、本体建设、关联数据到档案叙事。U型曲线可视为三态观点的延伸与增强,跳出了纯粹从档案资源信号和语义的连续与离散属性来观察的角度,着眼资源形态与语义之间的关系,通过“人—机—人”机共读的U型曲线实现语义回归。U型曲线所涵盖的五大资源态别与四大阶段之间具有较强的内在连续性,能够用于对档案信息化工作进行大图景的解读与指导。

2 基于U型曲线用于指导档案信息化工作内容

常言道,信息化是个筐,什么都可以往里装,因而档案信息化内容的划分角度显得尤为重要。档案信息化惯常采用要素法将工作划分为基础设施、信息资源、应用系统、标准规范、安全保障以及人才队伍等六大要素。这种划分法边界较为稳定清晰,事实上也行之有年,但随着对象复杂度增加,核心要素自身均存在较大幅度的变化,要素之间的关联变得不容忽视,这种静态的要素划分方法需要重新进行适用性审视。U型曲线兼顾了发展的动态性和信息化要素的稳定性,笔者尝试依托其进行信息化工作的划分,拟结合U型曲线设计的四大阶段与各自附着的态别对象对档案信息化工作内容进行指导划分。

2.1 实体管理:模拟态+数字化

本阶段工作内容主要解决实体对象及其空间管理与转换问题。在信息化工作视角下的实体管理内容基本等同于模拟态管理与数字化工作,属于最基础性的工作,是从物理空间转向数字空间的“数字转型”工作的第一阶段任务。此处所谓“实体管理”并不是指传统的手工管理(如上架、整理、装订),而是通过信息技术赋能后围绕档案实体及实体空间所进行的一系列技术服务。

本阶段工作内容着重解决档案实体有序化、实体空间管理、实体对象数字化等领域问题。具体包括:(1)实体序化管理。即围绕档案实体开展的各项标识和信息化处理工作,实现对大规模实体对象的有序化管理,并为后续的各项信息技术服务进行前期基础准备,包括标识、整序、保护、目录数据库建设等。(2)实体转化管理。即通常所谓的存量数字化工作,根据数字化处理结果可以大致分为初阶与高阶数字化。初阶数字化是档案信息化的“入门级”工作,其工作内容是获得文件级的档案数字化副本,以及在此基础上进行的功能拓展和系统开发。高阶数字化是在初阶数字化基础上进行必要的字符和/或语音识别,形成便于计算机处理的文本形态。初阶数字化得到的文件级图像副本在语义上是粗糙的,以文件为单位的功能处理集合是有限的,故而需要高阶数字化进行面向机器的文字解析,便于进一步分析处理。(3)实体空间管理。即对档案实体空间(包括整体建筑、库房、装具等对象)进行技术赋能。从档案信息化历史来看,借由物联网、感知技术的逐渐成熟与普及,实体空间管理的信息化水平得到空前提升,近年来库房管理智能化相关研究开始逐步兴起。

必须要提及的是,由于本阶段几乎是所有机构档案信息化的入门阶段,需要开展较大规模的技术准备与资源投入,对传统手工档案管理模式带来巨大冲击。对既有知识结构的解构、学习曲线的陡升以及信息化初期不可避免的市场震荡,在形式上构成了大多数人对档案信息化的基本印象。同时,由于技术自身的迭代,要素变化就像海水冲击着沙滩,反复覆写,这个过程所展现的技术变迁、理念冲击、范式调整等对档案工作的影响是极为深刻的。

2.2 数据管理:数字态+数据化

数据管理涵盖数字态管理与数据化相关工作,承担打造数字空间和数据空间的任务。数字态管理可视为构建可信数字空间的长期建设过程,数据化是基于数字态对象进行的面向机器处理的不同层级的解析。该阶段力图实现从“生文件”到“熟数据”的嬗变,与数据科学产出的各类技术与工具进行衔接,为档案开启语义与知识层级的应用奠定基础,是实现电子档案从可读到可信、从可信到可用的关键。

该阶段涉及的核心问题包括:(1)数字态对象可信管理。可信管理是数字空间“档案化”工作必须具备的基础能力,是构建数字信任机制和数字社会生态发展的关键,[11]涉及基础设施、应用系统、标准规范和安全管控等档案信息化核心要素,是电子档案单套制管理需要具备的核心能力。由此,ERMS与TDR系统的建设、数字资源长期保存、电子安全管理体系、信任基础设施建设等都是本部分工作尚待建设与完善的主要任务。(2)存量档案数据化。笔者将本部分工作归纳为表层数据化和深层数据化,表层数据化是指依据相应著录规则和元数据方案对数字档案资源进行描述后获得的规范化数据,如依托DA/T 46-2009、DA/T54-2014、DA/T63-2017分别对文书类、照片类和录音录像类档案进行描述的工作。表层数据化工作奠定了档案数据的基本面,该工作的规范化程度、质量与规模对档案信息化的高质量发展举足轻重。深层数据化则是通过元数据增强、自由标注等方式获得对档案内容对象的画像级描述工作。数据化工作通过规范置标、自由置标,甚至借由NLP技术支持的文本解析获得大量的解析数据,为后续语义的生长提供基础。(3)增量数据档案化。本部分工作是研究领域开始日渐升温的业务数据档案化问题,如电子政务数据、三维数据、数据库对象的归档与管理问题。陈永生2019年对互联网政务服务环境下文件管理进行过系统阐述,发现该环境下原生性电子档案的记录方式已经从文件材料细化为电子数据条目,需要对业务档案的背景和结构关联加以固化,否则这些数据形式记录的电子档案内容解析将“失去情境”。笔者也认为高态别(如数据态)实现凭证功能需要在系统中进行“长链”处理[12],其实现路径之一就包括按照约定证明模板将离散数据整合成语义连续且受认可的原件形式。

2.3 知识管理:数据态+语义化

本阶段实现从数据到知识的语义管理,具有明显的语义增强特征,所构建的语义空间是档案对象经充分语义化构建和重组之后形成的资源空间,立足解决离散数据语义问题。该阶段建设内容可从语义能力与语义基础设施建设层面进行体现。

(1)语义能力建设。本部分需要具备建设语义台阶的语义编织能力与深度应用数据科学的数据处理能力。语义编织能力基于深层数据化的工作,通过本体建设、关联数据组织、知识融合等语义台阶的逐步建设,推动语义封装程度递增,使档案内容对象朝富语义方向发展,尤其通过推动基于档案对象领域构建的本体工程建设,逐渐获得理解档案背景的“知识面”。

(2)语义基础设施建设。语义增强工作需要进行大量的实体对齐、语义对齐、知识对齐,这些都需要基于档案与其他资源类别之间进行语义基础设施的建设和复用。当前联合美术馆、图书馆、档案馆、博物馆(GLAM)等机构统筹建设语义基础设施的观点已成共识,在诸多数字人文项目中有所体现。[13]档案界也开始认识到这类语义基础设施建设的重要性,开始了初步探索。山东省档案馆“基于智能词表的电子档案和政务数据深度挖掘技术及应用工具研究”项目通过《中国档案主题词表》进行了《文书档案专业词表》的建设工作,将其用作政务数据知识组织的基础工具。江苏省档案馆在“基于语义分析的档案馆划控开放智能鉴定研究”项目研究中初步建设了鉴定规则库。中国人民大学“基于多维语义理解的档案智能开放审核平台”项目也构建了鉴定敏感词句语料库。

2.4 叙事管理:知识态+故事化

叙事管理是建立在整体语义理解的知识态空间基础上进行的构建相关文化与价值空间的过程。叙事管理服务于作为主体的人與档案内在价值的实现和互动,将对档案资源的感知转化为人的认知。叙事管理要求具有一定的智能数据编研能力,不是相对简单的文件汇编和内容编排。档案领域需要探索如何就资源中的“记忆实体”与用户进行有效沟通,目前数据科学将其视作“最后一公里”的议题开展研究。得益于开放获取等便利条件,目前叙事管理的研究场景多数集中在数字人文领域。

叙事管理涉及认知科学、信息图形学、可视分析学和数据科学等多学科交叉研究领域。开展叙事管理需要密切关注受众的认知结构和知识水平,构建以人的认知为中心的叙事模式。目前已有数据驱动型、可视化、分析型、交互式等多种故事化模式[14],通过情景仿真、数据可视化、语音合成、虚拟现实、增强现实、全息投影等手段进行叙事。考虑到近期以ChatGPT为代表的AIGC迅猛发展的态势,叙事管理的未来拓展空间值得期待。

3 应用U型曲线指导档案信息化应具备的基本理念

U型曲线以档案资源形态变化为主轴,用于对档案信息化进行全景式观察,它不单纯是发展阶段的趋势描述,也可以从多个角度综合把握信息化发展的节奏与脉动。在应用其指导档案信息化工作时,同样应避免仅从工作阶段角度看待,应秉持连续观、内容观、平衡观、生态观等多种理念。

3.1 连续观

连续性是信息化自身演进的核心特征,不单体现在时空层面前后相续的线性关系,更是其内在一致性的体现,因而需要用连续观来指导档案信息化。形式上可将U型模型视为瀑布模型,即相邻阶段发展应当是连续的,离散跨越的可能性很低,从而要求夯实基础、稳打稳扎,认识到经由量变方能带来质变,那种毕其功于一役的阶段性思维是需要高度警惕的。

连续观的内涵可以从多角度进行观察。其一是资源态别变化的连续性,作为U型曲线描述的主变量,档案资源的连续性要经历漫长的积累,既有存量的处理压力,又有增量带来的新型挑战,这个连续性在数字态与数据态资源中尤其突出。其二是从语义含量的变化角度看,U型曲线实现了面向人的语义回归,从物理实体到数字实体再到记忆实体,这个破析与融合阶段是分别通过计算增强和语义增强实现的,这个语义变化曲线是连续的。其三是要重视技术发展的连续性,尤其要注意到技术自身迭代升级带来的能动性改变,可导致其中每个独立内容都有可能发展。在把握连续性时也要注意,连续性不是用新弃旧的简单线性,而是一种持续的扬弃。

3.2 内容观

U型曲线本身体现的就是档案信息化进程中的资源形态的变化,通过数字化、数据化、语义化、故事化在内的长链处理,实现从物理实体的控制,到概念实体的表达与记忆实体的再现。其中最为重大的意义是要看到档案信息化进程中语义与内容的回归的必然性,这与业界普遍感受的档案信息化越深入就越需要回归内容的认知不谋而合,与U型曲线体现的语义增强的内在逻辑一致。

内容观强调要把握资源形态变化这个中心,正视对象态别的演化推动了档案信息化的深化与发展。同时由于信息化本身具有很强的工具性,在相当长一段时间内对信息化平台与工具本身的关注超过了档案资源本身,内容观就是对技术导向主义的纠偏。内容观强调资源为王,对于任何态别的档案资源都要建立其相应的数据治理路径和数据质量保障措施;在档案资源体系建设中,要以档案资源为基底,依托DIKW信息链,兼顾存证和知识服务打造立体丰富的档案资源产品体系;同时,档案资源建设中要有存量和增量意识,针对存量和增量进行有区别有联系的协同管控。

3.3 平衡观

平衡观是指各资源态别空间内档案对象、业务、标准与技术能力等要素一致性的观念。态别是管理对象空间的概念,不同态别对信息化各要素的要求和影响是有区别的。U型曲线展现了五态对象空间及相关技术的迭代,包括从模数转换、对象描述、本体建设、关联数据到档案叙事。态别空间平衡观的确立,能够避免在多态并存的现实中不加区分一刀切的现象,做到有的放矢。

平衡观可用于指导适用技术、业务标准与相应态别空间的对应关系,尤其是在将新技术引入档案领域时,平衡观强调该技术与特定态别空间的适用性和场景分析,如对物联网、大数据、云计算、区块链等技术就需要在平衡观理念指导下进行适用态别的分析研究。不同的态别对象适用的技术平台和工具是有巨大差异的,即使同一业务环节,在針对不同态别对象时也衍生出不同的做法,典型体现在档案描述与保管环节。笔者曾研究发现模拟态、数字态和数据态各自的描述标准、功能定位与工具是与态别空间平衡的,其保管工作目标大致对应可见、可读与可理解,防范载体老化、技术老化与文化老化[15],也都与各自态别空间存在平衡关系。此外,平衡观对档案机构与人员的能力匹配方面也提出较高要求,推动档案部门开展不同态别对象的能力建设。

3.4 生态观

生态观本质上是更大范围的平衡,可从行业、政策、社会、市场等视角来观察。如果说初期的实体管理和数据管理相当部分工作是局限在档案机构内部,在知识管理与叙事管理阶段则要求档案部门破圈而出,到更大的空间寻找资源盟友和技术支持,甚至包括市场这只看不见的手也要调动起来。这就需要树立协同导向的积极的生态观,综合应对档案资源多态并存管理的现状,具备对档案资源全U型管理的能力。

档案作为资源部门,应当与外围的生态伙伴协同,维系档案信息化专业能力供应链,保障从数字化到故事化在内的一系列专业能力供给。前述信息化各阶段任务中的难点和重点都要在更大的“生态圈”中寻求答案,为此需要进行档案信息化生态管理。比较典型的像档案机构的调整与职能定位、数据部门与档案部门之间的协同等。随着信息化能力的社会化服务逐步推行,类似信任基础设施、备份中心、存储资源、算力、核心技术等都需要由不同行业背景的生态伙伴来提供支持,为此,应在资质准入、政策引导、标准建设等方面建设档案信息化生态环境。

4 结 语

信息化一贯以要素繁多复杂著称,U型曲线涵盖了文件驱动、数据驱动、模型驱动、本体驱动、图谱驱动乃至叙事引导等驱动机制,能够对档案信息化工作进行大图景的宏观指导和趋势观察,推动档案信息化从实体管理、数据管理向知识管理和叙事管理发展,便于对技术、工具、标准等大家关心的信息化要素进行有效配置,对于相关系统研发、专业教育、技术场景建设等都具有指导意义。

注释与参考文献

[1]徐拥军,王兴广,郭若涵.我国电子档案管理标准建设现状与推进策略[J].图书情报工作,2022(13):36-47.

[2]郝晨辉.档案信息化标准的发展与展望[J].档案学研究,2017(4):61-66.

[3]金波,杨鹏,添志鹏,等.大数据时代档案数据生态平衡与调适[J].图书情报知识,2023(1):13-22.

[4]陈涛,刘炜,孙逊,等.IIIF与AI作用下的文化遗产应用研究新模态[J].中国图书馆学报,2021(2):67-78.

[5]牛力,高晨翔,张宇锋,等.发现、重构与故事化:数字人文视角下档案研究的路径与方法[J].中国图书馆学报,2021(1):88-107.

[6]赵红颖,张卫东.数字人文视角下的红色档案资源组织:数据化、情境化与故事化[J].档案与建设,2021(7):33-36.

[7]曾蕾,谭旭.数据的语义增强——解读图档博支持数字人文的新动向[J].数字人文研究,2021(1):65-86.

[8]杨智勇,谢雨欣.数字档案馆的“数字—数智—数治”演进之路——基于《“十四五”全国档案事业发展规划》的分析[J].档案与建设,2021(8):57-61,71.

[9]王可欣,牛力.面向“十四五”的新一代数字档案馆建设路径及趋势分析[J].档案管理,2022(4):34-36.

[10]钱毅.破析与融合——析档案资源形态与语义表现相互作用的U型曲线现象[J].档案学研究,2022(4):108-115.

[11]许晓彤,侯景瑞.可信电子文件证据效力保障技术方案研究[J].图书情报工作,2021(9):32-40.

[12]钱毅,崔浩男.基于证用价值导向的通用档案信息系统体系架构研究[J].档案学研究,2021(4):10-16.

[13]夏翠娟,陈刚.支撑城市记忆项目的时空数据基础设施建设[J].数字人文研究,2021(1):96-104.

[14]朝乐门,张晨.数据故事化:从数据感知到数据认知[J].中国图书馆学报,2019(5):61-78.

[15]钱毅.从保护到管护:对象变迁视角下的档案保管思想演变[J].档案学通讯,2022(2):82-88.

猜你喜欢
档案信息化
如何科学开展档案信息化建设
浅谈公路行业档案信息化的重要性
信息时代高校档案信息化建设研究
中职院校档案管理工作存在的问题及措施
医院档案信息化管理存在的问题与对策
档案信息化的思考
关于档案管理信息化建设的研究
档案工作的信息化建设问题分析
对档案信息化管理的理性思考