国家文化数字化战略背景下的图书馆古籍保护研究

2024-03-14 07:16王君
参花(上) 2024年2期
关键词:古籍检索战略

王君

国家文化数字化战略的出台,为图书馆的古籍保护事业指明了新的方向。本文以国家文化数字化战略的内在逻辑和首要任务为出发点,从资源、管理、服务三个方面指出国家文化数字化战略下图书馆古籍保护事业的发展方向。以此为基础,提出文化数字化战略视角下古籍保护工作的实践路径。

一、国家文化数字化战略背景下图书馆古籍保护的缘起

互联网技术的飞速发展让文化事业受到了挑战,为满足数字时代背景下群众多样化的精神文化需求,夯实文化基础,增加文化供给,2022 年,国家文化数字化战略的提出和相关意見的出台,从国家层面出发,为实现文化产业生态保障、文化资源数字化建设以及文化传播治理机制提供了方向指引。[1]国家文化数字化战略的内在逻辑是以中华文化数据库为文化基础,将各数据库联入国家文化专网,从而形成与用户相连的服务平台。

国家文化数字化战略的首要任务就是要整合零散的数据资源,按照统一的格式标准,搭建中华文化数据库。[2]在现代化进程中,图书馆依托数字图书馆与文化信息资源共享工程,存储了大量的数字文化资源,在国家战略布局中发挥重要作用。其中,古籍作为国家和民族文化记忆的重要载体,是人类宝贵的文化资源。妥善保护古籍、有效发挥古籍的文化价值,图书馆责无旁贷。数字化是古籍保护和利用的重要手段之一,也是图书馆落实文化数字化战略的必要路径。目前古籍数字化工作已经普遍开展,并积累了丰富的资源成果,国家文化数字化战略的提出,为“十四五”时期到2035 年我国图书馆古籍数字化保护工作提供了实践指引。

二、国家文化数字化战略背景下图书馆古籍保护工作的动力

(一)增加和创新数字文化内容

文化事业数字化的本质就是要持续推进公共文化内容数字化建设,增强数字内容的供给能力。自2012 年国家图书馆启动古籍数字化工作以来,虽形成了大量的数字成果,但古籍数字化工作受到专业设备、人才等因素的限制,推进缓慢,存世的古籍还有很大一部分没有被开发出来。根据相关意见要求,各地要因地制宜,制定具体实施方案,尽快落实相关工作, 图书馆可以此为契机,持续稳健推进数字化工作,进一步增加和丰富古籍数字化种类。[2]

公共文化数字化内容丰富是基础,更重要的是要提升数字化服务的水平。图书馆可以在数字化保护的基础上,利用数字人文和区块链等信息技术,对数字资源进行利用和开发,创新古籍内容的传播方式,促使古籍事业朝着传承性保护、知识服务方向发展。

(二)探索资源价值

国家文化数字化战略的最终目标是实现中华文化全景的呈现。要保障这一目标的实现,就要全面梳理中华文化资源,从不同领域内的文化资源中提取中华文化元素、符号和标识,展示中华文化的全貌。[3] 卷帙浩繁的古代文献典籍是中华文明绵延数千年的历史见证,是中华优秀传统文化的瑰宝。古籍数字化后,图书馆可以将文化资源转换为生产要素,生成文化创意产品,探索数字资源的价值。

三、国家文化数字化战略背景下图书馆古籍保护工作的发展方向

文化事业数字化是国家文化数字化的重要组成部分。具体而言,文化数字化建设的工作就是将数字技术和设备融入公共文化资源的生产、管理、服务中。[3] 为落实国家文化数字化战略的任务部署,立足于现状,图书馆古籍保护事业的未来发展主要有三个方向。

(一)源头保障:优化古籍资源数字化建设

相关意见对文化资源的战略部署中,要求文化机构要增强公共文化数字内容的供给能力,提升公共文化数字化水平。为了给用户提供多种古籍资源,保障不同用户的阅读需求,就必须挑选出优质的古籍资源。但是,我国古籍都是由各个单位进行保藏的,单位间缺少沟通,就造成了同类古籍数字资源的重复建设。例如,文渊阁的《四库全书》电子版就出现了3 个版本,分别是由武汉大学图书馆、岳麓书院等单位参与出版的。3 个版本造成资源的大量浪费,影响用户的判断与选择。[4] 因此,进行古籍数字化工作时一方面要进行前期的选题规划,选择稀缺且具有优质主题的古籍资源,另一方面要加强对古籍数字资源类别的细分,加大资源覆盖广度,减少数字化过程中的边际成本。

(二)管理高效:推进古籍数字资源的处理和整合

1. 加强古籍数字化标准化建设

相关意见要求构建文化数字化治理体系,进行文化数字化标准体系的研究,包括文化数据安全标准、文化数据库入库标准等。[5]自2007 年“中华古籍保护计划”实施以来,我国的古籍数字化保护工作在逐步推进。2014 年,国家古籍保护中心就规定了古籍数字化的工作流程,但在开展工作中却遇到了问题。古籍数字化的主体多样,包含了公共图书馆、高校图书馆以及数字资源开发商等,他们在进行数字化工作中多独立开展工作,并且都在尝试制定古籍数字化标准,出现了古籍书影质量与元数据著录存在差异,数据库质量良莠不齐、数据平台使用多样等问题。[6] 由于数字化工作的标准存在差异,形成的数据库和数据服务平台不利于跨平台的接口,也不利于异构数据库之间的二次开发与利用。为保证融入中华文化数据库,应尽快完善古籍数字化标准。

2. 实现数据服务平台的统一检索

随着国家文化数字化战略的落实,古籍数字化会逐渐成为图书馆古籍保护的主要方式,古籍数据库的数量也会逐渐增加。[7] 这必然有利于古籍资源的共建共享,有利于实现公共文化的便利化和权益的均等化。但是,目前由于古籍收藏单位各自搭建服务平台,古籍数字资源过度分散,极其不利于读者的检索与利用。例如,打开国家古籍保护中心的阶段性重要成果“中华古籍数字资源库”,发现该库除了国家图书馆特藏的古籍,只收纳了少数几家国内图书馆的古籍资源,包括云南省图书馆、天津图书馆以及上海图书馆。如果想要了解其他古籍资源,只能去寻找相应的收藏单位。[8] 因此,应加强全网古籍数据库的资源整合,加快建立统一的检索平台,解决古籍收藏单位资源过于分散的问题,并且要积极接入国家文化专网,提升数据库的网络能见度,扩大资源的辐射范围。

(三)服务升级:开发深层次的数字资源

对于图书馆而言,不仅要加强对文化资源的整合,更重要的是要利用大数据、人工智能、云计算等技术,提升对资源的计算能力。[8] 目前古籍数字化工作还停留在对古籍文献的表层处理,只能实现古籍的长期保存和检索,且大多局限于全文检索,有些数据库甚至不支持全文检索,只能对数字化的影像进行简单的文本浏览。[9] 仅通过题名从茫茫资源中找到用户所需文献的方式已不能满足用户的需求,用户更希望可以按照作者的时代、所处学派以及文献中某个章节等多字段进行组合式全文检索,或者输入关键词就能查阅到某个句子或者词语的出处。[9] 接下来,应加强对古籍文献内容的深层次开发,注重古籍资源的细颗粒度标识标引、知识单元标注和知识网络的构建,加强古籍文献文本内容的分析与挖掘,促使古籍保护事业朝着知识服务方向发展。

四、国家文化数字化战略背景下图书馆古籍保护工作的实践路径

(一)加强顶层规划,资源建设共享

古籍数字化工作是复杂且持久性的工程。数字化工程涉及古籍版本的筛选、数据加工、数据管理等多个环节。国家文化数字化战略背景下,应该由国家相关部门牵头主导,自上而下构建统一规范的工作和标准体系,从源头上把控数字化工作。

古籍数字化工作可以项目为主导整合各文化资源,由各个古籍收藏单位每年自行申报数字化项目,国家古籍保护中心组织相应的专家组对项目的价值进行评估,最终形成数字化项目清单,最大化地整合资源。各古籍收藏单位在选择申报的古籍时,可以充分参考“全国古籍普查登记基本数据库”和“国家珍贵古籍名录数据库”,对古籍版本进行判断与选择,不能将年代久远当作选取的唯一标准,同时也不能因残缺,而漏掉具有较高文献价值的古籍。在做好顶层规划与设计的基础上,保障古籍数字化工作的可持续发展与共建共享。各收藏单位可以加强交流与沟通,互通数据,相互补充数字资源馆藏,收集重要古籍的重要版本。

(二)完善协调机制,持续完善古籍数字化标准

在国家文化数字化战略的背景下,依托中华文化数据库建设,在现有研究成果的基础上,推进建立统一的数字化标准体系。

第一,完善协调机制。应将公共图书馆、学术机构以及数字资源开发商等标准建设主体协调起来,统一管理,满足各主体的诉求,同时借鉴和引进国外相关标准,形成一套全国统一的强制标准。另外,古籍数字化的标准规范在实践的过程时也会不断出现新问题,应及时对相关问题进行解答,收集使用者的反馈意见,对不符合现阶段情况的部分内容进行修改、完善,保障标准的可操作性。

第二,明確古籍数字化标准。古籍数字化标准应包含项目规划标准、版本选择标准、生产标准、发布标准、数据保存标准。古籍项目规划标准规定了数字化项目全流程的监管方式和方法,包括选题标准、选题审核流程标准以及监督标准。版本选择标准是对数字化实体的确定标准,包含了类型选择标准和细节敲定标准。同一本古籍应该选择比较完善且被广泛认可的版本。版本细节明确版刻工艺、纸张、字体类型、装帧方式、墨色类型等,以减少数字化成果中出现脱文、衍文和残缺的现象。[10] 古籍数字资源生产标准按照生产环节分为数码扫描标准、原书图像数据库标准、文字抓取标准和数字化产品校对标准,确定了数字化工作中的扫描设备、方式,扫描图像的大小和清晰度等。数字资源发布标准包括发布网站的建设标准、检索标准。检索方式影响古籍数字资源的使用,检索标准是关键性标准。古籍数字资源保存标准包括元数据著录规则、描述元数据规范、机读格式、分类标引标准、主题标引标准、数字化古籍图像标准等。保存标准的建立为跨数据库检索奠定了基础。

(三)数据库相互衔接,实现联合跨库检索

国家文化数字化战略下的古籍数字化工作,在生产和发布数字资源的同时,要努力探索古籍数据库之间的链接模式。可以利用“中华古籍书目数据库”的成果,联合有数字化成果的古籍收藏单位,逐步将古籍影像资源与古籍目录进行链接,实现书目与内容的衔接。数据库之间的衔接可以利用跨库检索来实现。跨库检索的功能简单总结来说就是只要输入关键词,就能在多个不同的数据资源库中进行检索,提高结果的查全率,减少检索时间。目前有两种方式来实现跨库检索,一是利用数据库操作语句在多个异构数据库中检索出相关数据后,再对数据进行处理后返回前端页面;二是建立数据中台,将各个数据库中的数据同步到数据中台后,对数据进行处理,去除重复数据和存在质量问题的数据,最后将处理完毕的数据作为检索系统的检索对象。[10]

(四)技术赋能,构建古籍数字资源知识体系

国家文化数字化战略新时期,图书馆应当致力于古籍事业的转型与升级,促使古籍工作朝着智能化、智慧化的方向发展。“挖掘文化遗产中更深层次的历史文化知识,是数字人文研究的重要内容。”古籍数字化工作可以将数字人文技术应用于古籍数字资源的深层次开发利用中,对文献内容进行挖掘、分类整合以及可视化展示,形成知识产品,提供知识获取服务,促进古籍事业向着“知识域”迈进。[11] 如学者提出可以利用文本挖掘技术挖掘某一作者的写作风格、情感倾向,某一流派的社交网络关系等;借助GIS 技术对古籍文献中与地理分布、历史进程有关的数据进行处理与描述,展现静态与动态的可视化分析,来发现不同数据间隐藏的、有潜在价值的知识。[12]

五、结语

国家文化数字化战略对构建中华优秀传统文化传承发展体系、增强国家文化软实力有重要的意义。战略中的目标与规划为推动图书馆古籍保护工作提供了新的动力和路径,未来图书馆古籍事业要找准自身在国家文化数字化战略中的使命,抓住机会,积极探索。

猜你喜欢
古籍检索战略
精诚合作、战略共赢,“跑”赢2022!
中医古籍“疒”部俗字考辨举隅
关于版本学的问答——《古籍善本》修订重版说明
2019年第4-6期便捷检索目录
关于古籍保护人才培养的若干思考
战略
战略
我是古籍修复师
专利检索中“语义”的表现
导致战略失败的三大迷思