浅析地方志资源数字化

2019-05-13 10:23赵莉莉
河南图书馆学刊 2019年4期
关键词:著录方志古籍

关键词:地方志;数字化;数据库

摘要:地方志资源数字化是随着科技进步而发展起来的全新领域,利用先进的技术将地方志资源进行数字化整理是今后地方志工作的趋势。文章指出方志收藏单位在对地方志资源进行数字化过程中会存在标引著录、图像采集及数据库建设等问题,并提出了相应的对策,论述了数字化对于地方志资源的保存、开发及研究具有重要的作用。

中图分类号:G250文献标识码:A文章编号:1003-1588(2019)04-0087-03

地方志是中华民族特有的文化瑰宝,是文明传承的载体之一,是记述一个地区自然、经济、政治、社会、文化等方面情况及其历史沿革的综合文献。在我国浩如烟海的文化典籍中,地方志占有很大比重,为研究我国各地的历史地理、风土人情等提供了很多宝贵材料,我国很多重大的科研成果都得益于地方志资料。地方志是一座内容丰富的文献宝库,具有很高的开发利用和应用价值。我国现存的地方志卷帙浩繁、种类繁多、内容丰富,享有“地方百科全书”的美誉。过去,由于社会条件有限,特别是技术手段的落后,使地方志文献资源难以被广泛传播。随着电子信息技术的发展,依托新技术的古籍文献数字化工作得以开展,为地方志资源的传播、开发和利用提供了新模式。方志收藏单位对地方志资源进行数字化,既是经济文化建设、学术研究的需要,又是时代对地方志整理工作的必然要求。目前,方志收藏单位在开展地方志资源数字化工作时还未形成统一标准和规范,仍有许多方面需要完善。

1地方志标引著录

地方志标引著录是数据库检索功能的依据,能提高文献的查询、利用效率,进一步增强地方志工作的科学性和技术性。因此,工作人员需要结合方志学、目录学、地方志书籍本身的特点,对地方志数字化工作进行标引著录。此外,地方志数字化工作也需要统一著录标准和规范,为实现地方志资源共享奠定基础。

2004年5月,《我国数字图书馆标准规范建设》课题组发布了《地方志描述元数据规范》和《地方志描述元数据著录规则》草案。《地方志描述元数据著录规则》中的著录项目包括名称、主要责任者、主题、描述、出版者、其他责任者、日期、类型、格式、标识符、来源、语种、相关资源、时空范围、权限、版本、载体形态、收藏历史、馆藏信息、体例、方志类型、一般附注及复本记录等,共计23项元数据描述内容。《地方志描述元数据规范》定义了15个核心元素、4个古文献系列资源类型核心元素和4个个别元素。

地方志数字化著录包括古籍方志和新方志的著录,但目前颁布的《地方志描述元数据规范》和《地方志描述元数据著录规则》没有对古籍方志和新方志的元数据著录加以区分。新方志虽然在体例、内容等方面是古籍方志的延续,但也存在一些差别,如:新方志的内容和种类更加丰富,新方志的目录更加细化明晰,章节、内容条目都有页标示等,工作人员在著录时需要认真记录,方便后期的编辑、查询和使用。方志收藏单位应根据古籍方志和新方志的特点,制定与之相应的描述规范和著录规则,对它们进行标准著录。

长期以来,地方志被看作是“博物之书”,由于各代都有编纂,其内容、体例多有延续,且涉及面广、信息量大,研究者要想有效利用它们,就必须借助某种路径,这种路径就是地方志目录。如果工作人员没有对馆藏新旧方志进行整理编目或目录编制得不科学,就会影响日常管理和地方志资源的开发、利用。因此,工作人员对地方志资源进行科学分类,准确详细地标引著录,能让研究者在最短的时间内获取最多的信息,提高资源查询效率,有利于扩展方志研究的深度和广度。虽然目前的地方志描述和著录规范、规则存在一些不足,但仍对方志收藏单位进行地方志数字化的标引著录具有重要的指导意义。经过不断的实践反馈、修改完善及推广执行,地方志数字化著录将会实现标准化和系统化。

2地方志数字化图像采集

地方志数字化是将纸质文献转换为具备高效、准确、快捷、便利及节约等特点的电子文献,这需要工作人员对纸质文献进行扫描并采集图像。为了更好地保护地方志文献特别是古籍方志文献,工作人员在图像采集过程中需要利用专业的数字化设备进行扫描,针对破损严重的书籍也应采取与之相适宜的解决方案。

赵莉莉:浅析地方志资源数字化

2.1古籍方志图像采集

由于年代久远,部分古籍方志有不同程度的损坏,如存在脆化、残破、变形、霉变等情况,保护与利用的矛盾越来越凸显,而数字化是目前解决这一矛盾的最有效方式。由于古籍方志的纸张易受高温影响,工作人员在对古籍方志进行扫描时,应使用冷光源扫描仪,这不仅有利于保证扫描影像的品质,还能避免温度过高对古籍方志造成不良影响。对于残破、虫蛀等较为严重的古籍方志,工作人员需要先修复再扫描,以避免在数字化扫描中加重对古籍方志的损坏。对于因纸质薄而出现透字情况的古籍方志,工作人员需要先用衬纸把两个半叶(页)隔开再进行扫描,避免扫描的图像出现透字。对于装订线距离板框太近的古籍方志,工作人员需要采取拆书的方法,先扫描再及时进行装订还原。对于幅面较大或书籍里夹有大幅地图的古籍方志,由于它们超出扫描仪的扫描范围,工作人员需要先将大幅面古籍进行分段扫描,再使用软件进行无缝拼接处理,形成与原古籍方志一致的完整图像。数字化扫描既能保护古籍方志,又有利于传播,已成为对古籍方志进行再生保护的有效手段。在进行数字化扫描时,工作人员需按照规范要求进行操作,妥善处理好透字、拆书、还原修复、图像处理等问题。

2.2新方志图像采集

新方志品种齐全,数量众多,系统完备,方志文献的功用已经不再局限于资治、教化、存史三个方面,已成为我國政治经济发展必不可少的国情和地情资源宝库,能够促进历史学、社会学、法学、地理学、生物学等学科的发展,具有非常重要的使用价值。加快新方志的数字化及推广使用,是目前方志收藏单位开展地方志保存与管理工作的重要内容。

新方志成书的时间较短,一般保存的都比较完好,较少出现虫蛀、破损及脆化等情况。但新方志的装订形式与古籍方志不同,一般采用平装形式,一页双面印刷。随着时间的推移,新方志也会出现破损、虫蛀等问题,它们的修复难度较大。因此,数字化扫描不仅有助于新方志的开发使用,还有利于新方志的保存。

数字化扫描完成后,工作人员需要对采集的图像进行纠偏、影像拼接等处理,保持页面端正,最大限度地保证文献资料的原始性。目前,数字图像采集输出储存的格式不统一,有txt、doc、pdf、chm、hlp、exe、xml等格式,这些不同格式的文件需要专门的阅读器才能读取,相互之间也难以兼容。因此,方志收藏单位在做好地方志图像采集的同时,需要统一输出储存格式,以实现跨平台的资源共享。

3数据库共享平台建设

3.1数据库建设模式

數据库模式是目前文献资源储存、传输最便捷有效的方式,有利于有效开发、利用地方志文献。目前,我国的文献数据库建设主要有三种模式,分别为图像全文数据库、文本全文数据库、图像加文本的图文数据库,这三种模式各有优劣。

图像全文数据库是指对书籍进行原文图像扫描,并将扫描图像进行存储的建设模式。读者通过网络可获取文献图像信息。图像全文数据库的优点是技术实现容易,运行成本低廉,能够保持古籍文献原貌及方便快速传播,易于使用。其缺点是占据空间大,只能根据标引著录的信息,如题名、作者、地名、年代等进行检索,不能进行全文检索。

文本数据库是指通过人工录入或使用软件识别的方式将文献内容转换成文本字符的形式,并将录入或识别的文字进行存储的建设模式。读者通过网络可进行全文阅读或全文检索。文本数据库的优点是存储空间小,可进行检索、排序、分析数据,可编辑,使用方便。其缺点是文字录入难度较大,开发成本高,不能保持古籍原貌。

图文数据库是图像版与文字版的结合,可以实现全文检索、文本与图像相互对照,研究者可根据需要随时参考原文图像。图文数据库是最理想的数字化文献开发模式,但开发成本也相对较高。

3.2地方志数据库建设

就地方志数据库而言,图文数据库模式更高效、准确、快捷和便利。方志收藏单位可根据财力、人力等具体情况,循序渐进地开发建设地方志数据库。

方志收藏单位进行古籍方志数据库建设可根据实际条件,将地方志数据库建设模式由图像全文数据库向文本数据库过渡,并逐步转换为图文数据库。由于新方志书籍中的异体字较少,其文本可在扫描后通过软件识别图像的方式获取,且错误率较低,因此,新方志应以图文数据库模式进行建设,新方志的图文数据库还可采用图像与文本合一的形式。

随着信息化、网络化时代的到来,地方志工作必须适应信息时代的发展要求,地方志数据库建设势在必行。方志收藏单位进行地方志数据库建设需要适应信息时代实时共享、检索方便、更新及时的要求,充分发挥地方志资源的作用。

4地方志资源数字化的价值

4.1有利于对地方志资源进行及时有效的保存与保护

对于现存的地方志资源,尤其是年代久远的古籍方志,工作人员需要进行有效保护,利用现代网络信息技术对这些地方志文献进行数字化整理,最大限度地还原、保存其原始性,并通过电子文本的方式对其进行全面展示,方志收藏单位可对数字化的地方志资源进行永久保存。研究者可使用网络电子版本开展研究,从而避免纸质文献在使用时被损坏。

4.2有利于地方志文献的研读与使用,为其传播和使用创造了新的条件

地方志电子文献使用起来更为简单便捷,读者不必到专门的馆藏机构寻访,可通过相应的网络平台直接阅读使用,从整体上降低了研究方志的成本。同时,更多的读者可通过地方志数字共享平台阅览相关资料,既满足了读者的阅读需求,又便于方志资源的广泛传播及方志知识的普及。

4.3为地方志研究工作提供了新思路

地方志资源数字化工作的开展,有利于推动方志编纂工作适应网络化、信息化、数字化的发展模式,为提高工作效率、完善工作内容创造了条件。同时,数字化应用于地方志资源的整理与研究,便于研究者及时有效地搜集、比对、解析相关数据与信息,提高了查阅、分析资料的效率,为地方志研究提供了新方法、新思路。

5结语

大数据时代,地方志工作须与之相适应,信息化、网络化将会是今后地方志工作的主流,即采用科学、快捷、高效的方式,利用信息化、网络化的快捷优势,最大限度地发挥地方志资源的功用,这是对今后修志工作者的新要求,也是时代的迫切需要。因此,方志收藏单位将地方志资源数字化不仅为地方志书保存提供了新方式,还能推动地方志整理与研究工作的顺利开展,实现地方志资源共享,满足广大人民群众的文化需求,促进经济文化的发展。

参考文献:

[1]仓修良.方志学通论[M].济南:齐鲁书社,1990:1.

[2]钱晓琴.地方志计算机数据库建设初探[J].伊犁教育学院学报,2003(3):111-115.

[3]王宪洪.对北京方志数字化的思考[J].中国地方志,2008(5):10-13.

[4]巴兆祥.方志目录学刍议[J].中国地方志,2003(3):7.

[5]潘星耀.浅谈古籍数字化扫描工作需注意的问题[J].新世纪图书馆,2016(12):60-62.

[6]赵嘉朱.方志资源知识组织方法研究[J].数字图书馆论坛,2016(4):62-65.

[7]赵海良.浅议地方志文献数字化标准建设[J].广西地方志,2015(4):28-31.

[8]陈晓杰.地方志计算机数据库的建立与维护[J].硅谷,2008(1):24.

[9]李卫东.地方志工作信息化网络化建设探讨[J].黑龙江史志,2007(9):17-18.

(编校:孙新梅)

猜你喜欢
著录方志古籍
河北省档案馆馆(省方志办)藏《永壁村保甲册》鉴赏
和爸爸一起回到童年:唤醒你,治愈我
我国档案著录的基本概况
西藏大批珍贵藏文古籍实现“云阅读”
古籍修复师的巧手与匠心
江苏完成九成以上古籍普查
录附:《石渠宝笈》著录的圆明园旧藏书画目录
试析协同应用国际档案理事会系列档案著录标准
设置方志学专业硕士学位探讨
古籍出版的困顿与生机访谈录