公共图书馆民国文献自建数据库研究

2017-04-12 17:27穆卫国段晓林
关键词:上海图书馆国家图书馆民国

穆卫国,段晓林

(上海师范大学 图书馆,上海 200234)

公共图书馆民国文献自建数据库研究

穆卫国,段晓林

(上海师范大学 图书馆,上海 200234)

公共图书馆是民国文献的主要收藏机构,近年来,已建成大量全文和专题数据库,但目前尚没有文章对这些自建数据库进行相关研究。重点介绍国家图书馆、上海图书馆、南京图书馆、重庆图书馆、辽宁图书馆等几家民国文献馆藏量较大的公共图书馆的数据库建设概况,分析公共图书馆民国文献数字化开发现状,指出存在的问题,并提出对策建议。

民国文献;自建数据库;公共图书馆

民国文献是指1912—1949年间出版的各类图书、期刊、报纸、档案、手稿、书札、海报、老照片、电影、唱片、日记、传单、商业契约和票据等文献资料。民国文献数量众多、内容丰富,它不仅记录了民国时期各学科的发展成果,反映当时的政治、经济、军事、文化状况,还记载了中华民族争取民族独立与国家振兴的光辉历程,具有重要的史料和学术价值。公共图书馆是民国文献的主要收藏机构,根据相关统计,目前藏书量最多的是上海图书馆,约有民国文献109万册;其他依次为南京图书馆约有70万册,国家图书馆约有67万册(件),广东省立中山图书馆约有25万册;藏书量超过10万册的图书馆还有辽宁省图书馆、重庆图书馆、湖北省图书馆等。[1]其他民国文献馆藏较多的公共图书馆还包括首都图书馆、天津图书馆、浙江省图书馆、湖南省图书馆等。

为抢救和保护民国时期珍贵文献,继承和弘扬优秀文化,2011年,国家图书馆联合国内各文献收藏单位,策划了“民国时期文献保护计划”项目,2012年启动。随着“民国时期文献保护计划”的推行,民国文献的调查、保护、影印出版、数据库建设越来越受到各级、各类型图书馆的重视,尤其是藏量巨大的公共图书馆,开始大力加强民国文献的保护、利用和开发。在数据库建设方面,目前绝大部分公共图书馆都已建成馆藏民国文献书目数据库;一些馆藏丰富的图书馆,则更加重视全文数据库和专题数据库建设,它们通过充分利用和挖掘自有馆藏,建成包括馆藏图书、期刊全文库、专题图片库、专题资源库等数量众多、各具特色的自建数据库。

一、公共图书馆民国文献数字化开发概况

1.中国国家图书馆

中国国家图书馆(简称“国家图书馆”)是国家的总书库,共收藏民国文献67万册(件),作为全国最大的民国文献收藏机构之一,国家图书馆不仅承担着文献保存和保护的重任,而且在民国出版物的数字化开发利用和保护方面更起着引领和主导作用。

在民国文献的数字化建设上,国家图书馆利用自身丰富的馆藏资源,自2000年起启动民国图书数字化项目,目前已建成的综合性全文数据库有“民国图书数字化资源库”和“民国中文期刊资料库”,专题数据库有“民国法律数字化资源库”和“东京审判资源库”。

综合性全文数据库方面,“民国图书数字化资源库”目前收录22个大类、15373种民国图书的全文影像资源,每年仍在不断更新和增加。该库提供“题名”“责任者”“出版地”“出版者”和“主题词”5种检索途径。同时,也可以根据图书所属类别逐级浏览,每类图书可浏览至三级类目。“民国中文期刊资料库”目前可提供4351种期刊的电子影像全文浏览,由于期刊具有定期或不定期连续出版的特点,因此在检索途径上,除与“图书库”相同的“题名”“责任者”“出版地”和“出版者”检索方式外,还提供按“出版时间”的检索途径。

在专题数据库方面,国家图书馆建成“民国法律数字化资源库”。民国时期前后历时38年,其间曾先后出现过多个政权,它们在执政期间制定并颁布了大量法律、法规和其他规范性文件,从不同角度反映了当时的政治、经济、军事、外交、文化等诸多方面的历史原貌,其中许多珍贵的历史文献是研究中国近代史、中华民国史、中国革命史和中国法制史的重要文献来源。国家图书馆对馆藏民国法律文献进行整理和数字化,建成“民国法律数字化资源库”。该库包括民国各个时期存在政权的法律、法规文件8112篇,总计29087页,并将不断更新,提供“篇名”“公布单位”“文献出处”“关键词”和“主题词”5种检索途径,可在线阅读全文。国家图书馆建成的另一种专题数据库是“东京审判资源库”,该库于2011年起由国家图书馆与上海交通大学合作建立的东京审判研究中心搜集、整理东京审判相关文献史料建设而成。“东京审判资源库”以海外征集的东京审判等对日战犯审判资料为基本素材,充分利用已有的民国时期文献研究、整理和出版成果,下设庭审记录、证据文献、判决书、影像记录等8个子库,内容包括从海外征集到的东京审判庭审记录4.9万页,中英文判决书各1200页,证词、证据文件4949份,庭审现场历史照片384张。该库通过利用现代信息技术手段,将已出版的80卷《远东国际军事法庭庭审记录》、3卷《索引、附录》、3卷本《远东国际军事法律判决书(中英文版)》和1卷《东京审判图片集》中的全部内容进行全方位揭示,将对日战犯审判的原始资料和研究成果逐步展开,再现对日战犯审判的重要历史事实,极大地便利了读者使用,促进了史料文献面向公众的推广。

同时,国家图书馆利用国家中心馆的地位优势,整合国内民国文献资源,建立联合数据库平台,如“地方馆民国文献”“民国时期文献联合目录”和“革命历史文献联合编目中心资源库”。“地方馆民国文献”整合了包括上海图书馆、首都图书馆、湖北省图书馆、广西壮族自治区图书馆、云南省图书馆等在内的近10家公共图书馆的馆藏图书、期刊、报纸等民国文献。“民国时期文献联合目录”是民国时期文献保护计划工作的数据发布即展示服务平台,于2012年建设开发,截至2016年汇集了来自国家图书馆、首都图书馆、重庆图书馆等20家公共图书馆的民国书目数据近30万条。[2]“革命历史文献联合编目中心资源库”包含25家图书馆的书目数据和馆藏信息,总量达到1万余条。

另外,国家图书馆还链接了人民出版社“日出东方——马克思主义中国化90年大型电子图书展”,展出1921年以来出版的著作文献1万余册。

目前国家图书馆已建成的民国数据资源库,全部采取开放存取方式,提供公开访问,在图书馆网站免费注册并经实名认证后即可实现在线浏览。

2.上海图书馆

上海的出版中心地位在清末即已经形成。民国时期,上海成为中国近代新型知识分子的集结地,其全国出版中心的地位继续强化。据当时的数据统计,1936年,仅商务印书馆、中华书局和世界书局三家出版机构的出版量就已占当时全国出版量的70%以上,1920—1935年间,上海有出版机构130~140家。[3]巨大的出版量给文献收藏机构带来了丰富的资源,上海图书馆收藏民国文献约109万册,为全国之最。创立于1955年的《全国报刊索引》[4]是上海图书馆(上海科学技术情报研究所)主管主办的信息服务品牌,近年来致力于成为中国近代报刊数字文献资源的权威知识服务体系,相继挖掘开发了包括“民国时期期刊全文数据库”“中国近代中文报纸全文数据库”等在内的多种民国文献数据库。目前通过这个平台,已经服务到300多家国内和海外的公共图书馆、高校图书馆以及情报研究机构、社科院等,[5]在国内外民国文献数字化整理领域已经有非常大的影响力。

在书目数据库方面,上海图书馆建成一批数据库。其中包括依托“全国报刊索引”平台建成的“民国时期期刊篇名数据库(1911—1949)”,目前该库数据量达900余万条,每年计划新增数据80万条以上。另外,在上海图书馆网页上,还可检到“旧日文书目数据库”,[6]收入上海图书馆馆藏旧版日文文献(1949年前)8万余册,其中90%是图书,10%是日文旧期刊、各类小册子和其他非正式或非公开出版物;“馆藏旧版西文文献目录数据库”[7]收入文献54241条;“近代文献联合目录数据库”[8]现有书目记录2万余条,所收文献均为国家图书馆和上海图书馆已经全文数字化的内容;“上海年华——中国现代电影期刊全目书志”[9]收录1921—1949年间发行的电影杂志300种,每种写有详尽的提要,并配以相应书影和内页,附有发刊辞和目录。

在全文数据库建设方面,上海图书馆以“全国报刊索引”为平台研发的“民国时期期刊全文数据库(1911—1949)”较为有影响,该库收录1911—1949年间出版的2万余种期刊、90余万篇文章,目前推出到第十一辑,内容集中反映这一时期的政治、军事、外交、经济、教育、思想文化、宗教等各方面的情况。

上海作为近代中国的出版中心,诸多出版于此的报纸都在近代中国报业中扮演了重要角色。上海图书馆依托馆藏,在报纸方面,通过“全国报刊索引”平台推出“字林洋行中英文报纸全文数据库(1850—1951)”和“中国近代中文报纸全文数据库”等大型全文库。

字林洋行是19世纪英商在上海创办的最主要的新闻出版机构,也是当时英商在华最大的报业印刷出版集团。它旗下的一系列中英文报纸,具体详尽地记载了近代中国百年的社会场景,从不同视角解说了曲折的历史进程,是一座尚待挖掘的文献宝库,具有不可替代的学术价值和史料价值。依托上海图书馆丰富的馆藏资源,“全国报刊索引”历时5年,打造了“字林洋行中英文报纸全文数据库(1850—1951)”,收录《北华捷报》《字林西报》《上海新报》《沪报》《汉报》《消闲报》《字林西报行名录》等中英文报纸。作为历史档案的重要组成部分,该数据库不仅真实生动地还原了珍稀史料风貌,还丰富了报刊数字资源,为研究近代中国提供了弥足珍贵的材料。

“中国近代中文报纸全文数据库”已推出《新闻报》和《时报》。《新闻报》自1893年创刊伊始,因其在报馆营业策略、报纸内容编辑上的突出特色,迅速发展成力能匹敌《申报》的大报。《新闻报》发行逾半个世纪,内容繁复,特色鲜明,是上海图书馆独特的馆藏,为研究者深入挖掘历史提供了坚实的基础。“近代中国中文报纸全文数据库:新闻报(1893—1949)”收录了上海图书馆该报的完整珍稀馆藏,合计约36.5万版。《时报》1904年6月12日在上海创刊,在上海与《新闻报》《申报》呈三足鼎立之势。该报注重时评,刊载小说众多,后期更有大量的体育新闻与图片报道,内容丰富,特色鲜明。除上述两种报纸外,“中国近代中文报纸全文数据库”即将推出的还有《百种精选小报》以及英文报纸《大陆报》《上海泰晤士报》《大美晚报》等。[2]

上海图书馆各种全文数据库的推出,为相关研究者提供了全新的研究视角,全面拓展了研究视野。其将报纸资源按正文、广告、图片三大类划分,为研究者提供了极大的便利,有效揭示了报纸精髓。另外,以“全国报刊索引”为平台,通过热区分色显示的方式定位不同的文章类型,并提供每版报纸的目录以供查阅,一系列人性化的功能令读者用户的查阅工作变得方便精准。

上海图书馆在专题数据库建设上也很有特色,开发了“近代民国中医药专题数据库”“上海图书馆藏淞沪抗战图片库”[10]等专题库。前者从近代民国期刊中精选中医药专题数据17万余条,收录《杏林医学月报》《中医杂志》等著名中医药学期刊,是海内外专家学者研究近代中医药史重要的检索工具;后者选录馆藏中、英、日语历史文献中刊载的相关图片8000余帧,以图片形式再现两次淞沪战役的全貌。

同时,上海图书馆网站还链接了国内一些公共图书馆民国文献相关数据库,如“天津图书馆缩微文献影像数据库”“宁波图书馆宁波特色数据库”“海德堡大学晚清和民国时期中国女性杂志资料库”“《岭南学报》数据库”等。

3.南京图书馆

南京图书馆也是我国目前馆藏民国文献最丰富的公共图书馆之一。据统计,现有民国文献约70万册,其中民国时期出版的图书7万余种、约40万册,期刊近万种,报纸千余种,民国线装刻本也有近3万部,另有两千多册油印本和稿本。其中政府出版物数量之多、范围之广在全国独占鳌头。另外,各个时期共产党领导人的著作、各个革命时期的宣传刊物等革命书刊也为一大特色。

南京图书馆自2007年开始对馆藏民国文献进行数字化保护利用,截至目前,已完成《司法院公报》《南京市政公报》等公报类文献5413册,民国油印本1458册,稿本477册,革命书刊4885册的全文扫描。[11]已完成全文扫描的民国文献数字版,主要用于出版和供读者阅读。

目前,南京图书馆已建成的民国文献数据库以图片资料库为主,其中“中国近代文献图像数据库”取材于馆藏历史文献的精品,是集史料性、学术性和观赏性为一体的综合性中国近代文献图像数据库,收录1840—1949年的历史照片和图像,内容涵盖政治、经济、军事、文化、科技、教育等15个大类,截至2015年底,已完成图像扫描12万幅,图像处理11万幅,文献标引10多万条。该库通过南京图书馆网站和江苏文化网同步发布,供读者免费检索使用。其他与民国文献相关的数据库还有“抗日战争历史图库”“百年商标”“老商标老广告数据库”“红色记忆图片数据库”“百年人物”等多个专题数据库。

此外,南京图书馆与北大方正公司合作,建成“民国时期建筑图像数据库”“民国时期文化发展图像数据库”等一些专题库。[12]

4.重庆图书馆

重庆作为中国抗战时期的首都、国际反法西斯战争三大指挥中心之一的远东指挥中心,是当时中国的政治、经济、军事、文化和外交中心。重庆图书馆的前身——罗斯福图书馆得其地利之便,收集了大量珍贵的民国文献,现藏民国文献10余万册,包括民国时期图书7万多种,10万余册,其中抗战版图书2.7万多种、6万多册,民国时期期刊5000余种、2万多册,民国时期报纸300余种、7000多册,是中国二战时期图书、期刊、报纸收集最齐全、藏量最多和最完整的公共图书馆之一。除抗战文献外,民国时期政论出版物、各个时期共产党领导人的著作、革命时期的宣传刊物等革命书刊,也是其一大收藏特色。

重庆图书馆建成的书目数据库包括“民国图书书目数据库”(收录图书数据61747条)和“民国期刊书目数据库”(收录期刊数据142万条)。另有“重庆图书馆馆藏革命文献目录(1919—1949)”,收录中国共产党在革命实践中形成的各类文献,特别是非正式出版物中的油印或石印的小册子和单张文献450余种。三个书目数据库,均可以下载电子表格形式的目录。

全文数据库方面,重庆图书馆是国内较早完成民国文献全文数字化的图书馆之一,其“民国文献全文数据库”始建于2006年,收录民国期刊5727册、144万篇,民国时期图书6.2万册。[13]2008年1月正式投入使用的“馆藏民国文献检索系统”有机结合书目数据库和全文数据库,提供书名、题名、责任者、内容提要、中图法分类号、关键词、条码号、任意字段等多种查询途径,可以简单检索、高级检索及查询检索历史,并可以进行同义词和相关词的检索,进而可以全文下载阅读。2012年3月,重庆图书馆启动民国报纸全文数字化工程。[14]2014年,重庆图书馆研发的以馆藏抗战文献为基础的“中国抗战大后方3D数字图书馆”正式建成。[15]

5.辽宁省图书馆

辽宁省图书馆前身是1948年成立于哈尔滨的东北图书馆,是东北地区最大的公共图书馆,民国文献的收藏十分丰富,现拥有民国图书2.8万余种、4.4万余册,其中不乏极具历史价值和文献价值的珍稀文献。

2000年起,辽宁省图书馆对馆藏民国文献采取了缩微复制、数字化等再生性保护措施,并已取得一定成效。书目数据库方面,辽宁省图书馆2001年底即完成了民国图书书目数据库的回溯建库工作,建成“辽宁省图书馆馆藏民国图书数据库”。全文数据库方面,2007年以来相继完成《盛京时报》和《东北日报》的数字化。[16]专题数据库建设上,根据图书馆网页的相关资料显示,有关民国的专题库比较多,而且很有特色,主要有“张学良专题数据库”(1700条)、“九一八事变专题图片库”(图片998幅,资料索引733篇)、“辽宁三十年代著名作家作品数据库”(篇名数据3058条)、“馆藏建国前东北地区期刊库”(期刊550种,篇名数据23万条)、“中国共产党党史图片集”(1274篇)、“东北抗战事件库”(数据400多条)、“东北抗战图片库”(1300余幅)、“东北抗战人物库”(700多人)、“东北抗战书目库”(目次标引300余种)、“抗战书目库”(1500余种)以及“旧日文书目数据库”“馆藏‘满铁’图书资料数据库”等。

6.国内其他公共图书馆

除上述5家图书馆外,经过不完全统计,目前查询到的有自建全文、专题或书目库的市级以上公共图书馆20余家。

广东省立中山图书馆全文数据库有“缩微文献全文数据库”(包含民国时期的期刊968种,新中国成立前报纸490种)和“孙中山全文数据库”;书目数据库有“孙中山文献库”“解放前广东报纸库”“解放前广东舆图库”等;文摘数据库有“建国前广东期刊库”;图片数据库有“广东历史图片库”“广东辛亥革命历史图片库”“广州历史图片库”等。

首都图书馆以近百年馆藏为依托,建成历史文化多媒化资源数据库“北京记忆”,包括以经典文献为主的“北京文汇”,以老照片为主的“旧京图典”,以金石拓片为主的“燕都金石”,以历史地图为主的“京城舆图”,以报刊资料为主的“昨日报章”和以老戏单子为主的“旧京戏报”等。

天津图书馆目前建成“民国期刊数据库”(收入期刊63种)、“民国报纸数据库”(收入《益世报》)和“民国图书数据库”(收入图书176册)。

浙江图书馆建成“民国报纸数据库”(收录《正报》和《当代日报》,其余报纸尚在补充和完善中)和“民国期刊数据库”(收入民国期刊206种)。

其他公共图书馆自建有民国文献数据库的还包括湖北省图书馆“辛亥革命”“中国共产党武汉斗争史”,黑龙江图书馆“抗日战争文献”,湖南图书馆“辛亥革命专题资料库”,陕西省图书馆“西安事变数据库”,江西省图书馆“江西二次国内革命战争时期史料”,广西壮族自治区图书馆“广西民国照片”“广西民国人物”,宁波市图书馆“《申报》宁波史料(1872—1949)”“宁波市图书馆馆藏地方报纸(1899-1999)”,桂林图书馆“广西抗战文化”“广西红色历史文化·抗战文化”,大连图书馆“馆藏‘满铁’资料全文数据库”“馆藏罗振玉学术全集数据库”“馆藏旧报刊目录数据库”等。

二、公共图书馆民国文献数据库建设状况分析

1.基本实现馆藏民国文献书目检索

在全国图书馆缩微复制中心的协调下,2001年开始,民国图书现存状况调查工作在公共图书馆范围内启动,全国有22家省级公共图书馆参与了此次调查。据相关报道,截至2007年底,所有参与馆均完成了馆藏民国图书的清点和编目工作。[17]据笔者在各图书馆网站的检索,可检到图书馆专门建有民国文献书目库的主要有辽宁省图书馆“馆藏民国图书数据库”“馆藏建国前辽宁期刊数据库”,广东省立中山图书馆“解放前广东报纸库”“建国前广东期刊库”,首都图书馆“民国图书书目检索”等。其他未找到专门民国文献书目数据库的图书馆,如湖北省图书馆、黑龙江图书馆、广西壮族自治区图书馆、陕西省图书馆等,在OPAC上可直接进行检索。另外,一些民国文献藏量较大的图书馆,如浙江图书馆、安徽图书馆、四川图书馆,目前只有书目数据库,未见对文献进行进一步开发和整理的全文或专题数据库。

2.基于馆藏和地方文献开发全文数据库

公共图书馆的全文数据库建设通常以馆藏资源为基础,一些实力较强、收藏民国文献较多的图书馆,通过缩微数字转化或自建的方式实现馆藏文献的全文数字化,如浙江图书馆“民国期刊库”、重庆图书馆“民国文献全文数据库”、广东省立中山图书馆“缩微文献全文数据库”以及天津图书馆“缩微文献影像数据库”等。

公共图书馆在特色文献,尤其是地方版老报纸的数字化建设上,也有所建树。规模较大的当属上海图书馆“字林洋行中英文报纸全文数据库(1850—1951)”和宁波市图书馆“馆藏地方报纸(1899—1999)”。前者收入《北华捷报》《字林西报》《上海新报》《沪报》等7种中英文报纸,后者收入《甬报》等29种地方老报纸。另外,首都图书馆“北京记忆·昨日报章”收入《北平日报》《京报》等共22万页;天津图书馆的《益世报》,辽宁图书馆的《盛京时报》《东北日报》,浙江图书馆的《正报》《当代日报》等,也都已建成全文数据库。

3.专题数据库建设各具特色

除馆藏全文数据库建设外,公共图书馆的自建数据库的馆藏特色和地方特色显著:有充分挖掘馆藏或征集海外资料建成的专题数据库,如国家图书馆“民国法律数字化资源库”“东京审判资源库”,辽宁省图书馆“馆藏‘满铁’图书资料数据库”,上海图书馆“近代民国中医药专题数据库”等;有充分体现地方特色的图片型数据库,如广西壮族自治区图书馆“广西民国人物”“广西民国照片”,广东省立中山图书馆“广东历史图片库”“孙中山全文数据库”,辽宁图书馆“东北抗战图片库”“东北抗战人物库”,南京图书馆“中国近代文献图像数据库”等;有史料型数据库,如江西省图书馆“江西二次国内革命战争时期史料”,宁波市图书馆“《申报》宁波史料”等。另外,还有汇集文献、史料、图片于一体的综合型专题数据库,如重庆图书馆“中国抗战大后方3D数字图书馆”,湖南图书馆“辛亥革命专题资源库”,辽宁省图书馆“张学良专题数据库”“‘九一八’专题数据库”,首都图书馆“北京记忆”,桂林图书馆“广西红色历史文化·抗战文化”,陕西省图书馆“西安事变数据库”等。

4.部分实现资源共享

通过文化部、财政部2011年推出的“数字图书馆推广工程”,部分民国文献数据库,如国家图书馆“地方馆民国文献”、人民出版社“日出东方——马克思主义中国化90年大型电子图书展”等,在一些图书馆数字虚拟网运行;上海图书馆等公共图书馆网站也链接共享了“海德堡大学晚清和民国时期中国女性杂志资料库”“天津图书馆缩微文献影像数据库”“宁波图书馆宁波特色数据库”“大连图书馆特殊馆藏数据库”等几种民国文献数据库资源。这些资源的共建共享,充实了地方馆的数据库资源,也为资源宣传、使用提供了便捷条件。

三、公共图书馆民国文献数据库建设存在的问题及对策建议

1.应重视数据库重复建设现象,加强统筹规划

目前已建成的民国文献数据库,基本上是各图书馆依托自有馆藏进行的全文数据库建设。由于没有统一的协调和规划,各馆的数字资源也出于自我保护等原因几乎都不提供共享,因此,每个图书馆在建全文库时无法下载或使用到他馆的电子数据,只能利用自己的纸质资源进行扫描或拍照,造成数据库数据的重复建设。同时由于扫描或拍照多多少少会对纸本文献造成一定程度的损坏,因此,数据重复建设,不仅浪费大量人力,而且也非常不利于民国纸质文献的保护。

国家图书馆、上海图书馆、南京图书馆等,作为全国或区域中心馆,在公共图书馆的民国文献数字化开发上具有引领和主导地位,因此,下一步的民国文献数据库建设,迫切需要各中心馆发挥引领和统筹作用,通过文献普查,了解各馆文献资源状况,立项规划,统一实施数字化建设,让各馆之间有更好的合作和协调,共同建设,共享资源。

2.应通过购买获取综合性数据库,注重专题库建设

目前,在公共图书馆进行的全文数据库开发方面,以学科主题建成的专题全文数据库,主要有国家图书馆“民国法律数字化资源库”“东京审判资源库”,上海图书馆“近代民国中医药专题库”等,数量不多。从大部分已建有全文数据库的图书馆来看,基本上是按文献类型而不是按学科专题建设的馆藏综合性全文库,比如天津图书馆“民国期刊数据库”、浙江图书馆“民国期刊”、重庆图书馆“民国文献全文数据库”等。

目前,可通过购买获取的综合性的民国文献数据库,已有“民国时期期刊全文数据库”“民国时期文献总库”“大成老旧刊数据库”等10余种,[18]这些数据库收录文献的范围和数量非常大,远远超过单一图书馆的馆藏,完全可以满足读者需求,各馆已没有自建综合性数据库的必要。因此,公共图书馆应在专题或专科文献的挖掘式整理开发方面做更多的考虑,或者按时间范围、地域区间,或者按学科分类,建设专题文献汇编型数据库,为学科或某一领域的研究提供更全面和专业的资源。目前国家图书馆“民国文献保护计划”已把建设一批高质量的民国文献专题资源库作为主要的规划列入其“十三五计划”,说明专题数据库的建设已经开始受到关注并将有统筹地推进。

3.应放宽用户访问限制,扩大远程访问范围

目前公共图书馆开发的绝大多数民国文献全文数据库,可以提供免费全文浏览的只有国家图书馆的“民国中文期刊资源库”和浙江省图书馆的“民国期刊”等少数几种,大多都设有馆外访问限制;如果不是本馆IP,基本无法提供全文阅览,更没有任何一个数据库可以提供下载服务。

当前网络开放资源越来越多,读者获取资源的渠道和途径已经不仅仅限于图书馆,对已有数字资源的限制只会使读者日渐远离图书馆。文献的开放获取已经成为图书馆发展的必然趋势,图书馆花大量人力和物力建设的馆藏数字资源,若不能被用户知道并便捷使用,将是极大的浪费。因此,图书馆在数据库建成后,应更多考虑如何在有效保护知识产权的前提下最大程度地放宽用户限制,使数字资源实现最大化的共享和使用。

在扩大数字资源使用范围方面,上海图书馆也提供了一些可资借鉴的经验。上海图书馆近年着力打造了“市民数字阅读整合服务平台”,读者持证即可通过互联网和局域网访问绝大部分的数字资源。同时,配合到各个高校的巡回办证活动,让更多的读者拥有该馆借书证,免费远程使用该馆的数字资源,这些资源也包括了部分上海图书馆自建的非商业用途的民国文献数据库。

在全面开放获取尚不能完全实现的情况下,公共图书馆通过向特定的、有潜在资源使用需求的人群发放借书证的方式开放大部分数字资源的远程使用,有意识地扩大数字资源的用户范围,而不是仅局限于到馆读者,这也不失为提高数据库开放程度的一种有效方式。

4.应加强标引深度和检索功能,打造使用更便捷的数字资源

当前公共图书馆开发的一些民国文献数据库,在检索和阅读功能的开发上因用途的不同而有着很大的区别。比如上海图书馆开发的“民国时期期刊全文数据库”“字林洋行中英文报纸全文数据库”,基于商业用途的需要,文献标引深度和内容揭示程度较高,检索功能和检索途径的设计比较完善,不仅提供作者、刊名、年份检索,还可以从篇名、作者、分类号等各种途径组配检索;不仅可以在线浏览图片文件,也提供PDF下载服务。另外借助其数据库提供的文献导航、索引导出、主题导引、文献类型分类检索等功能,可以轻松获取民国期刊及其发表的论文、图片乃至广告的聚类结果,自动获取文献来源、作者、出版时间等数据信息,为开展民国时期相关学科的研究提供有参考意义的数据支持。

但大部分公共图书馆自行开发的数据库,功能的开发并未受到充分重视,存在文献标引深度和内容揭示程度较浅、检索功能较弱、检索途径单一等问题;在通常情况下,只进行了刊名、出版者、出版地等基础数据的标引。比如国家图书馆的“民国中文期刊资源库”,只能用刊名检索、按期浏览,没有提供篇名、作者的检索途径。另外,其数据库的阅读界面和阅读功能也较弱,基本上都只能在线浏览,不提供下载和打印。标引的欠缺、功能的不完善,使数据库的友好性、阅读体验和使用效率大打折扣。

因此,公共图书馆在民国文献数字化的过程中,不能仅仅满足于完成馆藏文献全文图片的扫描,还有必要发挥图书馆员在文献标引、检索方面的专业优势,在设计理念和功能开发上下足功夫,[19]让民国文献馆藏变成读者更加便捷使用的数字资源。

5.应借力新版民国文献,加快数据库建设

文献的影印出版和数据库建设,前期的工作基本上是相同的,都需要对原版文献进行图片扫描,因此数据库的建设完全可以利用已出版影印文献的图片作为基础数据来源。国家图书馆在这方面有所尝试,其开发的“东京审判资源库”即是运用现代信息技术手段对国家图书馆出版社出版的《远东国际军事法庭庭审记录》《远东国际军事法律判决书(中英文版)》和《东京审判图片集》进行的全面揭示。

但是,从公共图书馆数据库建设的整体现状来看,基本上很少依托影印版纸质文献开展。据粗略统计,2000年以来整理和影印出版的新版民国文献丛书有600余种,所包含的民国时期原版图书大约5万种,原版期刊1000余种,档案几十万卷。国家图书馆出版社作为最主要的民国文献出版机构,出版了大量的影印版民国文献,形成了民国时期文献资料丛编系列,抗日战争文献史料丛编系列,目录、图录、索引等二次文献系列,等等,共六大出版系列。但国家图书馆的数据库建设并没有如影印文献出版一样繁荣,纸质文献的出版资源没有在数据库建设上得到很好的利用,相互之间没有形成相辅相成的关系。

纸质出版与数据库之间相互利用后台数据的借力方式,也许是由于版权、销售等诸多因素影响而并没有得到广泛运用,但公共图书馆在数据库的建设中设法利用新版影印文献已有的基础数据而不是重新扫描原始文献获取数据,既是对原始文献的保护,也是加快数据库建设的有效途径,同时也可减少资料调研和收集的时间、人力成本,这值得我们在下一步的数据库建设中认真思考。

[1] 王雅戈.民国文献整理研究进展[J].图书馆建设,2011,(3).

[2] 段晓林.民国文献整理与研究的现状及其方向——回眸与展望:民国文献整理与研究国际学术研讨会综述[J].图书馆杂志,2017,(3).

[3] 曾经无比耀眼的上海出版业,如今能否重振雄风[EB/OL]. http://www.sohu.com/a/111150248_178249. 2017-06-04.

[4] 全国报刊索引.关于我们[EB/OL]. http://www.cnbksy.cn/news/footCategory?id=21. 2017-05-14.

[5] 陆健.传承与服务——上海图书馆近代报刊文献的数字资源建设[J].上海高校图书情报工作研究,2017,(1).

[6] 上海图书馆——旧日文书目数据库使用说明[EB/OL]. http://search.library.sh.cn/jiuriwen/. 2017-05-14.

[7] 上海图书馆——馆藏旧版西文文献目录数据库使用说明[EB/OL]. http://search.library.sh.cn/jiuxiwen/Help.htm. 2017-05-14.

[8] 上海图书馆——近代文献联合目录数据库使用说明[EB/OL]. http://search.library.sh.cn/lhml/help.htm. 2017-05-14.

[9] 中国现代电影期刊全目书志[EB/OL]. http://memoire.digilib.sh.cn/SHNH/. 2017-05-14.

[10]上海图书馆馆藏淞沪抗战图片库[EB/OL].http://memoire.digilib.sh.cn/SHKZ/. 2017-05-14.

[11] 全勤.南京图书馆民国文献保护与开发研究[J].国家图书馆学刊,2014,(2).

[12] 张慧.浅析“中国近代文献图像数据库”的图片标引[J].科技情报开发与经济,2012,(23).

[13] 黄登.重庆图书馆数字化民国文献检索系统功能及服务模式探讨[J].重庆图情研究, 2012,(1).

[14] 陈佳香.重庆图书馆馆藏民国文献源流、特色及数字化[J].数字与缩微影像, 2014,(3).

[15] 重庆推出“中国抗战大后方3D数字图书馆”[EB/OL]. http://www.ndlib.cn/tggcxwzt/201409/t20140910_89538.htm. 2016-07-12.

[16] 刘家强.辽宁省图书馆藏旧报纸数字化管见[J].图书馆学刊,2013,(8).

[17] 张军.百岁民国图书——从出版发行到保护抢救[J].图书馆工作与研究,2011,(1).

[18] 段晓林.民国文献数据库开发现状研究[J].图书馆学研究,2016,(20).

[19] 段晓林,蔡迎春.高校图书馆民国文献自建数据库调查与分析[J].上海高校图书情报工作研究,2016,(3).

(责任编辑:申 浩)

Public Library Databases about Literature of the Republic of China

MU Weiguo, DUAN Xiaolin

(Library, Shanghai Normal University, Shanghai 200234, China)

The public libraries are the main storage institutions of the literature of the Republic of China. In recent years, a large number of full-text databases and specific databases have been built by some key public libraries in China. However, there is no research on these self-built databases. The paper introduces the general situation of the self-built databases about literature of the Republic of China including National Library, Shanghai Library, Nanjing Library, Chongqing Library and Liaoning Library, analyses the current situation of digital development, points out the problems in database construction, and then puts forward some suggestions.

literature of the Republic of China, self-built database, public library

2017-01-08

长三角地区高校图书馆联盟——图书情报研究基金一般项目“民国文献影印出版与馆藏发展实证研究”;上海师范大学“文科振兴”项目“民国文献整理与研究发展报告”

穆卫国,陕西西安人,上海师范大学图书馆,主要从事图书馆学研究。

G250.74

A

1004-8634(2017)04-0094-(08)

10.13852/J.CNKI.JSHNU.2017.04.012

段晓林,云南昆明人,上海师范大学图书馆副研究馆员,主要从事文献学研究。

猜你喜欢
上海图书馆国家图书馆民国
国家图书馆出版社重点图书
国家图书馆藏四种古籍编目志疑
图书馆中文图书借阅排行榜(2019年12月)
他们为何都爱民国?
中国国家图书馆藏西夏文《不空羂索神变真言经》考论
数字阅读推广新形式研究
中美公共图书馆社交媒体营销比较研究
创新创业环境下公共图书馆企业信息服务的转型
民国人爱刷朋友圈
国家图书馆藏吴奕杂剧二种略考