856字段对馆藏纸本资源与电子资源的双向有效揭示

2010-05-03 08:50兰州理工大学图书馆甘肃兰州730050
图书馆建设 2010年2期
关键词:电子图书字段书目

李 征 (兰州理工大学图书馆 甘肃 兰州 730050)

1 前 言

随着图书馆资源建设的不断发展、各种载体馆藏书目数据库建设的逐步完成及中外文大型数据库的大量购入,馆藏结构向纸质文献与数字信息共存的形态转变。但笔者看到,大量的传统馆藏资源和购入的数据库之间毫无关联,给读者使用资源带来不便。读者需要的是通过一个统一的界面,一次性检索便可获得多种类型文献数据而不遗漏任何载体的馆藏信息。而对于读者来说,OPAC(Online Public Access Catalogue,联机公共目录查询系统)应当是反映图书馆全部馆藏、包容各种载体文献的重要窗口。将数字化馆藏资源纳入目录控制通过OPAC揭示,就必须对馆藏数字化资源进行编目,将其MARC(MAchine-Readable Cataloging,机读编目格式)记录加入中央馆藏中,并改变数据库中电子文献游离于馆藏目录控制之外的状况,使其与印刷型馆藏融为一体,而856字段是对图书馆馆藏文献进行数字化有效揭示的最好方法。目前,有些数据库提供商(如EBSCO)向订户提供所购数据库收录的电子期刊的MARC记录,并在其MARC记录中加入856字段以实现馆藏书目数据库与所购数据库的链接。这可以使图书馆以批处理方式直接将现成的MARC记录装入本馆的中央书目库中,通过856字段的指引,在OPAC中直接点击访问具体网络文献。该技术是通过Z39.50等协议作为后台支持的,因此,这种链接的实现没有技术上的障碍[1]。国内外多数图书馆使用的自动化系统(如ILAS、汇文图书馆集成管理系统、INNOPAC、Horizon、SIRSI等)均支持Z39.50协议,以实现图书馆馆藏书目数据库与近年来购入的国内外各种电子图书、电子期刊等数据库的链接;对本馆纸本馆藏中没有的图书、期刊直接链接电子资源;对纸本馆藏中有的图书、期刊显示纸本收藏情况、纸本在馆情况及链接电子资源。这对于多数图书馆来说,是馆藏纸本资源全部揭示为数字化资源的一种捷径,是在纸本资源全部借出时补充读者需求的最好方式,是满足读者不同阅读需求、提高资源有效利用率的最好方法,是中小型图书馆在当前没有能力完成本馆纸本资源全面数字化的情况下全面揭示馆藏数字化的一种探索,也是各图书馆对书目数据库的一种开发和利用。

2 856字段的定义

20世纪90年代中期,美国国会图书馆为了在机读目录中揭示各类数字化资源,在USMARC(United States MAchine-Readable Cataloging,美国机读目录格式)中增加了一系列新的字段或为有些字段扩充了新的定义,如130、256、307、516、538、856字段。我国西文编目基本采用USMARC,而CALIS(China Academic Library & Information System,中国高等教育文献保障系统)联机合作编目项目已在中文CNMARC(China MAchine-Readable Catalogue,中国机读目录)格式中正式采用了以上字段。其中856字段被定义为:电子资源地址与检索,可重复,有主机名称、路径、文档名称等26个子字段。其指示符1为电子资源的检索方法(包括:# 无信息提供,0 电子邮件,1 文件传输协议,2 远程登录,3 拨号入网,4 超文本传输协议,7 检索方法,$2中说明)。指示符2表示856字段的电子资源与编目文献之间的关系(包括:# 未定义,0电子文献,1有电子版,2相关资源有电子版,8不生成附注导语)[2]。856字段在实际应用中,主要使用子字段@u和@z。@u来标注与电子资源的URL(Uniform Resource Locator,统一资源定位符或称网页地址)链接,@z用于电子资源地址相关的附注说明。如@z为“点击查看电子资源”,则读者在检索界面可以看到“点击查看电子资源”的超级链接,点击便可以直接打开@u所指向的具体的电子资源的地址,从而实现书目记录与电子资源的无缝链接。而这些就是我们图书馆人需要做的工作。在开展这项工作时,应该先易后难(中文资源较西文资源易于实现),先小后大(数据库资源量相对较小的易实现),逐步实现本馆馆藏书目数据库与购入的电子资源数据库的链接,进而发展到网络虚拟资源与馆藏书目数据库的链接,实现馆藏资源数字化的有效揭示。笔者结合自己所工作的兰州理工大学图书馆(以下简称我馆)关于856字段的使用,谈些许拙见,供同仁商讨,以促进856字段的使用和馆藏数字化目标的实现。

3 856字段在电子图书中的使用

我馆购入的电子图书有书生之家电子图书、方正Apabi教学参考书、超星电子图书、读秀知识库、Knovel电子书。从我们建立856字段的原则分析来看,电子图书中的方正Apabi教学参考书是中文资源,其数据量相对较小而使用率较高,是我馆进行856字段著录的首选。图1是馆藏书目数据MARC记录中加入856字段的实例。

图1 馆藏书目数据MARC记录中加入856字段的书目著录格式

当在OPAC检索某本书时,若馆藏中没有此书,可在OPAC上点击“点击此处查看方正Apabi电子书”,链接到Apabi数字资源平台,从而查看电子图书。若馆藏中有此书,也可在OPAC上查看纸本图书的在馆情况,当该书全部借出时,点击“点击此处查看方正Apabi电子书”即可查看电子图书。同时,也实现了方正Apabi数字资源平台电子图书向馆藏书目数据库链接。如在方正Apabi数字资源平台查找某本电子图书时,若想了解该书的在馆情况,通过方正Apabi数字资源平台中“点击查看纸本图书”,就可链接到馆藏OPAC书目记录中该图书的在馆状况。此外,我馆开发了本科教学参考书系统。该系统建立了全校所有课程的教学参考书的书目数据库,并且将该数据库记录和馆藏书目数据库建立了链接。这样,在学生选课后,若想了解课程需要的教学参考书,就可链接到本馆的馆藏书目数据库中,了解馆藏收藏和在馆状况,而从馆藏书目数据库又可链接方正Apabi数字资源平台的电子图书。从使用效果来看,非常受学生欢迎。该项工作主要是和北京方正Apabi技术有限公司合作完成,我馆确定镜像服务器地址,该公司完成方正Apabi数字资源平台系统安装和方正Apabi数字资源平台的书目数据向馆藏OPAC书目记录的链接,并负责导出我馆购置的电子图书的MARC数据记录及在MARC数据记录中加好856字段的内容。我馆在ILAS系统中设立要接入的电子图书MARC数据记录的书目控制号区段,通过ILAS系统数据接口,把电子图书MARC数据记录接入到ILAS系统中的中央书目库中(Biblios),实现馆藏纸本图书书目和电子图书的链接。目前,我馆又和超星读秀公司合作,向超星读秀公司提供纸本馆藏MARC数据,由超星读秀公司建立《读秀学术搜索》平台向本馆馆藏书目库的链接。同时,我们要求超星读秀公司为我馆提供购入的超星电子图书MARC数据,以实现本馆纸本图书向超星电子图书的链接,进而扩大纸本资源的数字化的有效揭示,为读者带来方便、快捷、满意的个性化服务。对于其他电子图书数据库公司,我们也将与其合作并完成链接及有效揭示。从856字段的建立来看,指示符1的内容为4表示超文本传输协议(HTTP);@u字段内容:电子资源的地址(URL),ID是ISBN 号;@z 字段内容:856字段标识的电子资源地址相关的附注,该附注用于公共显示。

4 856字段在电子期刊中的使用

本馆购入的电子期刊数据库有维普、CNKI、万方、人大报刊复印资料、Springer LINK等。其中,维普电子期刊数据库自1989年以来,收录有中文期刊12 000种、中文报纸1 000种、外文期刊4 000种,有文摘型电子期刊数据库,其资源拥有量几乎能完全覆盖我馆所订购的纸本期刊。若能在本馆纸本期刊的书目数据MARC中建立856字段,与维普电子期刊数据库链接,那么,我馆的纸本期刊几乎完全能被揭示为电子期刊。另外,维普的《中文科技期刊数据库(全文版)》具有符合国际技术标准OpenUrl协议的开放链接功能,可让用户从其他检索平台检索出文献篇名或期刊名后,直接链接到维普数据库的全文数据,只要用户的IP地址在被授权的范围之内就可以直接下载阅读相应的原文文献。因而,维普电子期刊数据库成为了我馆的首选。下面是维普公司提供的OpenUrl协议的连接规则和参数介绍:

4.1 连接规则协议

http://IP/cstj/sear.dll?SearchURL?sid=***&genre=***&issn=***&year=***&volume=***&issue=***&spage=***&title=***&pid=****(标准的OpenUrl协议规则)

其中IP为维普《中文科技期刊数据库(全文版)》安装所在的服务器IP地址或网址。

各参数意义分别为sid——数据库提供商;genre——数据类型;issn——国际刊号;year——年份;volume——卷;issue——期;spage——开始页;title——题名;pid——刊名。其中sid和genre的参数值固定不变,也可以为空;pid需要进行URL Encode的编码,用UTF-8字符集。而使用UTF-8编码的好处是国外的用户如果使用Windows XP英文版浏览UTF-8编码的任何网页,无论是中文还是日文、韩文、阿拉伯文,都可以正常显示,UTF-8是世界通用的语言编码。

4.2 工作过程

目的:用issn或pid来定位一种期刊,用year、volume、issue来定位一本期刊,用title来定位一条记录。

如果issn有值,则不需要pid值(pid可以为空值);反之,需要将刊名pid的值解码。

如果title有值,则定位到一条记录的全文;反之,在issn(或pid)有值,其它值都为空的条件下,返回整刊的题录数据。

利用这种参数规则就可以与OPAC系统实现对接,为OPAC系统提供刊内检索和全文服务。

4.3 OPAC系统连接专用接口

上面介绍了通过标准的OpenUrl协议规则实现与OPAC系统的链接。为了方面用户使用,维普的《中文科技期刊数据库(全文版)》还提供一种更加简洁的、专为OPAC系统提供链接的接口(我馆选用了该接口)。接口规则为:

http://……/cstj/sear.dll?OPAC?ISSN=****&KM=****

其中,ISSN为国际标准刊号,KM为刊名。由于只有两个参数,方便简单。笔者建议OPAC系统使用此接口与维普数据库实现链接。

原理:以issn号来定位一本期刊,当issn有正确的值时就可以返回结果,km的值可以为空;当issn值为空时,需要km有正确的值才能返回结果。

4.4 856字段的建立

4.4.1 在期刊书目MARC记录中逐条加入856字段

笔者认为可以调出期刊书目MARC记录,逐条建立856字段,如图2所示。

图2 期刊书目MARC记录逐条建立的856字段

其中,指示符1的内容为4表示超文本传输协议(HTTP),http://202.201.33.131:8080是镜像服务器地址,ISSN是该刊的ISSN号,KM是该刊刊名,@z是公开附注(说明)。多数图书馆的记录(期刊种数)在5 000条左右,加入856字段不会造成工作量过大,而易完成。

4.4.2 在期刊书目MARC中批量加入856字段

在期刊书目MARC中批量加入856字段时,系统必须带有MRAC数据的批处理工具。我馆使用的ILAS系统带有MARC数据批处理工具,因此可以对856字段的增加、替换进行批处理转换,经过增加、替换等几次批处理转换后的856字段如图3所示。经批处理后,856字段中会多出@x、@y、@w3个临时借用的字段符号,对其删除即可。

图3 经过增加、替换等几次批处理转换后的856字段

对西文期刊同样可建立856字段的链接。期刊书目库中MARC记录的条数是馆藏实际收藏刊的种数。因此,用OPAC检索某刊时,若本馆有此刊,会列出其题录和馆藏收藏情况。而“点击此处查看维普电子期刊”时,若维普电子期刊收有此刊,既显示该刊收藏范围及每种刊的目次,又可在目次下看到刊内某篇文章的摘要,还可下载原文。这样就提高了馆藏期刊资源数字化的揭示率和使用率。

5 书附光盘856字段的建立

关于书附光盘方面,我馆分两步建设(主要是因为存储设备不足)。第一步:把上万种光盘作MARC著录(在系统中单独为其设置一段书目控制号区段和条码区段)。著录时,调出书目记录,复制一条记录后,对该记录作如下修改:

010字段——该字段著录文献国际标准号和获得方式,著录子字段 @a ISBN号,@d 获得方式。若该光盘有不同于图书的文献国际标准号、唱片号,那么需要复制一行重新著录@a。如果光盘是购买的,@d著录其价格;如果是随书赠送的,可著录@d为附书光盘或磁盘。

200字段——该字段著录电子文献的题名及有关信息,著录子字段@a电子文献的正题名,@b文献类型,如@b光盘或@b磁盘。

210字段—— 该字段著录电子文献出版社发行项,有两家或两家以上的出版社时,逐一著录。

215字段——该字段包含在编文献的载体特征方面的信息。著录子字段 @a特定文献类型标识和文献数量,如@a2 computer optical disc或@a1 computer disk ;著录子字段@d尺寸,著录光盘的直径15cm或8cm,磁盘的直径9cm。

著录时加入馆藏条码,经审校入书目总库。我们把某一种中的1张或1套作为保留光盘(母盘)长期保存,其余的像图书一样供读者借阅,若光盘损坏,可用保留光盘刻录补充,从而极大地提高了光盘的利用率。第二步:在有条件时,将光盘(母盘)制作成可供下载安装的光盘镜像ISO文件,上载到FTP服务器上,使用MARC的856字段(如图4),使读者方便地下载光盘文件。同时,我馆还探索了使用MARC的856字段建立校内相关专题资源的全文、摄影作品、字画、音频、视频等资料的有效链接,这里不再一一赘述。

图4 书附光盘MARC记录建立的856字段

6 网上虚拟资源856字段的建立

随着数字化革命的深入和因特网的飞速发展,网络信息资源呈现出几何级数量增长,规模已超越了现有的非网络资源,信息资源从内容到形式都发生了质的变化。网络信息资源与非网络资源相比,具有地理上分散、组织上无序、数据类型多样、信息组合错综复杂等特点。当信息的需求者面对如此浩瀚的信息海洋无法快捷地获取自己所需的信息时,常常会对检索和获取信息的低效感到无奈。要解决二者之间的矛盾,为用户提供便利的信息获取途径和方法,就图书馆而言,最为有效的方法是将网络信息资源纳入图书馆的服务当中,即选定好的网络资源,对其进行编目,从而将信息资源系统地组织起来,供用户浏览与检索。图书馆员可以用MARC格式对其进行编目, 而目前 856字段已定义了20多个子字段,包括主机地址、检索地址、电子文件名、用户名、口令、帮助信息、操作系统、电子文献格式、文件大小、统一资源定位器等。但以MARC格式编目网络资源的做法成本较高(需要耗费较多的财力、人力和时间),而且不容易跟上网络资源的增长速度。因为MARC格式对编目特定馆藏、信息资源地址稳定及较重要的网络信息资源较有优势,而互联网上的信息动态性过强,链接到的信息常在一段时间后就不存在或者信息的网址发生变化,使856字段的链接失效,这将严重制约MARC记录中加入856字段进行网络信息资源的链接。因为,失效链接的存在,会为书目数据库中积累太多无用的856字段。因而,网上的信息资源著录工具DC(Dublin Core)——都柏林核心诞生。它是一项描述信息资源的国际标准。1995年3月,在俄亥俄州的都柏林核心研讨会上,52位来自图书馆、计算机和网络方面的学者和专家共同探讨了网络信息资源的描述问题,创建了都柏林核心集。1999年10月,在德国的第七次都柏林核心研讨会上,就巩固不同都柏林核心工作组的发展,分享实施都柏林核心的经验,推动都柏林核心在异构元数据系统中对互用性的支持进行讨论[3]。这次会议对DC元数据进行了重大改进,使DC元数据与MARC之间映射更加一致,有利于将MARC转换为DC元数据。在网络信息资源编目过程中,采用DC作为网络信息资源的著录工具、XML文档结构作为著录格式是将网络信息资源序化的理想模式。并且一些升级的图书馆自动化集成系统引入元数据和MARC兼容的编目,可将MARC编目数据转化为元数据。这样就可利用各种数据库入口或ODBC(Open DataBase Connectivity,开放数据库连接)标准直接获取各种异构系统的裸数据,构建新的数据集合或者对各种异构系统的裸数据直接访问、直接处理。也可设计Agent中间件,如用户在OPAC系统中检索定位到某一本图书时,OPAC会在后台将对应的参数传递给Agent,Agent利用通用数据库接口在电子图书数据库中查找对应的电子图书,从而实现异构系统数据库的链接[4]。所有这些的发展,为网络资源编目和异构数据库的链接开辟了新的空间。

总之,856字段在图书馆馆藏资源的数字化的有效揭示上还有许多值得我们研究、探讨和开发的地方。笔者认为只有恰当运用其优势,避免其不足(不是其本身的不足,而是客观的不足),才能使856字段在馆藏开发上发挥其应有的特点、功能,在馆藏全面数字化的进程中发挥其应发挥的优势。

[1]数字化馆藏资源的多层次揭示[EB/OL]. (2009-04-10)[2009-05-21].http://lw.china-b.com/gllw/20090410/1299549_1.html.

[2]谢琴芳. CALIS联机合作编目手册:下[M]. 北京:北京大学出版社, 2000.

[3]都柏林核心(Dublin Core)元数据[EB/OL]. (2007-09-18) [2009-05-21].http://www.danganj.net/bbs/viewthread.php?tid=1339.

[4]论基于OPAC的信息资源整合信息资源整合的现实意义[EB/OL]. (2009-04-10) [2009-05-21].http://blog.5d.cn/user11/pine/200601/202396.html.

猜你喜欢
电子图书字段书目
图书馆中文图书编目外包数据质量控制分析
推荐书目《初春之城》
出版社纸质图书与电子图书出版的价值链比较
CNMARC304字段和314字段责任附注方式解析
无正题名文献著录方法评述
关于CNMARC的3--字段改革的必要性与可行性研究
电子书是否会取代传统图书?
本刊邮购书目
《全国新书目》2009年1月荐书榜
北大方正提供373种电子图书信息