基于超星发现系统的高校图书馆中文资源发现服务*

2014-02-28 14:45王天虹
图书馆学刊 2014年8期
关键词:超星检索图书馆

王天虹

(天津师范大学图书馆,天津 300387)

基于超星发现系统的高校图书馆中文资源发现服务*

王天虹

(天津师范大学图书馆,天津 300387)

目前我国高校图书馆所使用的国外资源发现系统对于图书馆中文资源的整合、发现、获取的效果都差强人意。北京超星公司于2012年推出了中文资源发现系统——超星发现。对基于超星发现系统的高校图书馆中文资源发现服务进行了初步评估,并比较了其与国外发现系统的不同之处。

超星发现系统 中文资源发现服务 高校图书馆

在当前高校图书馆的各类型学术信息资源激增的背景之下,发现服务得到了广泛且迅速的推广和应用。目前我国高校图书馆普遍使用的资源发现系统都是由国外的数据库厂商或图书馆集成系统开发商推出的,其中主要包括Summon、Primo Central、EBSCO Discovery Service(EDS)等几大发现系统。经过笔者的调研发现,国外的资源发现系统对于高校图书馆中文资源的整合、发现并获取的效果都差强人意,而CNKI学术搜索、CALIS的e读学术搜索等虽然可以称之为国内中文资源发现服务的雏形,但是无论是元数据覆盖的范围还是系统的运行机制与功能都存在着一定的欠缺,对单个图书馆的资源发现效果并不理想。因此,尽快开发拥有自主知识产权的网络级中文发现服务依然受到了国内图书馆界的广泛关注。北京超星公司于2012年推出了中文发现系统——超星发现,超星发现旨在全面、准确地发现中文资源,并且能够为用户提供具有知识挖掘与情报分析功能的中文发现系统。超星发现系统是否可以称之为中文资源发现服务的一种较为完善的解决方案,较之国外发现系统有何不同之处,笔者对此进行了初步的探讨。

1 发现服务的概念和特征

资源发现服务可视为一套系统[1],对于发现服务的概念并没有统一的界定。笔者认为,对于高校图书馆来说,中文资源发现服务就是利用预索引元数据仓储模式提供服务的资源发现系统,将各类型中文资源内容包括图书馆的OPAC进行有效的整合,从而实现高校图书馆所有中文资源的无缝连接。同时帮助读者迅速、准确地发现并可以直接获取图书馆的各类型中文资源以及开放获取资源,另外在此基础上进行知识与情报的深入分析和挖掘,来帮助用户发现高价值的中文学术文献,以实现知识的进一步发现。

发现服务的特征正是基于海量的元数据中心仓储数据,采用先进的技术手段改善了图书馆用户的检索体验,并有效地提升了检索质量(见图1)。在改善用户检索体验方面,发现服务提供类似Google的单一检索框,通过简单、易操作的检索入口对图书馆的所有资源进行检索和获取。发现服务的数据搜索主要是在一个索引数据库中进行,因此可以实现迅速、快捷的检索,再通过对检索结果的相关度排序、分面导航等功能来帮助用户发现最适合的资源。另外包括检索词提示和纠错、标签、评论、可视化等Web2.0功能的融入与支持,有效提升了网络环境下的交互性用户体验;在提升检索质量方面,发现服务可以实现对图书馆资源的全面覆盖,特别是能够实现对OPAC的有效整合,并通过预处理保证了元数据的质量,从而有效提高了检索结果的查全率和查准率。

图1 发现服务特征

2 国外发现系统对于中文资源整合与发现的局限性

笔者通过采取网站调研、系统调查、文献调研等非介入式调查方法和访谈法,对国内几所已经采用国外发现系统的重点高校图书馆的使用情况进行了调研,其中主要包括:Primo Central系统使用代表——上海交通大学图书馆(思源探索)和清华大学图书馆(水木搜索),Summon系统的使用代表——北京大学图书馆(未名搜索),EDS系统的使用代表——中山大学图书馆(智慧搜索)。通过调研发现国外资源发现系统在整合、处理中文资源的时候,都存在着如下一些不容忽视的问题。

2.1 对中文元数据的获取不足

国外发现系统与国内的出版商或数据库厂商合作签约获得元数据的进程非常艰难而缓慢,普遍收录不足的现象比较明显,因此中文元数据的不丰富或者质量不高直接导致的是中文资源发现率降低。比如:上海交通大学的“思源探索”中的中文电子图书元数据厚度较弱,一般只有书名、作者、ISBN号和出版社信息,而没有关键词、摘要等信息。在中文期刊全文的获取上,国外发现系统也都存在着一些障碍,比如通过“未名搜索”和“思源探索”检索到相关的中文期刊文献后,点击查看全文,都是只能到达该期刊的目录界面,需要采取进一步的检索,才能找到该篇文献的全文标题链接界面。中山大学的“智慧发现”甚至连常用的一些中文文献资源都无法检索到。另外,国外发现系统大都集成以文本形式为基础的资源,对于视频、音频等多媒体资源则涉及较少,在这几所高校图书馆的发现系统中能够找到的中文多媒体资源通常只有本馆自建的一些多媒体数据库中的内容。

2.2 对中文数据的处理能力、汉化水平都有待提高

国外的资源发现系统对西文资源处理得比较好,但是对中文数据的处理却不尽如人意。比如清华大学的“水木搜索”,查找中文期刊文献时,分面导航功能中的中文期刊名称仍然采用英文显示。中山大学的“智慧搜索”,界面的汉化比较差,EDS发现系统在简体版的汉化及中文数据的处理能力方面都有比较大的欠缺。

2.3 中文检索技术不够成熟

由于西文资源和中文资源在检索的技术和方法上存在着差异,国外发现系统对于中文资源检索的方法还有待进一步完善,比如在使用Primo系统检索中文资源时,检索词加引号和不加引号,检索结果的数量和相关性都有较大的差距[2]。另外,也存在着无法有效地辨识与处理繁体中文的问题。

2.4 知识深入分析的功能欠缺

通过调研发现,自定义标签等国外发现系统比较侧重的Web2.0功能,图书馆用户却对此并不感兴趣,这也是图书馆用户与一般网络用户在功能感知上的不同[3]。而国外发现系统对于知识的深入分析与挖掘方面的功能并不突出,这恰恰是高校图书馆用户特别是高级用户群体比较关注的部分,他们期望能够从发现系统中找到并直观、清晰地看到某个关键词、某个主题甚至某个学科近几年的研究发展态势、相关文献知识之间的关联分析等。除清华大学图书馆利用Primo发现平台的元数据进行了研究热点、学科趋势分析等可视化的二次开发,在其他几所高校的发现系统调研中并没有看到相关的内容。

3 超星发现系统的应用实践与评估

超星发现系统自2012年起已经在国内的诸多高校开始了推广和应用,目前天津大学已经正式引进了该系统,天津市其他高校也开始了对该系统的试用。从发现服务的特点出发,通过实际的应用,对基于超星发现系统的中文资源发现服务进行了初步的评估。

3.1 用户检索体验

3.1.1 用户界面与检索结果处理

超星发现系统的用户界面是一般发现服务所采用的类似Google的单一检索框,充分体现了简单、易用的检索理念,也提供高级检索的功能来适应高校图书馆用户传统的检索习惯,同时提供了图书馆员使用的专业检索,均可实现与简单检索间的自由切换。

用户界面的另一个功能是完成对检索结果的显示。对于检索结果的排序,提供馆藏优先、出版日期降序、出版日期升序、本单位产出、相关性、学术性的多种排序功能。在结果的显示上,超星中文发现系统提供精炼检索和分面浏览功能,这也是发现服务必备的一个功能。在分面选项中,除内容类型、关键词、年份、作者、作者机构、学科分类等常见选项,还设置了“不包括同位词检索”,让用户来自由扩充和缩减检索结果。通过设置“检索学术文章”和“不包含报纸文章”两个分面选项来帮助高校用户过滤掉非学术性的一些报纸杂志类信息。另外,设置了重要期刊的分面选项,可以勾选查找中文核心期刊、CSSCI中文社科引文索引、CSCD中国科学引文索引等收录的期刊,更加符合中文学术发现的需要,满足高校教师、研究生等高级用户获取中文学术信息的期望。

3.1.2 Web2.0功能的融入

作为发现服务又一显著特点的Web2.0功能,在超星发现系统的用户界面也有突出的表现。比如将检索词提示和纠错功能进行了进一步的扩展即将常用检索词汇总并提示在检索框之下,如果用户的检索切入点是某一个作者时,系统会主动推送作者的简历与相关文章。除标签、评论、BLOG等功能得到充分运用之外,值得一提的是超星发现系统的可视化功能比较突出,将检索结果进行数据分析后,通过可视化来展示各个知识点之间的关联,从而更容易帮助读者发现新的知识,并能够直接获取该知识的相关文献。同时提供包含某个检索词的图书、期刊、学位论文、会议论文、专利及标准的学术发展趋势曲线图以及该检索词的报纸关注热点趋势曲线图,在此基础上还能实现多主题对比的可视化。另外,文章引证关系的可视化也是很多高校用户所关注的内容。

3.2 检索质量

3.2.1 元数据覆盖范围与质量

中文元数据的规模与质量是中文资源发现与获取的关键。北京超星集团公司拥有目前世界上最大的中文图书数据库,并且始终致力于不断扩充自己在各类型资源上的覆盖率。根据超星公司在天津大学的超星发现系统发布仪式上的介绍,截至2013年2月1日,超星发现系统中的中文元数据及全文数据量达1.99亿条,其中资源覆盖452万种图书、7800万篇期刊、370万篇学位论文、400万篇会议论文、1亿篇报纸文章、52万篇标准、770万篇专利、10亿个网页和200万部视频[4]。由于超星公司是世界最大的中文电子书的出版商,因此不仅能够保证中文电子书元数据的厚度,而且对于电子书的检索可以深入到章节级,可以对全文进行索引。在中文期刊的元数据方面,除超星公司自身所独有的1200万中文期刊元数据外,其他中文期刊的元数据还是主要通过元数据收割的方式来获取,但是通过这类方式获取的元数据质量要稍差。在期刊元数据的厚度上,大部分可以达到期刊名、作者、ISSN号、关键词、摘要级别。但是超星发现系统是否覆盖了绝大多数的中文核心期刊,还有待进一步评估。另外,对于国外发现系统在中文多媒体元数据上的欠缺,超星发现系统则较好地保障了这类元数据的规模与质量。由于超星公司拥有国内最丰富的学术视频资源,目前已制作完成了包括数十位两院院士在内的众多国内外知名专家、学者、教授讲授的大量学术视频内容,并且还以每年上万集的速度增加,这使得超星发现系统能够让高校图书馆用户去更多地发现与获取具有学术价值的中文多媒体资源。

在提供中文文献原文的链接与获取上,为用户提供本馆馆藏、电子全文和邮箱接收全文3种获取全文的方式,对于本馆拥有使用权限的商业数据库资源,能够直接链接到所需文献的全文标题下载界面,对于本馆所没有的中文图书或者期刊文献全文,可通过发现系统中的全国参考咨询服务平台或者图书馆文献咨询服务系统来获取。但是在期刊全文的获取上,也存在着由于部分期刊的元数据没有通过正式签约方式来获得内容商或者出版商的授权使用,从而导致期刊全文链接获取不稳定的情况时有发生。

3.2.2 与馆藏公共目录系统(OPAC)的整合

发现服务对OPAC的整合与发现是十分重要的,用户可以从超星发现平台的单一检索框完成多种类型资源的发现,包括对纸本馆藏的发现。由于超星公司是中文图书数据库的翘楚,因此在对于高校馆藏书目数据的处理上,首先进行数据对比,找到元数据仓储中没有的书目数据,将这部分数据经过查重、修正等预处理,再上载到发现系统中,与庞大的元数据仓储一起建立索引。由于只是单纯的数据整合,没有实现服务整合,即OPAC中个人记录查询、续借、预约等服务功能没有在发现系统的读者界面中呈现,因此用户必须进入原有的OPAC界面中完成上述服务功能的操作。

3.3 超星发现系统与国外发现系统的比较

超星发现系统与国外发现系统在技术上都是具有一个元数据的中心仓储,可以向图书馆提供基于云计算的“软件即服务”(SaaS)的服务方式。两者之间最大的不同在于元数据中心索引覆盖的资源范围不同,前者是以中文资源为主,后者以外文资源为主。另外在具体的功能、服务、价格等方面也存在着一些不同。

①国外发现系统是开放式的,不对用户检索设限,而超星发现系统的检索是受IP访问权限限制的。

②对于大家所关注的发现服务对于OPAC的整合,国外的发现系统可以在数据整合的基础上实现服务层面的整合,比如Primo Central发现系统,而超星发现系统只能实现数据层面的整合。

③由于发现服务是基于海量元数据的搜索,检索结果的相关度排序是十分重要的。国外的发现系统大都支持可以调节相关度算法的功能,允许提升一些条目的排序[5],而超星发现系统则不支持这样的功能,也就不能针对图书馆用户的需求来不断优化、调整检索结果的相关度排序。

④对于高校图书馆自建数据库及资源的整合,国外发现系统已经能够比较好地处理这部分内容,而超星发现系统则没有看到这方面整合的具体实例,不排除一些高校图书馆出于对自建资源数据保护的原因而放弃这部分内容的整合。但是超星发现系统能否处理MARC、EXCELL、XML等多种数据格式,能否较好地对这部分数据进行收割和获取,还有待评估。

⑤超星发现系统在具备一般发现系统所具有的检索、发现与获取的功能外,更加侧重对整合后的大量数据资源进行知识挖掘与情报分析处理。即通过分析高校用户的知识需求,从而揭示出各信息资源之间相互关联的立体知识体系,并应用可视化技术来动态、直观地为用户展现海量信息资源中潜在的规律和发展趋势。

⑥超星发现系统与国外发现系统相比较,在订购价格方面具有较大的优势。由于超星发现系统必须要搭建于超星公司的另外一个产品——百链系统的基础之上,因此高校图书馆在购买超星发现系统的时候必须购买配套的百链系统,但即便如此,超星发现系统的订购价格也远低于国外发现系统的价格。

4 结语

超星发现系统可以实现对高校图书馆中文资源的深度整合和便捷获取,符合发现服务的特征,但与国外的发现系统相比,由于国内对于中文元数据合法性的模糊界定、对于开放获取理念的接受度较低以及数据库商自身商业利益等原因,在开放式服务、元数据质量、相关度排序等方面还存在着一些问题,然而价格的优势、对中文资源更为全面的覆盖率、侧重知识挖掘、情报分析的功能特点,也使超星发现系统在中文资源发现服务方面的优势得以显现,这也是很多高校图书馆在引进了国外的发现系统后又引进超星发现系统的原因。随着国外发现系统对中文资源覆盖范围的日益扩大及对中文数据处理能力的逐步改善与强大,国内自己的中文发现系统将面临更多的挑战。在不断扩大各类型中文学术资源的覆盖率,特别是提高中文元数据质量的同时,面向用户的需求,提供更具有个性化的服务功能是中文资源发现服务的发展方向。

[1]陈丽冰.读者服务视角下的图书馆资源发现服务[J].情报资料工作,2012(4):66-70.

[2]包凌,蒋颖.图书馆统一资源发现系统的比较研究[J].情报资料工作,2012(5):67-72.

[3]刘颉颃,陈定权,郭婵.用户对图书馆资源发现系统功能的期望——基于广州大学城高校图书馆学生用户的调研[J].图书情报工作,2012(7):27-31.

[4]天津大学图书馆[DB/OL].[2013-05-27].http://www.lib. tju.edu.cn/n17397/n17631/87720.html.

[5]Vaughan J.EBSCO discovery services[J].Library Technology Reports,2011(1):30-38.

王天虹女,1980年生。硕士,馆员。

G258.6

2014-02-24;责编:张欣。)

*本文系天津师范大学青年基金项目“大数据环境下大学生数据素养培养模式研究——以天津师范大学图书馆为例”(项目编号:52WU1309)研究成果之一。

猜你喜欢
超星检索图书馆
超星数据库录入证
Rotation of dust vortex in a metal saw structure in dusty plasma
瑞典专利数据库的检索技巧
一种基于Python的音乐检索方法的研究
《上海预防医学》杂志全文手机阅读体验
超星二号维修基地
图书馆
专利检索中“语义”的表现
去图书馆