智能检索及跨库检索技术在数据库建设中的运用

2021-12-01 05:39
湖北农机化 2021年2期
关键词:检索数据库图书馆

王 琳

(柳州铁道职业技术学院,广西 柳州 545616)

1 智能检索技术在数据库建设当中的运用

1.1 传统关系数据检索技术

随着我国计算机水平提升以及211工程落实,高校图书馆掀起了一股自动化检索的热潮[1]。随着这种环境的推动,几乎各大高校都进购了自动化检索系统。但此类系统普遍涉及底层数据库结构,即传统关系型数据库。常见的自动化软件主要有国外的INNOPAC升级版Milllenium以及国内的MELINETS等。分析一个图书馆自动化软件的价值,主要可以从以下几个方面入手,即底层数据库、系统结构、语言处理、检索和机制等。

1.2 智能检索技术

全文检索数据库是专业处理各类海量信息的数据库管理系统。它的工作原理是以代码形式对资料内容进行储存,并与计算机结合进行后续的检索查询和信息处理工作。自改革开放以来,投入市场中运行的数据库产品逐年增加,但占据市场份额超过90%的凤毛麟角,大部分产品是关系型和对象关系型。与传统的数据库相比较而言,此种数据库不需要工作人员进行大量的标引工作,而是可以根据用户输入的关键词展开多角度的检索,因此被称为智能检索。

1.3 智能检索机制

与关系数据库相比,非结构化数据库检索机制的优势在于灵活性高。简单讲就是关系数据库能够实现的简单、字段以及组合等检索形式,非结构化的数据库也能够实现。不仅如此,非结构化的数据库还能实现中英文混合检索、全文检索等高级检索方式,更倾向专业检索软件发展。当下经常使用的有词索引和字索引2大类,从字面意思理解就是一类以词为单位做原始数据进行索引,另一类是以字为原始数据展开索引。2类索引方式优势不同,词索引的优势在于资料查询准确,而字索引的优势在于获得资料全面,同时也有容易产生误查的缺点。

此外需要注意的是此种智能索引机制在索引前需要依靠分词系统,将整体的索引内容进行分割后才能完成各项内容的分别索引。

2 跨库检索技术在数据库建设当中的运用

2.1 全文数据库

数字图书馆是数字资源的最终提供者,由此可见,数字图书馆会购买或开发多个数据库资源,但相关的数据库都不是商家提供的内容,因此,用户在查询数据时,需要重复登录、输入关键词,造成的影响主要体现在效率低和浪费用户精力等方面。为解决上述问题,市场上的数据商人,纷纷开发了异构统一的检索平台,即USP。这是一个智能化网络数据库检索平台,具体功能在于能够在单一用户界面上检索多个异构网络数据库,还可以结合检索结果智能去重,为用户访问数据库提供了更加便利的条件。

为顺应时代发展,大部分全文数据库还支持普通检索、高级检索以及二次检索等要求。以TPI为例,对比TPI和GOOGLE能够发现,TPI在检索范围和最终结果两方面有很强的市场竞争力。

再如TRS的Gateway关系数据库网关,目前已经可以达到传统关系型数据库在全文检索方面的拓展需求,不仅能自动监控数据库的实时更新状态,还可以维护系统中的索引信息。某图书馆使用该关系数据网关,其自动化系统当中的书目信息很快实现了整合和统一的检索功能,且还利用此网关中的站点检索功能实现了部分信息的本地检索。

2.2 元数据检索

系统个性化特点方面,传统的关系数据库随着各种现代化电子资源增加和网络资源的不断发展,已经形成了资源整合的自动化集成发展趋势。简单讲就是能够为不同级别的用户提供使用界面,经过一段时间的发展,现在一次检索能够查看全部资源已经实现。例如:Millenium的MAP模块,其中整合了全部类型的信息资源,且可以在网络数据资源的基础上全文检索。用户不论身在何处,都能够应用该模块检索到自己需要的资料。

总之,一个软件的功能和模块开发,与企业侧重于对用户需求的研究息息相关[2]。且系统的发展和优化也要注意与图书馆相一致。

多年来数据库建设的过程当中,随着类型和数量的增加,数据库之间关联和数字资源整合工作的要求不断复杂化,即便在统一软件当中建立数据库,也会由于底层数据结构差异,或数据库字段名称不同导致连接不通畅的问题产生。如:某科研成果库使用的是“题名”,而另一论文库使用的则是“标题”,在后续的跨库连接过程中,就会导致方法步骤复杂化,甚至产生连接失败的情况。面对此种情况,许多图书馆在建设数据库的过程中。制定了对多种文献资料相应的描述和规范。元数据检索理念早在数据库最初的建设过程中就有所提及。如:都柏林核心元数据就是当时提出的概念,其中指出,都柏林元数据集属于一种跨领域和资料库的信息资源描述准绳,在该理念当中,信息资源被以“任何具有表示的东西”来定义。

3 结语

总而言之,不论是数据库开发商普遍发行的单一数据库,还是处理大型的数据库,都需要技术人员从根本问题出发,提升跨库检索和数据关联之间的有效性,同时还要在发展过程中具有前瞻性,即分析未来该行业发展趋势,力求实现真正意义上的资源无阻隔交换。

猜你喜欢
检索数据库图书馆
CNKI检索模式结合关键词选取在检索中的应用探讨
瑞典专利数据库的检索技巧
2019年第4-6期便捷检索目录
图书馆
英国知识产权局商标数据库信息检索
数据库
数据库
数据库
数据库
去图书馆