近年来国内基于关联数据的数字图书馆研究综述

2016-02-12 19:51阳广元西南民族大学图书馆
图书馆理论与实践 2016年7期
关键词:关联数字图书馆

潘 煦,阳广元(西南民族大学图书馆)

近年来国内基于关联数据的数字图书馆研究综述

潘煦,阳广元(西南民族大学图书馆)

以国内基于关联数据的数字图书馆研究的文献为分析对象,归纳总结出当前国内基于关联数据的数字图书馆研究所涉及的主题主要分布在关联数据的理论研究、关联数据的构建与发布、基于关联数据的信息资源组织与整合、基于关联数据的知识服务研究以及综述或其他研究内容等五个方面,并从这五个方面对国内基于关联数据的数字图书馆研究现状进行梳理,总结出国内该研究领域的特点、不足及发展趋势。

关联数据;数字图书馆;资源整合;综述

近年来,为寻求数字图书馆在资源组织与整合、发布与共享、发现与再利用等方面的新突破,以增强和扩展资源发现服务平台、提升社会价值和整体服务能力与效率,我国图情界开始致力于关联数据在数字图书馆领域的理论与实践研究。为厘清和把握国内基于关联数据的数字图书馆研究领域的进展、特点、不足及未来发展趋势等,并为该研究领域及相关研究领域的深入研究与实践提供参考借鉴,笔者分别以检索式“篇名‘数字图书馆 and关联数据’”和“篇名‘图书馆’and关键词‘关联数据’”在清华同方的中国知网、维普期刊资源整合服务平台和万方知识服务平台中分别进行“精确匹配”检索,并对检索结果进行去重等梳理后,最终获取到基于关联数据的数字图书馆研究的相关文献合计78篇。笔者对这些相关文献研究内容进行梳理分析发现,国内基于关联数据的数字图书馆研究领域主要集中在关联数据的理论研究、关联数据的构建与发布研究、基于关联数据的信息资源组织和整合研究、基于关联数据的知识服务研究以及综述或其他研究等五方面。

1 基于关联数据的数字图书馆研究重点剖析

1.1关联数据的理论研究

目前国内基于关联数据的数字图书馆的研究主要是从关联数据的起源、定义、目的、原则、特点、对数字图书馆的影响等方面进行深入探讨。关联数据最早由 WWW(World Wide Web)的创始人 Tim Berners-Lee在一个语义网项目中提出,在数字图书馆领域还没有形成统一的被认可的定义,目前学界普遍采用维基百科(Wikipedia)关于关联数据的定义,即关联数据是实现语义网的轻量级核心技术之一,描述了一种构建在标准网络技术(如HTTP、RDF和URIs)之上的能从语义层面实现数据相互关联的一种数据发布方法。[1]其构建与发布的基本原则为:(1)使用URIs来命名或识别对象;(2)使用HTTP URIs来定位对象;(3)采用RDF、SPARQL等标准来扩展对象使其能在查询时提供更有意义的信息;(4)提供相关的基于URI的HTTP,以便发现更多的对象。其应用有两种基本模式:(1)浏览器/服务器模式,即通过浏览器来访问关联数据,如Tabulator、Signa等;(2)客户端(应用系统)/服务器模式,即系统与系统之间的数据传递。[2]其特点为低成本、标准化、去中心化、自助化及框架简洁等。[3]

关联数据在图情领域已得到了广泛的研究与应用,如知识服务[4]、集成管理[5]及学术推荐[6]等,尤其是在数字图书馆研究与构建中,[7]关联数据发挥着十分重要的作用,通过关联数据的引入,能为数字图书馆的信息资源融合提供有力保障;强化与教科研之间的联系;增强和扩展数字图书馆信息资源发现服务平台;通过将自身资源发布为关联数据能提升图书馆的社会价值;进一步加强信息资源的利用和再利用;增加个性化服务的成效。[8-10]同时数字图书馆关联数据具有开放性、可拓展性、可重用性、显性的语义关系和国际化等优点。[11]

1.2关联数据的构建与发布研究

国内除对关联数据的基本理论进行研究外,还对关联数据的构建与发布作了深入探讨。孙鸿燕指出图书馆关联数据发布的前提是关联关系的构建,关联构建形式有映射关联和非映射关联;[12]王忠义等借助D2R工具实现了数字图书馆中层关联数据的构建与发布。[13]张忠莉深入探讨了E-Learning时代高校图书馆关联数据的构建问题,指出高校图书馆关联数据的构建内容主要包括资源组织本体的构建;基于资源组织本体,将关系型数据库中数据表的各类篇名元数据转换为基于RDF的表达;基于关键词,构建不同来源、不同类型的科技文献,如期刊、会议、标准、专利、科技报告等的关联关系。[14]游毅探讨了面向图书馆关联数据的语义链接构建,指出主要有基于SPARQL查询与基于相似度的链接构建等两种构建方式。[15]

1.3基于关联数据的信息资源组织和整合研究

信息资源的整合不仅是实现数字图书馆建设目标的关键,[16]也是扩展数字图书馆资源发现服务平台的一种有效途径。关联数据作为一种发展迅速的新的信息资源发布技术,能快速有效地将不同来源的信息资源关联起来,特别是能有效地将图书馆馆内信息资源与外部信息资源融合在一起,从而增强和扩展数字图书馆的信息资源发现服务平台,以提升整体服务能力和水平。丁楠等提出了一种能有效扩展信息资源范围和改进用户服务的基于关联数据的数字图书馆信息聚合模型,并从数据层、聚合层和应用层三个层面对其进行了全面的分析。[17]路莹等通过对当前基于导航的信息资源整合、基于OPAC的信息资源整合、基于异构统一平台的信息资源整合和基于语义的信息资源整合等四种信息资源整合方法存在的不足以及关联数据的研究,指出关联数据为完全自主、异类及异构的信息资源的整合提供了有效的解决方案。[18]郑燃等深入剖析了关联数据在图书馆、档案馆和博物馆之间信息资源整合的作用,构建了基于关联数据的LAM(Libraries,Archives,Museums)信息资源整合模式。[19]房小可从科学数据的实体URI命名、描述、关联和发布等四方面全面阐述并构建了基于关联数据的科学数据组织模型。[20]欧石燕等提出了一种能实现数字图书馆中不同格式、不同类型文献资源及馆内与馆外相关资源的关联与融合的可无限延伸与扩展的开放的基于本体和关联数据的层次化资源融合框架,指出该方法在深度和广度上都优于传统的信息资源融合方式。[21]苏春萍等为屏蔽医学数据源的异构性并为用户提供智能化,设计了一种基于关联数据和SOA的医学数字图书馆信息资源整合模型。[22]欧石燕等研究了传统信息资源整合、基于本体的信息资源整合和基于关联数据的信息资源整合,并在汲取这些优点的基础上提出了一种能实现不同层次与范围的基于本体和关联数据的数字图书馆信息资源整合框架。[23]钟莉构建了一种能弥补传统书目信息资源整合缺乏语义整合的基于关联数据的数字图书馆书目信息资源整合模型。[24]张凤霞对关联数据在数字档案整合中的应用进行了深入研讨,指出其为数字档案的聚合提供了基本技术支持、扩展了其发现平台,更好地满足了用户的需求。[25]欧石燕等研究了利用关联数据进行信息资源的动态组织,提出了一种面向图书馆关联数据的能将自动问答扩展到多个RDF数据集的自动问答方法。[26]

1.4基于关联数据的知识服务研究

目前,国内基于关联数据的知识服务研究主要集中在个性化知识服务、云服务、服务创新、服务策略、服务模式等方面的研究。个性化知识服务的关键是根据用户需求提供有针对性的知识服务,[16]用户建模又是实现个性化知识服务的起点和关键因素,而作为巨大数据中心的关联数据分布着大量能为用户建模提供丰富的、与用户相关的数据来源,从而更好地动态感知用户需求,提升个性化知识服务的整体服务质量;[27]张小峰指出关联数据实现了学术资源之间的关联和链接,为学术资源推荐与用户之间架起了桥梁,并设计了一种基于关联数据的数字图书馆学术资源推荐系统;[6]付兵在概述基于关联数据的数据挖掘算法的基础上,设计了一种由数据存储层、数据挖掘层和用户界面层构成的基于关联数据的个性化信息推荐系统;[28]李爱国等指出应在保护用户隐私的前提下将用户信息发布为关联数据以扩展各种知识生产与服务系统,实现图书馆用户信息的资源化与关联化。[29]

云服务作为一种新的服务模式,如何将关联数据这种新的图书情报新技术运用到云服务以改善云服务的服务能力,提升图书馆的整体服务水平已成为当前图情界的关注点,并已取得了不错的研究成绩,如曾琦在深入探讨了图书馆云服务与关联数据之间关系的基础上,设计了一种基于关联数据的能更好实现图书馆信息资源发现服务的图书馆云服务平台;[30]王业平提出了一种能有效解决图书馆关联数据管理缺陷的将云计算引入到其管理模块的面向关联数据的图书馆云服务框架;[31]田宁深入剖析了关联数据、云服务及基于关联数据的图书馆云服务的内涵,提出了一种基于关联数据的图书馆云服务框架,指出需要解决好技术、知识产权、数据库厂商及图书馆员素质等的制约才能更好地实现此服务;[32]邹学昌也在研究关联数据及云服务的相关理论基础上,提出了一种能更好满足语义网环境下用户知识服务需求,提高图书馆服务质量和地位的基于关联数据的图书馆云服务模型。[33]

另外,还有学者对基于关联数据的知识服务创新、策略及模式等方面进行了深入的研究,如杨爱武从知识的发布、发现、检索及异构融合等方面探讨了图书馆的知识服务创新;[34]管进概述了关联数据的内涵、应用及对知识服务的影响,指出图书馆应建立以关联数据为基础的知识服务资源保障体系,加强对知识服务的数据和服务方式的整合,加强对知识服务的技术保障以及组建高素质的知识服务团队;[4]赵明深入探讨了知识地图、关联数据及图书馆信息服务的内涵以及关联数据在图书馆知识地图信息服务中的作用,构建了一个能减少服务的时间和空间限制、扩大服务范围和提升个性化服务质量的面向图书馆信息服务模式的基于关联数据的知识地图。[35]贺令辉指出关联数据让图书馆及网络中不同类型的知识资源被发现和共享变成可能,并从知识资源的关联数据构建与发布、整合和推荐等角度探讨了基于关联数据的高校图书馆知识服务。[36]赵卫军指出关联数据能建立知识资源之间的关联,从而实现知识资源的融合和扩展知识发现服务,提出了基于SOA的关联数据的高校图书馆知识服务框架模型。[37]

1.5综述及其他研究

目前,国内基于关联数据的数字图书馆的研究还出现了一些对关联数据在数字图书馆领域的相关应用现状和存在问题的综述研究,并提出了国内该研究领域应注意的问题和未来发展建议。如黄永文从信息资源的发布与发现服务、数据的语义融合与检索服务、在学术研究与交流中的作用、跨机构关联数据的开放与复用、图书馆与教学系统的集成等方面分析了关联数据在数字图书馆中的应用现状,指出未来应加强关联数据的利用意义、服务方式、质量和有效性等方面的研究;[2]李琳概述了关联数据在数字图书馆中的实践现状,指出未来应加强用户交互、数据整合、链接维护及隐私保护等四方面的研究。[38]孙鸿燕、吴旻指出随着关联数据在数字图书馆中的应用,图书馆应从关联数据的挖掘与创建、关联构建、发布与浏览,以及链接维护等方面强化关联数据的综合管理。[5,12]付瑶指出为避免产生大量冗余、错误及失效等低质量数据内容,应加强对关联数据的质量控制,构建了专门针对关联数据质量控制的模型框架。[39]梁亮以杭州图书馆“热门标签”为例,从实践角度阐述了关联数据在数字图书馆中的应用实践,指出应从提升标签质量、拓展标签用途和满足用户需求等方面,优化关联数据在数字图书馆的研究与应用。[40]陈定权等指出图书馆在关联数据运动中扮演着关联数据的发布者、信度验证者、消费者及其应用的组织与协调者等角色。[41]曹月珍等探讨了图书馆如何利用关联数据实现服务转型,指出未来应加强关联数据的相关技术与开放策略,以及与其他文化机构的合作等方面的研究与实践。[42]王景侠指出图书馆数据的关联数据化将让其融入到开放互联的关联数据网络,并有效提升图书馆的服务水平和地位,提出未来应加强理念的创新、技术的革新和实践的探索。[11]

2 基于关联数据的数字图书馆研究特点与不足

2.1研究特点

2.1.1核心作者群和核心机构初步形成

目前国内该研究领域已初步形成了以欧石燕、王薇、卢玉红、吴旻、梁亮等为代表的核心作者群;以南京大学信息管理学院、华中师范大学信息管理学院、杭州图书馆、西北大学图书馆等为代表的核心机构,他们对关联数据在数字图书馆中的应用进行了持续性的跟踪与实践,这在一定程度上说明我国在该研究领域已初步形成了较完备的科研人员及体系,也表明了国内各界研究者对该研究主题的关注度较高。

2.1.2研究内容逐步转向应用实践

国内围绕关联数据在数字图书馆中的应用研究已从起初的纯理论研究逐步向与具体实践相结合的方向发展,并取得了不错的成绩。研究初期经常对诸如关联数据的概念、特点、原则、对数字图书馆带来的机遇与挑战及现有应用现状等进行研究,随着研究者对关联数据及其在数字图书馆中的应用研究的深入,开始从热门标签、书目数据的发布及个性化推荐等更细化的实践应用角度开展该主题的研讨,而且此类主题也将成为未来研究的主流。

2.1.3研究主体的多样性

国内基于关联数据的数字图书馆的研究吸引了各界研究者的重视并取得了不错的成绩,如《中国图书馆学报》《现代图书情报技术》《图书与情报》《图书馆学研究》《图书馆工作与研究》《图书馆论坛》《山西档案》等图书情报档案类期刊;《信息技术与信息化》《科技信息》《计算机光盘软件与应用》等计算机类期刊;另外还有8篇学位论文和5篇会议论文等非期刊性文献对其进行系统性的研讨。

2.2研究不足

通过对我国目前基于关联数据的数字图书馆研究的相关文献的研究内容分析发现,尽管我国各界十分重视该研究主题并取得了不错的成绩,但还存在一些不足,如缺乏对关联数据的质量、基于关联数据的数字图书馆等的有效评价方法;缺乏对关联数据的自动化构建与发布方法的研究;缺乏对关联数据应用于数字图书馆中的安全(如知识产权、隐私保护等)、效用、质量控制、链接维护等问题的探讨与实践;缺乏对如何保障用户获取高质量地关联数据的研究;当前所设计的基于关联数据的数字图书馆相关模型缺乏对用户参与度的考虑;绝大部分文献都只从理论层面进行研讨,缺乏具体的实践应用与经验总结,仅有少部分文献如文献[41]才是真正将理论应用于实践,从具体实践角度研究关联数据在数字图书馆中的应用,也只有这些实证性研究才能有效推动我国关联数据在数字图书馆中应用的深度和广度,进一步促进关联数据及其在数字图书馆中应用的理论的完善与经验的积累。

3 基于关联数据的数字图书馆研究发展趋势

3.1利用关联数据技术实现更深层次的个性化服务

个性化服务既是图书馆未来发展的重要方向,也是未来生存的重要基础。如何更好地根据用户需求提供更具针对性地个性化服务已成为了当前各界(特别是图书馆界)的研究热点,也是图书馆可持续发展的一个难点。关联数据不仅为用户信息的关联化提供了有效支撑,也为从海量数据中实时动态地获取用户的个性化信息(如用户特点、曾经的需求、检索记录等)提供了有效途径,而这些都将有效地提升数字图书馆在提供服务的过程中对用户个性化需求的动态感知,更好地为用户提供针对性强、符合用户真正需求的个性化服务。因此,关联数据为个性化服务带来了一次新的变革。与此同时,基于关联数据的个性化服务研究也必将成为未来的研究热点和趋势。

3.2基于关联数据的数字图书馆的实际应用

目前,国内虽然对基于关联数据的数字图书馆的应用实践做了较深入的研究且取得了一定成绩,但缺乏对具体某一个领域的具体实践应用的研究与实现。只有与具体应用相融合的实践探索才能真正地发掘到关联数据在数字图书馆领域中应用所遇到的问题,拓展其应用的深度和广度,促进该研究领域的进一步发展。如何有针对性地构建和发布适合特定领域的关联数据,有效地嵌入到数字图书馆的某个具体领域的系统;如何设计并实现适合特定需求的基于关联数据的数字图书馆系统等实践性强的研究将成为未来关联数据在数字图书馆领域实践应用的研究趋势。

[1]Berners-LeeT.LinkedData—DesignIssues[EB/OL]. [2015-04-06].http://www.w3.org/DesignIssues/Lin kedData.html.

[2]黄永文.关联数据在图书馆中的应用研究综述[J].现代图书情报技术,2010(5):1-7.

[3]王伯秋,等.关联数据在图书馆资源整合中的应用[J].医学信息学杂志,2013(10):64-66.

[4]管进.基于关联数据的图书馆知识服务策略研究[J].图书馆理论与实践,2012(6):9-11.

[5]吴旻.图书馆关联数据的集成管理研究[J].图书馆理论与实践,2012(9):67-69.

[6]张小峰.基于关联数据的图书馆学术资源推荐研究[J].图书馆学研究,2012(5):87-89.

[7]孙鹤然.基于语义门户SEAL的数字图书馆构建研究[J].图书馆学研究,2011(7):48-52.

[8]徐华,等.关联数据:图书馆学研究的新领域[J].南华大学学报(社会科学版),2011,12 (6):107-109.

[9]罗铮,等.高校图书馆应用关联数据的意义及注意事项[J].图书馆杂志,2012(5):51-53.

[10]蒋京平,易庆勋.高校图书馆关联数据的实现与挑战[J].农业图书情报学刊,2015(10):76-79.

[11]王景侠.图书馆从数据关联到关联数据化发展及其启示[J].图书馆杂志,2014(11):49-54.

[12]孙鸿燕.图书馆关联数据的综合管理及其实现[J].图书馆学研究,2011(23):51-54.

[13]王忠义,等.数字图书馆中层关联数据的创建与发布[J].现代图书情报技术,2013(5):28-33.

[14]张忠莉.E-learning时代高校图书馆关联数据的构建及应用分析[J].决策与信息(下旬刊),2014(12):41-43.

[15]游毅.面向图书馆关联数据的语义链接构建研究[J].图书与情报,2014(3):74-78,96.

[16]李华.近五年国内基于本体的数字图书馆研究综述[J].图书情报工作,2011(11):62-65,61.

[17]丁楠,潘有能.基于关联数据的图书馆信息聚合研究[J].图书与情报,2011(6):50-53.

[18]路莹,甄保社.图书馆数字资源整合及发展趋势[J].中华医学图书情报杂志,2012(10): 21-23.

[19]郑燃,等.基于关联数据的图书馆、档案馆和博物馆数字资源整合研究[J].图书与情报,2012(1):71-76.

[20]房小可.基于关联数据的高校图书馆科学数据组织研究[J].图书馆建设,2013(10):31-34.

[21]欧石燕,王薇.基于本体与关联数据的图书馆数字资源知识融合[C]//第四届全国知识组织与知识链接学术交流会议文集.北京:中国科学技术情报学会,国家科技图书文献中心,2013:1-12.

[22]苏春萍,等.基于关联数据和SOA的医学图书馆信息资源整合模型设计[J].中华医学图书情报杂志,2013(3):6-9.

[23]欧石燕,等.本体与关联数据驱动的图书馆信息资源语义整合方法及其测评[J].图书情报工作,2014,58(2):5-13.

[24]钟莉.基于关联数据的图书馆信息资源整合研究[D].杭州:浙江大学,2014.

[25]张凤霞.关联数据在图书馆数字档案聚合与服务中的应用研究[J].山西档案,2015(3):57-59.

[26]欧石燕,唐振贵.面向图书馆关联数据的自动问答技术研究[J].中国图书馆学报,2015(6): 1-21.

[27]牛亚真,祝忠明.个性化服务中关联数据驱动的用户语义建模框架[J].现代图书情报技术,2012(10):1-7.

[28]付兵.基于关联数据的数字图书馆个性化信息推荐系统[J].图书馆学刊,2013(4):108-110.

[29]李爱国,等.图书馆用户信息模型框架构建[J].图书情报工作,2015(13):1-7.

[30]曾琦.基于关联数据的图书馆云服务平台设计[J].图书馆学研究,2012(5):35-39.

[31]王业平.面向关联数据的图书馆云服务研究[D].西安:西安电子科技大学,2013.

[32]田宁.基于关联数据的图书馆云服务框架初探[J].农业图书情报学刊,2014(1):57-59.

[33]邹学昌.基于关联数据的图书馆云服务研究[D].哈尔滨:黑龙江大学,2013.

[34]杨爱武.基于关联数据的图书馆创新服务研究[J].图书与情报,2012(3):85-88.

[35]赵明.基于关联数据的知识地图在图书馆信息服务中的模式研究[D].武汉:华中师范大学,2013.

[36]贺令辉.基于关联数据的高校图书馆知识服务探讨[J].图书馆研究,2013(1):95-97.

[37]赵卫军.基于SOA的关联数据的高校图书馆知识服务架构 [J].图书馆学刊,2013(6):103-105.

[38]李琳.关联数据在图书馆界的应用与挑战[J].图书与情报,2011(4):58-61.

[39]付瑶.图书馆关联数据质量控制研究[D].长春:东北师范大学,2013.

[40]梁亮,周宇麟.关联数据在图书馆的应用实践——以杭州图书馆“热门标签”应用为例[J].图书馆学研究,2013(18):24-28.

[41]陈定权,卢玉红.图书馆在关联数据运动中的角色解析[J].图书馆建设,2014(3):17-21.

[42]曹月珍,马建玲.关联数据在图书馆的最新发展[J].图书馆学研究,2014(14):6-12.

Research Review on Domestic Digital Library Based on Linked Data

Pan Xu,Yang Guang-yuan

Taking the documents of digital library that are based on linked data in mainland China as objects,this article summarizes the documents are mainly focus on 5 aspects:theoretical research of linked data,the construction and release of linked data,the organization and integration of the information resources based on linked data,the research of the knowledge service based on linked data and some reviews etc.Finally,the article points out the characteristic,the disadvantage and the future development of the researches on digital library based on linked data.

Linked Data;Digital Library;Resources Integration;Review

G250.76

A

1005-8214(2016)07-0034-05

潘煦(1974-),女,西南民族大学图书馆学科与信息咨询部副研究馆员,研究方向:图书情报学;阳广元(1982-),男,西南民族大学图书馆技术服务部馆员,研究方向:信息科学、计量学、图书情报学。

2015-12-03[责任编辑]阎秋娟

猜你喜欢
关联数字图书馆
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
“一带一路”递进,关联民生更紧
图书馆
答数字
奇趣搭配
智趣
数字看G20
去图书馆
成双成对
数字变变变