大数据在图书馆的应用

2017-09-21 23:02颜琪媛
神州·中旬刊 2017年8期
关键词:信息服务数字图书馆大数据技术

颜琪媛

摘要:应用大数据技术,可以让图书馆在新时期得到进一步地发展,可以让信息服务水平得到提升。本文首先对大数据对图书馆带来的影响进行分析,然后从信息服务的角度,对大数据在图书馆中的应用特点进行阐述,最后结合实例,提出几点大数据在图书馆的应用策略。

关键词:大数据技术;数字图书馆;信息服务

前言:

大数据是一种较为抽象的概念,主要指的是因为自身具有较大的容量、较快的增长速度、较为复杂的关系而需要新的处理模式才可以让其决策力得到提升的海量信息资产。其本身具有规模大、结构多样、价值密度低的特点,其流程可以概括为数据采集、数据分析与数据解释三个环节。

一、大数据对图书馆带来的影响

(一)借助大数据建立知识服务导航机制

在传统图书馆中,读者在带有明确目的的情况下,按照类别去寻找自己所需的书籍往往存在很多困难,需要工作人员提供帮助。非但读者不够方便,工作人员的工作量也被加大了。借助大数据技术,可以建立起良好的知识服务导航机制,可以让此问题得到彻底解决。可以利用移动应用程序将馆内地图和OPAC进行有机整合,让读者在找寻资料时可以明确位置。

(二)借助大数据完善新的知识服务方式

借助大数据技术,图书馆可以完成用户数据信息的分析工作,不但可以明确用户的信息行为,还能够对用户潜在需求数据予以深度挖掘。读者的阅读习惯、读者的构成部分、读者的潜在需求以及相关的借阅数据都是极具价值的信息,通过对这些信息的分析,可以对读者展开针对性的服务。如某位读者经常在图书馆内借阅文学类的图书,那么在其登录数字化借阅端口时,就会出现多种此类图书,起到良好的推荐作用[1]。

(三)大数据让图书馆数据存储和计算面临挑战

在大数据时代,数据的数量与类型都在不断增多,非结构化与结构化的数据信息会随着用户的网络活动而不断产生,这无疑会提高图书馆数据存储、计算、分析的要求,存储能力和运算能力的限制会让图书馆数据在应用过程中出现困难,让图书馆面临挑战。

二、大数据在图书馆的应用特点

从信息服务角度来看,大数据在图书馆进行应用的过程中,服务对象、服务技术和服务模式均有所改变。现阶段,智能手机已然成为了阅读信息的主要载体,习惯使用智能手机的年轻人也随之成为图书馆的主要服务对象;在服务技术方面,利用网络化技术可以对传统信息资源予以转化,将其存储于虚拟空间,对其进行处理的客观技术在不断更新,不断转变,而技术的转变带动了图书馆工作人员的转变,要求工作人员需要掌握更多的服务技能;在服务模式方面,大数据在图书馆应用之后,可以不用亲身到图书馆就可以完成信息的查找工作,信息服务模式发生了极大转变,通过检索功能,可以很快查找到所需信息,服务效率得到极大增强。同时,因为网络通信技术的迅速崛起,如果图书馆建立起相应的APP,那么还可以通过软件来为读者提供个性化的信息推送服务[2]。

三、大数据在图书馆的应用策略

(一)选择合理的大数据处理技术

随着信息技术的发展,数据格式渐渐变得丰富多样,如视频、音频都已成为常见格式。在对图书馆大量数据进行存储时,可以利用联网方便、速度很快的硬盘存储方式。图书馆在数据处理时,涉及到的信息大部分为结构化数据信息,对有价值信息进行挖掘时具有很大的难度,图书馆应该对数据处理方式进行及时改变,对用户的信息行为、借阅记录等信息都需要予以深入分析,让基础设施得到改善,让服务方案得到提升。就目前来看,图书馆可以选择的数据处理方法主要可分为四种,第一种为Map Reduce技术,这种技术可以把复杂的运行在大规模集群上的并行计算过程转化为两个函数的映射与简化,对于编程人员来说十分方便,其处理流程可以概括为,编号代码、配置作业、提交作业、分配和执行Map任务、处理中间结果、分配和执行Reduce任务;第二种为No Only SQL数据库,这种数据库的模型较为简单,元数据、应用数据为分开状态,系统管理十分灵活;第三种为Hadoop技术,这种技术具有易用性与开源性,其主要模块分为两部分,即MapReduce与分布式系统,它们是处理核心,使用者能够通过Hadoop完成计算机资源的组织工作,让分布式计算平台得以搭建;第四种为云计算技术,无论是硬件还是软件都是信息资源,都可以利用互联网提供给用户,同时,它可以让信息资源结构得到扩展,让动态信息得到更新。

(二)解决图书馆信息资源组织问题

在应用大数据技术的过程中,信息资源组织面对的问题包含两个方面,即信息特征的揭示困难和具体组织对象的选择困难。为解决这两大难点,需要着眼于流程设计和方法实施这两个方面。

1.信息资源组织流程

信息人员利用多种信息技术可以完成分散、杂乱、大量的元数据选择工作,对信息予以優化和处理可以形成一个整体流程,非结构化数据、结构化数据与半结构化数据是大数据的主要来源,对半结构化数据与结构化数据予以存储,对非结构化数据与半结构化数据予以流处理,让并行数据库和关系数据库经过批处理后可以完成数据的应用工作。

2.信息资源组织方法

在图书馆信息资源中,无论是网络信息还是馆藏信息都会在发展到一定程度后迅速增长,组成大数据,现阶段,数据库方式、主题树方式、超媒体方式与文件方式不能让信息的收集和分析足够高效,不能给用户提供良好的服务体验。信息资源组织方式中的批处理和流处理可以对非结构化数据产生良好的信息资源组织效果。

(三)建立个性化、智能化的信息检索系统

1.个性化搜索

如前文所说,在用户信息收集基础之上,建立起信息检索系统,用户信息包含了学习信息、个人信息与行为信息,利用这些信息可以让图书馆清楚用户需求,形成推荐目录。为实现个性化搜索,必须要确保搜索引擎的智能化,根据用户输入的关键词,按照相关度、浏览数量等顺序来呈现给用户,查全率和查准率都要有所保障。搜索引擎应该具有人机对话功能和相应的分析能力,需要针对用户搜索做出快速反应。同时,图书馆需要对搜索引擎予以定期评估,建立起以用户为中心的搜索机制。endprint

2.智能化搜索

为实现智能化搜索,需要做好三方面的工作。首先,图书馆应该在系统搜索引擎中建立起机器学习的功能;其次,图书馆应该利用此功能,让搜索引擎得到扩展,除了文字检索之外,还可以扩展到视频检索、图片检索等;最后,搜索引擎应该具有自动更新功能,数据数量与类型在不断增长,搜索引擎对平台中的海量数据需要做到实时更新,确保结果的全面与准确。除此之外,在更新搜索引擎时应该结合用户对信息的进行搜索的习惯。

(四)设计图书馆公共数据库

1.设计图书馆公共数据库的重要性

图书馆资料建设分为三个阶段,第一阶段为藏书建设,第二阶段为文献资源建设,第三阶段为图书馆信息资源建设。完善图书馆公共数据库是第三阶段的主要内容,公共资源建设包含三个方面,搜集制作资源、管理组织资源和资源服务体系,利用大数据技术可以完成资源的搜索、存储与筛选工作,可以让读者需要得到满足,并扩大图书馆自身的发展范围。

2.设计图书馆公共数据库的方法

以我国沈阳市图书馆为例,在公共数据库结构功能设计中其主线为使用者,E-R模型图如图1所示。

如图1所示,通过网络信息采集器,图书管理员可以完成社交网、公共信息网等方面的信息采集工作,让其在公共数据库中得到储存。而在用户登录模块,图书管理员在输入密码与用户名之后,可以进入后台管理界面,在此界面,可操作项包含了期刊管理、典藏管理等内容。而在读者检索界面,可以进行图书检索、期刊检索、模糊检索和类别检索。在公共数据库管理框架的设计上,可分成三个步骤进行,首先需要使用网络数据采集工具完成资源信息的采集工作,然后需要对采集的信息进行储存和组织,最后需要对信息资源进行分析,结合当前情况,资源信息分析出现在移动终端设备与互联网设备的情况较多。在网络平台公共信息数据存储时,把组织之后的信息数据以列式存储的方法存放在hbase数据库里,一个存储列对应一个页链接。

(五)提高图书馆信息服务水平

1.学科知识服务

为提高图书馆信息服务水平,需要加强学科知识服务水平,需要为用户提供具有个性化、科学化的图书信息。无论是高校图书馆还是公共图书馆,这种学科知识服务都是必要的。在大数据的应用过程中,图书馆的信息服务内容会产生变化,信息服务模式也会随之变化,学科知识在迅速增长,在不断更新,已然组成了学科生态系统,在此基础上,对这些数据信息进行采集与分析,利用处理工具与相关技术可以让数据的潜在价值被挖掘出来,以学科为基础,分析专业信息资源的检索系统中的浏览下载频率,可以找出不同时间段内用户的兴趣点,对数据信息进行统计和挖掘可以找到图书、用户与信息资源之间的网络结构,进而完成网络的构建工作。

2.一站式资源服务

在图书馆中应用大数据技术,需要提供给用户一站式资源服务。在当前环境下,数字化的信息资源十分庞大,数据的类型繁多且结构相对复杂。在图书馆中,信息资源包含了两个方面,即虚拟馆藏资源与现实馆藏资源。虚拟馆藏资源包括了在线出版物、网络数据库和网络动态信息,利用Hadoop、Map Reduce、云计算等技术可以让用户在复杂的数据中快速找到所需信息,将多种信息资源予以开放式存储,可以让用户成为信息的主动发布者。同时,图书馆在数据信息整合的时候应该对重复数据予以去除,让数据的可依赖性更高,利用大数据智能化检索技术可以完成一站式资源服务的提供工作。

3.信息可视化服务

信息可视化程度和用户面对信息的直观性是紧密相关的。在大数据中,包含了大量信息,且这些信息的价值密度点不是很高,结合大数据分析技术可以将有价值信息予以找出,然后利用可视化技术(如历史流、标签云、空间信息)可以将此信息变得更为直观。让用户的检索、评价速度提升,进而使得图书馆对自身系统进行优化。同时,信息可视化技术可以与学科计量学方法相结合,生成学科知识地图,让作者、学科以及著作之间的关系得到直观表现,让学科知识的结构得到阐述,让各个领域的发展动态得到反映。以上海市图书馆为例,该图书馆在应用大数据过程这能够推出了手机APP,且使用了iBeacon技术,这种技术能够将二维码、位置定位等移动手段和图书馆的服务结合,在借纸质图书时,利用手机APP还可以帮助读者快速找到图书所在位置,而在查询图书时,无论读者身在何处,都可以对其进行查看。

4.智慧服务

在知识服务的基础上,对其进行升华和创新可以形成智慧服务。浏览信息时产生的日志,借还书产生的数据,书目查询时产生的检索目录共同形成了用户的信息来源,在数字图书馆中应用大数据的挖掘技术,可以让用户对信息服务的满意度得到提升,针对用户的实际需求,可以为用户提供具有主动性的定制化服务。以汕头市图书馆为例,汕头市图书馆在2017年6月份正式启动了大数据服务平台,并将图书馆入门处的智慧墙与之连接,智慧墙中显示了每个小时的图书馆人次,图书馆的借还量、图书借阅榜單以及新书的推荐等,就目前来看,在排行榜上,“东野圭吾”、“我的前半生”为热门检索词,实现了智慧服务的目标。

结论:

综上所述,通过选择合理的大数据处理技术、解决图书馆信息资源组织问题、建立个性化智能化的信息检索系统、设计图书馆公共数据库和提高图书馆信息服务水平可以让大数据技术在图书馆中得到良好的应用,进而推动图书馆的进一步发展,让读者获得更为舒适的服务体验。

参考文献:

[1]高晓东,周建.高职院校图书馆大数据在学业预警中的应用[J].图书馆学刊,2015,3701:115-117.(2015-01-30)

[2]罗芳.大数据在图书馆的应用[J].科技广场,2015,03:132-135.endprint

猜你喜欢
信息服务数字图书馆大数据技术
公共图书馆科技创新服务探析