大数据在高校图书馆的应用研究

2019-03-14 13:34:54 河南图书馆学刊2019年1期

唐立芳

摘 要:文章介绍了“互联网+”时代大数据的发展概况,论述了大数据在各领域及高校图书馆的应用情况,指出了大数据在高校图书馆应用过程中存在的问题,并提出了改进策略。

中图分类号:G258.6文献标识码:A文章编号:1003-1588(2019)01-0038-03

关键词:高校图书馆;大数据;应用;问题与改进

自2011年5月麦肯锡公司(McKinsey)发布《大数据:创新、竞争和生产力的下一个新领域》报告后,大数据开始备受世界各国关注。2015年9月,国务院印发《促进大数据发展行动纲要》,这标志着大数据已被我国政府纳入创新战略层面,目前已成为国家战略计划的核心任务之一。在全域城市公共免费Wi-Fi项目中,贵阳不但走在了全国前列,而且建立了省級政府数据统筹和共享平台,即“云上贵州”系统平台的“七朵云”工程建设,初步实现智能交通管理、智慧旅游等。大数据技术的应用,既节省了人力,又提高了办事效率。目前,大数据已在各行各业广泛应用,也为当地带来了可观的经济效益和社会效益。

1 大数据在图书馆的应用

近年来,有众多学者从不同的认知面发文阐述大数据的价值及其运用。例如,2015年中国工程院院士李德毅在《大数据认知》一文中从作诗、语言翻译、人脸识别等数据认知案例讲述了大数据认知的方法学[1]。目前有关图书馆大数据方面的研究成果有:2012年樊伟红、李晨晖、张兴旺等发文首次系统地论述了大数据的运用领域和给图书馆带来的挑战,以及大数据的主要研究热点和给图书馆带来的帮助[2];吕晓丽以中国期刊全文数据库(CNKI)为检索源,参照互联网、万方数据检索结果,检索年度为2012—2016年,检索到期刊论文和学位论文共计1,000余篇(其中核心期刊论文218篇),其研究方向涉及大数据与图书馆各项业务的融合,包含信息(知识)服务、数据存储、数据挖掘、发展方向等诸多方面[3]。随着信息技术的迅猛发展,大数据的研究和应用也以一种不可阻挡的态势得到迅猛发展。

1.1 大数据图书馆的内涵及获取途径

大数据图书馆与数字图书馆是两个不同的概念。数字图书馆(Digital Library)是利用计算机技术对图书馆纸质文献进行数字化,包括对文献的加工、整理、存储和利用过程的数字化;大数据图书馆(Big-data Library)则是利用密集型数据(大数据)处理技术对现有的数字图书馆进行重构,实现对文献和知识加工、整理、存储和利用过程的大数据化,二者既有联系又有差异。数字图书馆文献数量呈几何级增长,这为大数据图书馆概念的提出奠定了基础。大数据图书馆具有大数据的一般特性,具有容量大、处理速度快、价值隐蔽性、数据类型多样性等特征[4]。大数据的获取途径有很多,如:通过购买百度指数分析用户对图书馆的关注方向和关注度及通过爬虫软件获取豆瓣书评、博文、亚马逊网上书店的销售记录和评价数据等。

1.2 大数据在图书馆的应用

2009年,澳大利亚卧龙岗大学图书馆的“图书馆立方”项目将学生的图书馆使用记录与学校绩效指标管理中心PIU(Performance Indicator Unit)的数据库进行关联,一方面评估图书馆在教学活动中的影响和价值,另一方面也希望通过收集反馈信息扩大图书馆信息资源的影响力及提高图书馆存在的价值,为学校制订教学方案提供数据支撑。该项目的成功应用,为图书馆引入大数据服务提供了一个很好的借鉴。2012年,深圳图书馆率先引入大数据服务,利用大数据挖掘和聚类分析技术挖掘图书馆数据,预测未来图书馆服务的发展方向和馆藏资源的购买方向等。

1.3 大数据在贵州医科大学图书馆的应用

笔者根据贵州医科大学图书馆内部管理系统RFID记录的馆藏数据、借阅数据、用户数据等,分别从图书馆的基本情况、藏书数据统计、流通数据统计、读者分析等方面入手,分析图书馆的资源建设、利用及服务情况,以期从中发现一些深层次的问题,并提出相应的改进措施。

1.3.1 基本情况。贵州医科大学成立于1938年,原名国立贵阳医学院,是一所具有悠久历史的省属重点高等院校,1950年国立贵阳医学院交由贵州省人民政府管理,随更名为贵阳医学院,图书馆也随之更名为贵阳医学院图书馆,2015年又更名为贵州医科大学图书馆(以下简称“贵医图书馆”)。贵医图书馆现有馆舍面积约3.46万平方米,馆藏重点以医药卫生类资源为主。目前,该馆拥有各类文献2,244,987册,其中中外文纸质文献1,813,480册(中外文图书1,663,171册、中外文期刊150,309册)、中文电子图书430,000册、外文电子图书505种、机读资料1,002盒(张)。该馆现有数字资源库10种,其中中文数据库5种,分别是万方数据知识服务平台、CNKI中国知网、维普数据库、超星电子书、人大复印期刊;外文数据库5种,分别是EBSCO、OVID-Lww、Wiley online library、Elsevier SD、OUP(2011-2017全文)。该馆现有书刊阅览室16个、研修室24个、研讨室12个。另外,该馆还为学生提供免费Wi-Fi上网及免费为师生提供查询馆藏服务。

1.3.2 馆藏资源。截至2017年,贵医图书馆拥有各类馆藏218万余册,其中纸质图书约160万余册、纸质期刊14万余册,2015年入藏各类纸质图书8,353种、37,941册,2016年51,864种、496,142册,2017年18,731种、65,959册。笔者从贵医图书馆内部系统RFID记录的数据获知,期间该馆入藏的图书主要以R类医药卫生为主,其次为I类文学,从中可以看出贵医图书馆是以医药卫生为主的专科型大学图书馆。入藏总体数量呈逐年增长的趋势,其中2016年有很大的增长,这和贵医图书馆为迎接学校评估有直接的关系。

1.3.3 图书流通情况。面对读者获取知识途径的多样性及近年来读者流失的严重性,贵医图书馆为了激发学生的读书热情,馆员结合学生借阅数据、热门书排行、图书流通数据的分析情况对各学院教师和学生展开调研工作,了解他们的文献需求方向,以便有针对性地开展阅读推广和图书推荐等活动。另外,图书馆将读者每月的借阅排行和热门书排行情况在图书馆LED大屏及微信公众号上进行公告,受到了广大读者的欢迎和好评。笔者从图书馆内部RFID系统调取了2015—2017年的各类图书流通数据,发现2015年为38,778册,2016年为48,164册,2017年为55,626册。具体而言:①从借阅类别上看,读者对文学、医药卫生、语言文字、哲学类等方面的书籍比较感兴趣。其中文学类借阅量最大,依次是医药卫生、语言、哲学、历史地理、生物科学、数理化、政治法律类等。②从借阅数量上看,各年度的借阅总量也呈逐年增长的态势,这与图书馆开展的阅读推广和图书馆推荐等活动是分不开的。通过以上统计数据可以发现,读者的阅读兴趣和方向为图书馆文献资源建设及各书库服务人员的配备提供了参考依据,也为图书剔旧上新工作提供了参考依据。另外,馆员还可以从系统中查看每位读者的借阅情况,通过分析读者的借阅数据和个人信息,更好地了解他们的阅读倾向和阅读需求。

1.3.4 2017年图书借阅排行前100名的读者分析。笔者对2017年图书借阅前100名的读者在各年级所占比重进行分析,发现在借阅排行前100名读者中,大一学生8人、大二学生51人、大三学生17人、大四学生9人、大五学生1人,研究生和教职工各7人。笔者统计发现,借阅排行前100名的读者中,大二学生最多,其次是大三学生,大一、大四和大五学生相对较少。笔者分析有以下几个原因:一是大一新生少与他们对图书馆的熟悉程度及进校时间有关。二是学生进入大三后,学业比较繁重,且即将进入实习期,到图书馆的时间相对较少,因此他们借阅图书的数量相对较少。通过对借阅排行前100名读者的分析,对学生借阅情况有了大概的了解,笔者认为,对借阅较少的学生,图书馆可以对他们开展有针对性的主动服务和帮助。例如,针对大一新生,图书馆可开展新生入馆培训,向他们介绍图书馆的各种服务设施与图书馆的使用方法、借阅程序、规章制度和检索方法等,让他们尽快熟悉图书馆,并能很快地利用图书馆;针对正处于实习期的学生,图书馆可为他们提供图书邮寄服务、延长借阅时间等服务,并向他们提供网上咨询和电子资源服务,让他们在实习期间也能够享受到图书馆的服务。

2 大数据在图书馆应用过程中存在的问题

2.1 图书馆数据安全问题

习近平总书记指出,没有网络安全就没有国家安全,网络安全关系到国家的安危。由此可知网络安全的重要性。图书馆也是如此,图书馆网络系统具有分布广域性、体系结构开放性、资源共享性和信道共用性的特点。图书馆网络系统虽然增加了实用性,但同时也存在系统的脆弱性,這使图书馆必须面对网络安全这一严峻挑战,网络病毒泛滥,黑客的恶意攻击和读者的网络信息安全需求对图书馆网络安全提出了要求。因此,图书馆必须提高网络安全防范意识,做好数据的备份和病毒防范工作。

2.2 馆员数据思维

馆员的思维方向决定了图书馆的服务方向。当读者遇到问题时,能够得到馆员的及时帮助,在某种程度上增强了读者对图书馆的依赖感,这也是图书馆存在的意义所在。在大数据时代,馆员的思维如果仍然停留在坐等读者上门的被动服务模式上,那么就必将被时代所淘汰。图书馆要充分发挥其应有的价值,更新读者服务理念,增强馆员服务意识,即形成读者服务的数据思维意识,更好地开展读者服务工作。

2.3 培养数据分析人才

图书馆的发展离不开人才。笔者认为,图书馆必须拥有相应的具备数据分析、数据处理及管理数据的人才。但现阶段,图书馆这方面的人才相对来说比较缺乏,如贵医图书馆目前计算机专业管理人员只有5人,人员配比不合理,因此,图书馆应根据业务需要培养具有数据分析、数据挖掘等技能的人才,需要运用现代的科学管理方法对人力资源进行合理有效的配置,调整图书馆人力资源的专业结构、年龄结构及知识结构。另外,图书馆还可考虑图书馆与图书馆之间、图书馆与其他部门之间进行人才互换,以解决日常工作中存在的问题。

2.4 资源采购的成本问题

图书馆资源采购成本主要包括图书、期刊、数据库、电子资源等。近年来,虽然图书馆购书经费逐年增加,但随着物价的不断上涨,图书涨价现象越来越普遍,购书经费的增速已赶不上物价上涨的速度,经费短缺已经成为阻碍图书馆资源建设发展的重要因素之一,尤其对于欠发达地区的高校图书馆来说更是如此。在这种背景下,图书馆可建立以高校图书馆为中心的区域性资源联采共享的合作模式,以应对图书馆经费短缺问题。

3 结语

大数据给图书馆的发展带来了前所未有的机遇和挑战。高校图书馆应与时俱进,关注和重视大数据的应用和研究,妥善处理实际工作中遇到的问题,这也是顺应时代发展的必然要求。“得大数据者得未来”,高校图书馆要抓住机遇,应用数据分析,让数据“开口说话”,充分发挥其职能作用,在服务方式、服务内容等各方面均有质的飞跃。

参考文献:

[1] 李德毅.大数据认知:“2015大数据价值实现之路高峰论坛”主题报告[J].重庆理工大学学报(自然科学版),2015(9):1-6.

[2] 樊伟红,李晨晖,张兴旺,等.图书馆需要怎样的“大数据”[J].图书馆杂志,2012(11):63-68.

[3] 吕晓丽.近五年我国图书馆大数据研究综述及展望[J].兰台世界,2017(8):89-91.

[4] 张凯,郭健栖.图书馆主题大数据调查及前瞻性构想:基于百度指数的分析[J].中国图书馆学报,2016(6):51-66.