公共大数据资源应用于图书馆的可行性分析

2017-12-19 00:32郭璇
创新科技 2017年8期
关键词:大数据平台图书馆

郭璇

[摘 要] 本文主要针对大数据时代图书馆面临转型期出现的问题和挑战,以及大数据公共资源对图书馆的意义等进行了分析论述,提出了如何利用公共资源建立起自己的大数据平台,为用户提供更细致、更个性化的信息服务,以及全新的信息获取方式和渠道。

[关键词] 公共大数据;图书馆;大数据平台

[中图分类号] G250.7 [文献标识码] A [文章编号] 1671-0037(2017)8-93-4

Analysis on the Feasibility of Public Big Data in the Application of Library

Guo Xuan

(Literature and Information center of Henan Academy of Social Sciences, Zhengzhou Henan 450000)

Abstract: In this paper, the transition problems and challenges faced by the libraries, and the significance of big data public resources on library in the era of big data are mainly analyzed and discussed, it is put forward how to use public resources to establish its own big data platform, to provide a more detailed and more personalized information service for users, as well as new information access mode and channel.

Key words: public big data; library; big data platform

經李克强总理签批,国务院印发的《促进大数据发展行动纲要》中明确,推动大数据发展和应用,打造精准治理、多方协作的社会治理新模式,建立运行平稳、安全高效的经济运行新机制,构建以人为本、惠及全民的民生服务新体系,开启大众创业、万众创新的创新驱动新格局,培育高端智能、新兴繁荣的产业发展新生态。大数据时代的来临给图书馆的资源系统和服务体系提出了全新的挑战,打破了图书馆以往的传统模式,读者对图书馆的要求也越来越高。在这个信息爆炸的大数据时代,图书馆不能和过去一样仅仅依赖书籍资料,要寻求创新之法、转型之路,改革资源系统、改革服务体系,只有这样,图书馆才能够实现与时俱进,才能够适应大数据时代的发展需求。

1 大数据时代图书馆面临创新转型的挑战

“图书馆是文献信息资源的集散地、是传播文献信息资源的枢纽”。传统图书馆主要是通过对文献资源的收集、加工、整理等一系列的科学管理方法,帮助广大读者更加方便的借阅和使用。图书馆的职能还有对馆藏的大量文献信息资源,尤其是古籍文献资源的开发和利用,而这也是图书馆所承担着的各种职能的基础。随着互联网的飞速发展,云计算、物联网等新兴技术随之走入大众的视线,各种数据呈现海量增长,大数据时代已经到来,这就意味着传统图书馆所承担的职能已经不能满足需求,图书馆的发展面临着前所未有的挑战。

1.1 传统图书馆的信息中心地位逐渐减弱

在互联网尚未普及之前,图书馆是文献资源的主要聚集中心、储存中心,图书馆在文献信息资源方面的中心地位,是其他机构所无法替代的。如果读者需要进行文献资料的查找和阅读,最有效的方式就是去图书馆,才能更快更准确的获得对自己有帮助的资料。但是,随着互联网的普及,以及网络技术的不断成熟,图书馆的信息中心地位受到了前所未有的冲击,图书馆已经逐渐地失去了信息中心的地位[1]。

而现在,一些机构利用信息数字化技术,将各个种类的文献资料进行了资源的数字化转化,建立起了规模庞大的数据库,例如一些强大的网络公司,在海量的大数据资源和高端技术的支持下,依靠网络的技术和渠道,所提供的服务已经逐渐渗入图书馆的服务领域,建立起了属于网络公司自己的文献资料服务的系统,例如百度文库、道客巴巴文库等,他们为读者提供在线检索、在线阅读、文献资源下载等服务,使读者得到了方便、快捷、准确、有效的使用体验。这无疑带给传统图书馆的经营带来了极大的冲击,也削弱了图书馆信息中心的地位。

1.2 数字化阅读方式正在动摇传统图书馆存在的基础

中国新闻出版研究院2017年4月18日公布了第十四次全国国民阅读调查的主要情况。调查显示,2016年我国成年国民各媒介综合阅读率为79.9%,较2015年的79.6%略有提升,数字化阅读方式的接触率为68.2%,较2015年的64.0%上升了4.2个百分点,图书阅读率为58.8%,较2015年的58.4%上升了0.4个百分点。2016年我国成年国民人均图书阅读量为7.86本,较2015年增加了0.02本。2016年手机阅读率达到66.1%,已经连续8年增长[2]。

对我国国民的阅读方式的调查研究发现,有9.8%的国民更喜欢“网络在线阅读”,有33.8%的国民习惯“手机阅读”,有3.8%的人选择“在电子阅读器上阅读”,成年国民中有51.6%更倾向于“拿一本纸质图书阅读”,1.0%的国民“习惯从网络上下载并打印下来的纸质阅读”。电子阅读方式的方便快捷,以及读者适应碎片化的阅读,使电子阅读率快速增长。这些数据都表明,数字化阅读方式的快速增长,正在动摇传统图书馆文献书籍形式的存在基础,传统图书馆不得不进行数字化转型。

1.3 传统图书馆的服务方式已无法满足读者的需求endprint

传统图书馆的服务方式主要以书籍的外借和在馆内的阅览等为主,从服务对象上来说,无法提供一对一的单独服务,从服务时间上来说有开馆和闭馆的时间,因此,无论是对读者的开放时间还是提供的服务方式都有着很大的时间和空间上的限制。传统图书馆这种高投入、低效率的状态显然已经无法满足读者的需求。在信息化高速发展的今天,使用数字信息技术手段对文献书籍等资源进行数据处理,就可以让读者随时随地的通过网络终端设备对自己所需要的文献资料信息进行查询和阅读,不仅方便快捷,而且完全打破了时间和空间的限制。

因此,图书馆应对其赖以生存的两大基石“读者”和“资源”做出新的审视。图书馆的工作重点是不断地丰富和优化馆藏文献资源,图书馆行业需要做到“依靠文献、超越文献”,来为读者提供深度的、满足读者个性化需求的信息服务。图书馆应当以馆藏文献资料为基础,与文献信息、网络数据信息、用户信息等相关信息相结合行进分析整合,从而满足读者深入获取各种信息的需求。同时,还要在服务的技术和方式上不断创新和改变,为读者提供更加高效、优质的服务。那么,如何提供这样高效、优质的服务呢?这就需要利用公共的大数据资源,对读者的阅读喜好进行精准分析,从而为不同需求、不同喜好、不同阅读类型的读者提供针对性强、个性化强、效率强的服务。图书馆未来的发展方向和创新方式,也应该着眼于此,而这些全部都需要建立在大数据的基础上。

目前,图书馆采集的数据主要包括馆藏文献资源数据、用户使用数据和工作数据。目前图书馆正处在不断建设与自我完善的过程中,而这个过程实际上已经开始了数字化的转变过程。数字化的图书馆由于其自身的优势,首先拥有了通过纸质文献转换而成的数字资源、电子书资源,以及最具有研究价值的古籍资源,这已经是极为可观的数量,由此产生的部分数字资源甚至是图书馆独有的数字资源优势。此外,还有各类音频、视频资源,这些都是图书馆的馆藏信息数据的一部分。这些数字资源数量庞大,并且始终处于持续不断的快速增长的状态。阅读大数据将“读者”“图书馆”“数据文献资源”“公共数据资源”四方面紧密地联系在一起,图书馆应该把这些数据资源加以利用,然后为读者打造前所未有的、最为有效的、可量化的阅读维度,从而为创新和提升图书馆的服务系统提供新的保障。总之,不断地完善图书馆服务功能、拓展服务的范围、让读者能感受到图书馆的服务,为增加图书馆服务的深度、扩大图书馆服务的范围等提供有利条件[3]。

2 大数据公共资源对图书馆的意义

大数据作为国家战略被纳入备受关注的“十三五”规划纲要(草案)当中,并在纲要中明确提出“把大数据作为基础性战略资源,全面实施促进大数据发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级和社会治理创新。”图书馆作为知识信息的存储中心,是现代社会公共服务体系的一个重要组成部分。而随着大数据时代的到来,图书馆的数字化建设已经处在飞速发展的过程中,拥有着数量相当可观的、类型多种多样的数据化资源,图书馆自身服务水平的提升和服务质量的提高,也必需使用大数据作为基础和支撑,大数据已逐渐成为图书馆未来发展方向的核心内容。

2.1 大数据公共资源的来源

现阶段,各类大数据的统计机构,有来源于官方,也有第三方的,且已收集整合并转化的大数据信息很多都被视作数据资产,不会无偿提供给用户。但是,随着政府层面对大数据的进一步开放,对数据的利用能力将在未来成为衡量整个大数据产业综合竞争力的新标杆。但面对巨大的未来市场空间,从何处挖掘大数据的价值?过往来看,业内普遍认为非公开数据要比公开数据更具挖掘和应用价值,从公开信息当中很难提供更具深度的策略支持[4]。因此,非公开数据领域一直都处于激烈的竞争中,而公开数据资源的应用價值和有效信息的发掘却往往被忽略了。

图书馆大数据平台建设的数据来源首选就是这些开放的公共数据资源,这些资源可用性强,但资源分散,不仅数据种类繁多,而且来源纷杂。而我们要做的就是将互联网中这些分散的公共资源整合起来,结合图书馆本身的资源优势,建立属于图书馆的大数据平台。中国大数据专家柳超博士认为:“公开数据被连接起来后,具备更大的价值,未来的想象空间也很大”。通过大数据技术将公开数据“连接起来”,发掘公开数据背后的关系,基于开放和共享的政府公共数据,依托数据采集、数据清洗、数据聚合、数据建模、数据产品化为一体的大数据解决方案,为用户提供信息查询功能,解决大数据时代的图情服务。

2.2 图书馆资源的数据化、公共化

从另外一个角度来说,图书馆资源本身也是大数据资源的一种。以往的图书馆以收录纸质文献为主,但随着大数据的发展,纸质文献已经不能满足读者的需求,随着数字技术的发展,图书馆的文献资源,尤其是古籍,均可以进行数字化转化,进而借助图书馆专门的管理服务系统对大数据平台中的数据进行组织、检索和提供等统一管理,发掘数据的关联性,将之转换为读者所需的知识和信息。进行文献资料的共享,即在特定范围内,让特定人员以及特定文献服务机构等对相关文献资料进行共享,是处于大数据时代的图书馆对自身的服务体系进行改革和创新的一个重要途径。因此,在以后的工作中,只有打破传统图书馆的服务理念、服务模式等不利因素,才能实现文献资料的共享,才可以进行图书馆服务体系的改革和创新[5]。图书馆的未来发展形态将从物理图书馆逐渐转变为“泛在图书馆”,并将从文献知识资源的集散地转变为多功能空间,其服务形式将会“在任何时间、任何地点向其服务的任何用户提供任何时期、任何类型、任何格式和任何语种的信息资源的图书馆”[6]。未来图书馆的服务核心在于解决用户查找文献和获取知识中的问题,帮助用户从海量的数据信息中用最短的时间找到其所需要的信息,所提供数据信息资源必须是高质量的,并且持续不断地跟踪用户所关注的信息。未来图书馆的角色定位应该是识别、定位高质量信息,为读者提供能帮助其解决问题的知识[7]。

2.3 公共大数据资源将改变图书馆的发展趋势endprint

随着越来越多的大数据资源公开化,公共大数据资源将成为图书馆的信息化数据平台资源来源的一个重要组成部分。如何从海量数据中获取有用信息,再将有用的信息反馈给用户,已成为图书馆信息服务发展的趋势。借助图书馆专门的管理服务系统,对公共大数据进行有效分析处理,并分类整合,配合现今逐渐普及的智能移动终端和穿戴设备,提供给读者“任何时间、任何地点、任何方式”的全方位的使用体验。借助公共大数据资源建设的图书馆大数据平台,终将打破传统图书馆被动、机械、单项交流的服务方式,进而与读者建立起一个立体、智慧、互动、个性化的全方位的服务方式,打破时间和空间限制,做到“书书相连”“书人相连”“人人相连”“有问必答”。因此,基于公共大数据资源建设而成的图书馆大数据平台,将会对图书馆和读者产生广泛的影响,并改变传统图书馆的经营和服务模式。

3 图书馆的大数据公共平台

阿里巴巴创办人马云在演讲中提到,未来的时代将不是IT时代,而是DT的时代,DT就是Data Technology大数据科技时代。大数据是人们获得新知,创造新价值的源泉,业界归纳其具有四个特点:规模性(Volume)、多样性(Variety)、高速性(Velocity)、和价值性(Value)。随着大数据时代的到来,各种数字化信息充斥在我们周围,但是,我们如何能从这些数量巨大、种类繁多的数据中,及时、准确、快捷地获取更多、更好、更有用的信息,已然成为人们尤为关注的问题。大数据时代已经在数据爆炸式的增加和现代信息化建设的高速发展中到来了,传统的前往图书馆借阅图书的方式显然无法满足读者多种多样的需求,在网络发达的现今社会,图书馆需要做出从“以馆藏为中心”向“以用户为中心”的转变。高速发展的社会使用户对知识信息的需求不断增长,同时,对阅读的需求也日益多样化、个性化、高效化。大数据技术能够帮助图书馆进行资源整合和全样本分析,也就必然会不断被应用于图书馆的各项业务工作中,进而成为图书馆业务创新和未来发展的重要方向。图书馆作为读者获取信息和知识的重要渠道之一,有义务和责任将读者需要的信息和知识提供给读者,因此,图书馆必须有整体的解决方案,并尽快完成这种转变。

3.1 图书馆的公共资源大数据平台的功能

通过现代信息技术将各个图书馆的资源进行优化组合,建设属于图书馆行业的公共资源大数据平台,为读者提供更加全面、及时的数据文献信息,并且读者无须再受时间和空间的限制,实现随时随地的数据文献信息资源服务,全方位的最大限度满足读者的需求,让图书馆数据文献信息资的优势得到充分的发挥。最重要的是,图书馆的公共资源大数据平台能够为图书馆在大数据时代的发展寻找可行的方向,并为图书馆在大数据时代的优势发挥提供途径,增强其竞争力。同时,实现图书馆资源的数据化优势与网络公共数据资源的聚合整理,这样,图书馆资源将不再局限于纸质文献,从而实现纸质文献和海量数据资源的综合服务。

3.2 图书馆如何利用公共资源建立起自己的大数据平台

图书馆的公共资源大数据平台不仅要搜集海量公共资源数据,对这些数据进行分类整理加工,发现其中蕴含的知识并加以利用,更要寻找隐藏在数据中的模式、相关性和趋势,并与图书馆本身所具有的文献资源和数字资源优势相结合,为读者提供他们需要的数据资源和信息服务。并且,图书馆的大数据平台可以实现资源共享,即各地的图书馆将自己的大数据平台资源联合共享,这样就可以为读者提供最为全面、详尽的信息资源。

图书馆除了自有的馆藏数据以外,还应该加强对非结构化的数据建设的重视,可以结合公共资源大数据,尽可能多的采集与读者行为有关的数据信息,然后再将这些信息进行整合处理,完善用户画像,应用大数据技术分析出读者在阅读喜好和服务需要等方面的更多信息。这样,图书馆便能以读者行为信息的数据分析结果为基础,构建起智能化的图书馆公共资源大数据信息管理服务平台,使读者能够享受到大数据技术和智能化设备所带来的丰富信息资源和良好的获取体验。同时,读者还可以根据自己的需求进行搜索和知识的整合,来获得自己所需的相关信息。读者在对所需信息进行定制时,可以根据自己的喜好来选择服务方式、界面方式以及资源方式,以保证搜索到的图书以及电子期刊和数据库等是自己所需要的。

3.3 图书馆公共资源大数据平台的实现形式

图书馆公共资源大数据平台可以采用网络终端APP的形式来实现。现在国内外已经有一些大学的图书馆开始尝试提供新的服务方式看,推出了移动终端的APP应用,学校的老师和学生等经过审核的校内用户可以直接在手机、平板電脑等移动网络终端设备上,登录校内的网络智能图书馆系统。该系统可以向校内用户提供相关的图书文献检索、图书借阅、借阅记录、费用信息记录查询、电子图书期刊的在线阅读服务等相关服务。同时,还会采集用户的书目期刊检索查询记录、行动位置轨迹、阅读时段等方面的信息,然后将这些信息与用户的相关注册信息,如性别、身份(教师、学生)、年级、所在学院、专业、职称、职位等方面信息相结合,进行聚类分析,从中了解每位用户的知识信息需求和阅读习惯,完成对用户画像的描绘。图书馆还可以根据这些分析结果,及时更新和补充被检索最多的、最受用户关注和借阅最为频繁的相关图书期刊资料,还可以根据每位用户的阅读喜好和专业知识信息需求来推送用户可能需要或想要了解的各专业领域最新的知识信息和书籍信息,更好地为用户提供服务。

除此之外,大数据还能为图书馆构建全新的知识服务引擎提供必要的技术支撑。并且在技术应用于管理过程中还可以不断反馈信息,如果相关环境发生变化,大数据技术可以预测未来可能发生的故障并为图书馆制定相应的解决方案提供可靠的数据参考。

利用现有的、开放的、公共的大数据资源,来建立属于图书馆的大数据平台,为图书馆在大数据时代的发展寻找可行的方向,将大数据公共资源应用于图书馆的大数据平台,让大数据技术融入图书馆的信息服务系统中,实现其从传统图书馆向复合型图书馆的转型,为用户提供更细致、更个性化的信息服务,以及全新的信息获取方式和渠道。

参考文献:

[1] 王捷.大数据时代下图书馆开展信息服务的对策[J].现代情报,2013(3):81-83.

[2] 中国新闻出版研究院.第十四次全国国民阅读调查报告.[R].新浪读书,2017-4-18.

[3] 李凤念.大数据时代高校图书馆受到的挑战及其发展对策[J].农业图书情报学刊,2014(3):80-83.

[4] 新浪财经.大数据市场开启公开数据价值挖掘[DB/OL].http://finance.sina.com.cn/money/bank/bank_hydt/doc-ifxrpvcy4274928.shtml,2016-04-21.

[5] 杨海燕.大数据时代的图书馆服务浅析[J].图书与情报,2012(4):120-122.

[6] 刘兹恒.图书馆未来发展的十大趋势[J].中国出版传媒商报2016(4):3.

[7] 应对大数据时代.万方数据与图书馆业共建高标准知识服务[EB/OL].http://www.cctime.com/html/20286142005014.htm,2012-08-06.endprint

猜你喜欢
大数据平台图书馆
图书馆
气味图书馆
欢迎到图书馆做客
Hadoop性能测试自动化研究
基于大数据的智能停车场管理系统设计
基于大数据分析的智慧仓储运营支撑平台设计
袜业行业大数据平台的应用研究
去图书馆