论大数据时代图书馆服务的发展与创新

2014-02-12 11:40许碧文
图书馆理论与实践 2014年12期
关键词:公共数据结构化图书

●许碧文

(杭州图书馆,杭州310028)

论大数据时代图书馆服务的发展与创新

●许碧文

(杭州图书馆,杭州310028)

大数据时代;数据挖掘;图书馆服务;知识服务

大数据时代,要主动应对大数据对传统图书馆服务的冲击和挑战,重点建设数据资源网络体系,打造公共数据存储和服务中心,深化知识服务及增强图书馆服务的针对性和有效性,努力探索大数据技术和观念的创新及应用,切实促进图书馆服务的发展与创新。

大数据时代的到来,必将对当前图书馆的发展理念、工作定位、服务模式等产生巨大冲击,图书馆事业亦将面临一个重大抉择和发展起点。图书馆界如何迎接大数据带来的各种挑战,如何利用大数据创新发展图书馆服务,如何提升图书馆在信息技术革命潮流中的竞争力,如何借助大数据带来的机遇突围图书馆事业发展的困境和瓶颈,成为当前图书馆界亟待研究的重要理论和实践问题。

1 建设动态、优质的数据资源网络体系

(1)全面优化数据资源的收集存储。过去,无论是传统图书馆还是数字图书馆,主要侧重数字资源库、机构知识库、语义化信息等结构化数据的收集和存储,而对半结构化、非结构化数据关注较少。目前世界上非结构化数据占比高达80%以上,如果对这部分数据忽视,将意味着对大部分有价值的信息视而不见。大数据时代,半结构化、非结构化数据的收集、存储和开发运用技术得以突破和迅速发展。为此,图书馆数据收集存储中应延伸到所有承载人类文明记录的资源,即全媒体资源,要多关注半结构化、非结构化数据收集,包括邮件、视频、微博、页面点击等数据。图书馆可以在服务中积极运用web2.0技术,开辟交互式共享平台,开设用户互助吧、论坛、社区等栏目,为馆员和用户、用户与用户之间开辟实时的交流通道,了解读者的阅读爱好和阅读习惯。积极通过射频识别(RFⅠD)、门禁通过等技术,收集日常用户的身份关系、借阅记录、存储信息行为、搜索方式、行为痕迹等结构化和非结构化信息。由此,让图书馆收集存储的信息“活起来”,成为立体化、动态性、关联性的知识谱系。

(2)联通数据资源的共享网络。大数据时代下,超体量的数据迅速增长,单个图书馆要对如此庞大的数据群进行收集、存储不仅不可能,也毫无必要,必须形成协调合作网络体系,才能真正实现数据的共有共享,提升信息服务能力。随着分布式缓存、大规模并行处理(MPP)数据库、分布式文件系统、云计算平台、各种NoSQL分布式存储系统等大数据技术的运用,很大程度上加强了数据收集、存储和共享能力,为图书馆在资源共享网络建设方面提供了巨大的技术支持和发展前景。具体说,图书馆在推进数据资源网络体系建设中,首先,深化图书馆数字化,把各类资源转化为电子数据,在此基础上,共同推进全国乃至全世界图书馆资源共享。虽然我国目前没有任何一所图书馆占有的数据资源达到了PB级,但全国图书馆数据资源总量却是一个庞大的数据集。其次,推进与档案馆、博物馆、艺术馆等公共机构的资源共享,各部门应充分利用大数据时代提供的技术支撑,积极转变观念,理顺体制机制,加强图书、档案、博物馆等之间的“一体化”建设。再者,选择性地与其他各类信息中心合作,信息时代,各大型信息中心迅速产生,如Google的学术搜索、图书搜索服务,百度的“百科”、“知道”服务等,甚至包括商业中心、社会服务中心、娱乐中心和工作空间等在内的信息中心,在数据占有、数据挖掘和分析中具有重要意义,图书馆应利用大数据技术,有选择性地与其联网共享。

2 推动公共数据的存储、公开和挖掘

(1)搭建政府公共数据连接池。大数据时代,政府政务的数字化及政务数据的透明化迅速增强,政府作为公共数据“托管人”,为公众提供访问数据窗口成为不可逆转的潮流。我国正处于城镇化高速发展、民主法治迅速推进的转型期,通过开发政府公共数据,对缓解交通拥堵、资源紧缺等问题,消除社会争端、群体对抗等矛盾,显得极为迫切。这也是大数据最具潜力的应用领域之一。[1]图书馆作为法定的政府信息公开承办单位,在当前管理体制下,就推动政府数据公开方面可作为的还很有限。但公开是一种趋势,而且也正在不断推进中,图书馆应该在可为的范围内,充分利用大数据技术,积极搭建政府公共数据连接池,不断推进公共数据的开放。

(2)做科研数据监护的引领者。我国除重大科研项目采取了有规划的数据管理外,大部分科研数据仍处于无序状态,这对于大数据时代下的科研创新将造成无法估量的损失。图书馆在数据监护工作中所承担的职责包括分析数据集合的存储、数据管理规划、最佳实践经验传播、收集与传播数据集合以及完成数据保存标准的制定等。[1]而大数据时代,在超大体量数据的收集、存管、共享技术方面有较大发展,为图书馆履行数据监护职责,嵌入到科研一线获取数据,对数据进行持续系统性维护,根据科学研究需要推送数据服务等方面提供了重要支持。为此,我国图书馆特别是高校图书馆,应抓住这一发展机遇,创新服务业务,提升能力水平,通过为科研项目提供数据监护服务,抢占科研数据发布、存储、利用和管理的重要阵地,扩大图书馆服务效益。

3 大数据时代图书馆服务的发展与创新

3.1 借助数据挖掘技术深化图书馆的知识服务

大数据时代的数据挖掘和数据分析,不是传统意义上的一般性统计计算,而是深层次的数据整合与挖掘,须广泛运用分布式系统基础架构Hadoop、非关系型数据库技术NoSQL等大数据技术,从而高速捕捉、发现和分析大容量、多类型的数据并获得价值。如何充分利用好积累的或者正在产生的巨量数据信息,掌握背后的潜在价值,将成为大数据时代政府机构、企业及科研机构等首要关注的问题。在这种强烈的市场需求和发展趋势下,图书馆的核心能力不在于所拥有的信息资源,而在于具备利用广泛信息资源为用户创造有价值的知识和能力,图书馆服务必须走向知识服务、知识咨询,并以此作为图书工作新的生长点。[2]但从目前看,我国图书馆的知识服务还处于初级阶段,主要局限在参考咨询、信息咨询等知识导航、收集及提供等方面,对于以解决问题为导向,提供技术发展预测、趋势分析、宏观决策咨询及基于专业技术层面的知识咨询等服务模式还有待推进。[3]

大数据时代,带来了更丰富的数据资源和更专业的数据分析技术,形成了新的解决问题的思维模式,提供了更广阔的信息合作视野,[4]为数据分析业务带来了重大变化和支撑,也为知识服务向专业化、个性化、决策与创新型发展,带来了巨大的发展机遇。图书馆是人类社会的知识宝库和智慧发源地,充分利用大数据的各种技术,迅速转变数据处理的范围、方式、对象、目的等理念和方式,积极推进图书馆信息服务等传统业务向数据分析、数据挖掘方向转移,开展更有深度、广度的知识服务,把为政府、企业等做各类数据分析服务、数据挖掘服务变为大数据时代图书馆的常态服务内容。这将是大数据时代,图书馆服务发展和创新最具挑战的领域,也将是催生图书馆服务创新发展的新的平台和机遇,更是图书馆现代服务的生成及实现的基本途径。[5]

3.2 提升图书馆服务的针对性和个性化

(1)增强阅读推广服务的效果。目前,图书馆在阅读推广方面的工作存在许多不足,特别是可持续性、实效性方面亟待提升。据资料显示,亚马逊网站充分利用大数据相关性分析,通过有效的图书推荐使其图书销售量增加三分之一以上。人们之所以阅读,也是基于推荐的理由。在大数据时代,图书馆也可以通过广泛的数据分析,如通过对读者借阅情况、书籍出版信息、社交网站评论、经济社会发展状况等各类数据分析,找出各类相关性,了解特定时期、特定群体的知识需求、阅读薄弱点以及阅读兴奋点和关注点,主动创新方法有针对性地开展阅读推广工作。不仅可开展面上的阅读推广,也可开展点对点的阅读推广。例如,通过收集和分析读者借阅情况、生活阅历、工作岗位等方面的半结构化、非结构化数据,总体把握读者的阅读习惯和知识需求,有针对性地向其开展图书推荐、知识推送等工作,增强阅读推广效果。

(2)提升社区图书馆、流动图书馆等工作效率。研究表明,当前,我国图书馆利用率低的一个重要原因是图书馆距离用户太远,当图书馆与用户保持合适距离,可有效促进公众对图书馆的利用。社区图书馆、流动图书馆等是图书馆深入用户、亲近用户的有效载体,是图书馆服务的“神经末梢”,扩大了图书馆辐射范围,本可以解决这一难题。但现实效果并不理想,普遍反应是“无法阅读到合适的、需要的图书”。造成这种情况的原因主要是社区图书馆、流动图书馆没有根据用户的需要有针对性地分派图书,及时更新书籍。大数据时代,可以通过数据分析,把握特定区域的人群结构,判断他们亟需的图书服务,准确掌握服务的时间、内容、形式和地点等,大大提高图书的利用率,发挥图书馆的作用。

(3)打造舒适亲和的图书馆物理空间。随着网络化信息服务、数字化图书馆的发展,实体图书馆作为资料储存、展示的功能逐渐退化,越来越成为“身体和灵魂的放松、愉悦空间”。将海量信息的科技体验和美妙空间的艺术体验融为一体,让读者到图书馆,除完成检索信息的主要目的之外,还可以学习、办公、开会、交友、参观、体验、欣赏,甚至是约会、小憩,将成为实体图书馆发展的一大目标。在大数据时代,提升图书馆资料摆放合理性方面,可以借鉴沃尔玛“尿布和啤酒”经典案例做法,通过对读者进出图书馆的行走路线、取阅书籍的习惯、书籍资料关联性等方面数据分析,挖掘出潜在的价值和判断,优化图书资料分布组合及摆放格局,提高图书资料的利用率,方便读者的取阅查找等。在图书馆空间布局方面,收集读者对舒适度、审美、光线等要求方面的数据,对家具和设备的组合性、伸缩性、移动性和体验感进行优化,让读者在获取信息中体验艺术般的享受。

[1]关志刚编译.大数据最具潜力的三大应用领域[EB/OL].[2013-11-18].http://www.ctocio.com/ bigdata/8293.html.

[2]张晓林.走向知识服务:寻找新世纪图书情报工作的生长点[J].中国图书馆学报,2000(5):30-35.

[3]史海燕.我国数字图书馆知识服务模式及实践研究[J].现代情报,2010(9):15-18.

[4]王天泥.知识咨询:大数据时代图书馆的知识服务增长点[J].图书与情报,2013(2):74-77.

[5]李雪冰,梁杰.图书馆现代服务的生成及实现途径——基于知识管理角度[J].图书馆理论与实践,2012(1):10-13.

G254.97

A

1005-8214(2014)12-0019-02

许碧文(1978-),女,硕士,馆员,研究方向:图书馆服务、图书馆信息化建设。

2014-05-26[责任编辑]李金瓯

猜你喜欢
公共数据结构化图书
公共数据授权运营机制探索
公共数据治理中的价值实现机制
公共数据归属政府的合理性及法律意义
促进知识结构化的主题式复习初探
改进的非结构化对等网络动态搜索算法
图书推荐
结构化面试方法在研究生复试中的应用
左顾右盼 瞻前顾后 融会贯通——基于数学结构化的深度学习
公共数据开放许可的规范建构
欢迎来到图书借阅角