大数据时代的图书馆探讨

2015-05-13 13:28李娇等
卷宗 2015年3期
关键词:大数据时代图书馆发展

李娇等

摘 要:随着大数据时代迅速来临,给社会文化与各行各业都带来了巨大变革,图书馆同样不例外。就大数据来说,图书馆界先后进行了一系列学术研究以及实践,但图书馆事业当中大数据的运用仍然存在着许多问题,这些问题的存在对图书馆正常发展及运营造成了严重影响,因此优化其应用程序尤其关键。

关键词:大数据时代;图书馆;发展

基金项目:重庆市高等教育教学改革研究项目(133023,1203036)。

1.前言

随着大数据时代的到来,对图书馆的建设和服务等工作产生了很大的影响。比如,出现了图书馆的大数据存储能力不够、容易泄露读者的保密数据及其阅读隐私等问题。当前,为保证图书馆顺应时代发展的需求,及时做好相应的应对措施,实现大数据在图书馆管理中的可用性,已成为图书馆准确、高效地满足读者阅读需求,优化服务模式的关键。因此,图书馆应科学的进行大数据的采集、分析及判定和决策,以实现大数据的可控性、有效性和经济性。

2.对图书馆运用大数据的主要问题

2.1 图书馆的大数据运行技术及基础设施条件不够

图书馆数据具有资源总量大、增长迅速快的特点,其种类以及数量随着信息时代的到来逐超越纸质版的学术资源,将成为图书馆的重要馆藏部分,也是数字图书馆日后可依据的重要资产。因此,出现了图书馆的大数据运行技术及基础设施条件不够的问题。当前,将新兴的大数据技术合理的运用于数字化的图书馆,构建出大数据图书馆所需的基础设施条件,已是大数据时代背景下图书馆进行建设的一项重要挑战。一方面,信息时代,读者产生的数据信息中会存在很多半结构化和非结构化的信息数据,致使信息数据的结构类型和格式形态等都更加复杂。因此,极速增长的数据量给图书馆的存储能力带来了很大的挑战,当前现有的图书馆的整体性的知识服务结构并不完善,其数据处理技术很难实现大数据的应用需求。另一方面,大数据种类的复杂化给图书馆的常规分析带来了很大的挑战,这就要求必须突破对大量异构数据的处理和分析不足的问题。当前,大数据时代产生的数据总量及类型的急剧变化使图书馆的基础设施承受着很大的压力,由于受到成本的制约,现阶段的大部分图书馆难以在短时间内在技术、基础设施的建设等方面满足建设大数据图书馆的实际要求[1]。

2.2 大数据的不确定性对图书馆管理提出了新的挑战

大数据存在一定的不确定性,这种不确定性特征会致使网络数据很难被建模及有效学习,从而难以发挥其有效利用的价值。数据本身存在的不确定性、并不完全准确的原始数据、对数据采集的处理力度以及应用需求等因素致使数据在不同的维度和尺度方面均出现了不确定性;大数据的模型也具有不确定性,由于数据自身具有的不确定性会要求数据的处理方式应该不同于传统的数据处理方法,这就要求图书馆在大数据的管理方面应该提出相应的新模型并把握好模型的表达能力,最终致使新选择的大数据模型也具有了一定程度的不确定性;大数据的学习具有不确定性,数据模型一般情况下都需要学习模型参数,但是通常情况下很难找到模型的最优解。因此,大部分学习问题都只是采用一个近似但并不确定的方法找出一个相对而言可用的解。在大数据时代的要求下,传统的近似学习方法则需要面对时效和规模的双重挑战,这样一来,便要求图书馆要尽量提高技术性管理水平来应对大数据学习中的不确定性[2]。

2.3 大数据为图书馆数据带来安全隐患的问题

在大数据信息时代,使用信息的安全和读者的阅读隐私问题已经成为当前建设大数据图书馆的一大挑战。开放数据和共享数据是进行大数据模式的核心精神,现阶段的各组织机构包括图书馆都开始公开、共享出各自领域的信息数据,在很大程度上消除了以往的“数据孤岛和数据割据”的状态,逐渐实现了共建图书馆数据以及数据价值最大化发展。但是,随着而来的信息安全问题也从传统的计算机网络的保密性管理、可控性管理逐漸转变为难于预见信息安全隐患和信息管理出现不可控的困境。随着近年来大数据的不断整合和大数据技术门槛的日益降低,导致图书馆大数据中所包含的大量的涉及用户隐私的商业情报,甚至是部分涉及国家安全的信息都成了难以保护的重要对象。由此,致使大数据背景下的图书馆数据的安全隐患问题日益严重化[3]。

3.图书馆应对大数据时代影响的有效对策

3.1 开发图书馆的大数据运行技术,使图书馆满足运行大数据的条件

在大数据背景下,只有开发图书馆的大数据运行技术,才能使图书馆满足运行大数据的条件。当前,图书馆建设的当务之急应该是树立大数据的发展战略,做好管理的顶层设计,科学推动图书馆完成大数据的转型。图书馆应该基于全局战略及局部战略的角度,根据自身实际条件对建立大数据的战略角色进行定位,并紧密结合图书馆所在区域的主要服务对象的馆藏特点等因素,建立起分级、分类的具体性实施策略,积极探索大数据的业务、服务、技术等模型。图书馆稳定发展的主要竞争力是其占有数据信息的规模活性和对数据的分析、挖掘、运用能力,当前,传统方法的数据定量分析已难以满足大数据的分析需求。图书馆可以采用统计学及模式识别等各种技术,从图书馆大量的数据中提取出信息中所潜在的各种价值信息。同时,图书馆应该成立适用的数据管理部门来专门负责信息数据的采集、收储和利用工作,通过馆内各部门间的协调工作,使图书馆满足运行大数据的条件。

3.2 图书馆应构建科学的大数据存储系统

图书馆大数据存储系统需要具有存储架构科学、存储容量大、存储区域网络化等,这些特性直接关系着图书馆的大数据管理效率和管理质量。因此,为顺应大数据时代的要求,构建科学的大数据存储系统,图书馆应该做好以下几个方面的工作:(1)关注大数据系统结构的科学合理性,存储数据应该严格按照数据信息的类型、应用需求和安全保障等对信息文件进行分块存储。 (2)采用认证用户身份及设置访问权限的管理模式,控制用户对大数据存储平台的数据访问。 (3)图书馆大数据存储系统应该具备比较强的数据容错力,以保证数据存储的可用性。(4)应根据图书馆的未来管理方向和服务数据量的增长情况,建设存储系统时应该保证系统可实现通过增加数据信息的节点数量或数据块的服务器数量,便可以自由进行数据存储能力的扩展。

3.3 确保图书馆大数据的可控性和可靠性

为确保图书馆大数据的可控性和可靠性,图书馆在进行数据采集时,通常希望可以最大范围地对数据进行采集和分析。这就需要图书馆运用科学的大数据采集方法进行数据的采集,以保证采集数据的精确性、价值密度和数据间的因果关系等。因此,为了保证图书馆大数据的准确性、高效性和可用性,图书馆应做好以下几个方面的工作:(1)图书馆应该根据运营服务和系统管理的实际需求,建立大数据的质量评估标准以及可用性的保障体系。通过利用评估系统科学的对大数据的数据信息的可用性以及数据间的关系进行评估,然后通过评估结果进而实时反馈,并采取相应的对策,进而保证图书馆大数据平台的科学性、经济性和可控性。(2)在对大数据进行采集、存储、管理和应用的过程中,图书馆应确保数据信息具有广泛的数据视角、长期性的原始格式存储类型、可快速的实现数据自身价值并为用户提供服务等。(3)图书馆应该根据数据价值的发掘程度及其未来的可用性,对高价值的数据进行长期性的安全存储及查询优化,保证高价值的大数据安全、稳定及未来可用。

3.4 强化图书馆数据的安全建设与管理

一直以来,保护国家情报安全和用户的个人图书情报都是图书馆的重要责任。但是,在大数据时代的背景下,大数据进行开放数据和共享数据致使国家情报安全和用户的个人图书情报出现了很大的安全问题,这一问题制约着图书馆进入大数据时代的速度。 面对这一问题,图书馆应该做好以下几个方面的工作,以切实保护用户的数据安全:(1)图书馆需要研发或者引进实现大数据条件下保护用户隐私的安全技术,以有效防止恶意入侵盗取和破坏数据的不法行为发生。同时规范数据的开放流程及接口,以保障图书馆的数据资源的科学有序的开放、安全使用。(2)图书馆是数据的守卫者,图书馆工作人员必须要提高自身的专业素养及职业道德水平,切实保护用户的个人数据信息安全,严格控制好信息的传播和开放范围,同时做好国家情报机密的保护工作,维护国家的信息安全性 。(3)政府应该研究并出台保护大数据安全的相关法律法规,通过立法的手段保护图书馆大数据的安全性。只有制定法律严厉的惩罚数据入侵者和数据破坏者,对其造成的危害后果追究相应的刑事责任,才能从根本上避免图书馆大数据安全问题的发生。

3.5 构建结构化及经济化的图书馆大数据平台

科学的构建结构化及经济化的图书馆大数据平台,图书馆应该做好如下工作:一方面图书馆在建设大数据平台时,应该坚持“统一标准、开放兼容”的基本原则,以有效减少建设平台系统的成本,并合理降低软件系统对硬件设备技术指标的参数要求。另一方面,进行大数据的存储、管理分析和应用建设,应该坚持“开源平台、保证软件可扩展及可移植”的重要原则,以确保系统方便操作、管理。此外,大数据平台应该通过对服务资源进行动态调配和扩展等模式,在保证实现数据存储、管理、分析过程中的最高收益的基础上,有效降低运营成本的投入。同时,大数据平台的性能设计应该满足图书馆的全周期管理、多类型数据、多功能使用以及全天候的连续性的综合性服务需求。

3.6 保证图书馆大数据的即时性和可用性

在大数据时代的背景下,图书馆的用户服务和读者的阅读活动所产生的数据具有了流动性和实时性的特点。这些随时产生的信息数据,对图书馆的用户服务模式以及服务质量都具有动态调控和即时判定的重要作用。一方面,图书馆应该通过获取的各种实时信息,对图书馆服务平台的系统性能以及服务质量等情况进行提前的预警,并进行实时监测和动态跟踪,最后做出相应决策,以全面提高图书馆服务的智能化和自动化水平。另一方面,图书馆应该通過对收集起来的读者阅读模式、阅读内容、读者资料以及读者的群关系等基本信息进行合理分析,以准确的掌握用户的服务模式以及读者的阅读需求方向等,进而为图书馆的服务模式转型提供大数据的决策支持。此外,图书馆可通过挖掘所收集的数据信息,全面掌握读者群的具体阅读兴趣和所需求的一些服务模式和内容,进而为提高图书馆对读者的推送式的服务质量[4]。

4 结束语

综上所述,正确面对和解决大数据时代给图书馆带来的影响,可以使图书馆与时俱进的发展。随着大数据时代的到来和快速发展,大数据给图书馆带来了各种问题,在短时间内严重影响了图书馆的正常运营。图书馆是进行整个社会的信息服务中心,其稳定发展肩负着对社会的责任。因此,图书馆应积极利用先进的科学技术进行改革,同时,做好风险的管理工作,进而将挑战转变为发展的机遇,最终促进图书馆的可持续发展。

参考文献

[1]许玲.大数据时代图书馆面临的挑战与对策思考[J].中共福建省委党校学报,2014,01(05):118.

[2]刘琼.大数据环境下图书馆面临的影响与挑战[J].理论观 察,2013,01(08):113.

[3]马晓亭.大数据时代图书馆数据可用性:价值、挑战和保障[J].图书馆理论与实践,2014,01(10):6.

[4]马晓亭.大数据时代图书馆数据长期可用性保障研究[J].现代情报,2013,33(12):64.

作者简介

李娇(1981-),女,江苏南通,博士,馆员,研究方向为图书馆管理及相关技术,材料科学与工程。

猜你喜欢
大数据时代图书馆发展
迈上十四五发展“新跑道”,打好可持续发展的“未来牌”
图书馆
砥砺奋进 共享发展
改性沥青的应用与发展
大数据时代下图书馆的服务创新与发展
大数据时代高校学生知识管理
从“数据新闻”看当前互联网新闻信息传播生态
“会”与“展”引导再制造发展
去图书馆