基于开放获取的图书馆科学数据资源与服务

2015-11-27 02:51李艳坤
河南图书馆学刊 2015年11期
关键词:开放获取图书馆服务

关键词:图书馆服务;科学数据;开放获取

摘 要:文章从科学数据与科学数据资源的开放获取,图书馆开放获取科学数据资源建设,图书馆开放获取科学数据的挖掘、分析与类比服务,图书馆开放获取科学数据的存储、翻译与可视化服务等方面,对基于开放获取的图书馆科学数据资源与服务进行了探讨。

中图分类号:G255.76 文献标识码:A 文章编号:1003-1588(2015)11-0088-03

1.1 科学数据及其解读

数据是人们通过计算、实验、试验、观察和测量等活动所得出的数值结果。根据所承载的载体和采用格式的不同,数据可以分为数字数据、文字数据、图片数据、声音数据、影像数据、三维虚拟数据、多媒体数据和可视化数据等类型,其中最简单的就是数字数据。数据可以用于科学研究、工程设计、调查取证、教育教学等各种用途。科学数据是指人类在从事科学领域的各种研究活动中所形成的数据,这些研究活动既包括基础科学研究,也包括应用科学研究,既包括教育教学研究,也包括生产和管理研究,还包括人类健康和生活研究。按照科学数据最基本的分类方法,可以分为科学基本数据、科学实验数据、科学试验数据、科学观测数据、科学探测数据、科学调查数据、科学统计数据、科学资料数据等各类数值型的原始基本数据以及按照不同领域的科研需求经过系统加工而生成的科学数据产品,如可视化数据和相关的科学数据集合。不仅如此,科学数据与其他信息资源还有一个不同点,就是科学数据可以具有实时性,即实时数据,便于用户随时随地地掌握和利用最新时间的科学数据信息资源。科学数据资源不仅是科学研究中不可或缺的重要组成部分,而且也是重要的科学研究成果产出[1]。

1.2 科学数据资源的开放获取

随着人类科学研究事业的加速发展和互联网海量信息的传播,每天都会产生体量巨大的科学数据资源,每天也都有难以计数的科学数据资源通过互联网传到世界各地的实验室和用户手中。然而,由于种种主客观因素的制约,尤其是大数据技术处理方面因素的影响,其中约有80%的科学数据没有得到很好的保护,在产生后的20年中就失去了踪迹。这种状况给科研工作带来了难以估量的巨大损失,由于科学数据的丢失,使得许多科研工作难以顺利地继续进行,为了找回所需要的科学数据,或者借助于相关的科学数据研究机构的先进技术进行科学数据的强行恢复,或者不得不返回来重复进行研究。因此,对于科学数据资源的建设、存储、管理、研究和服务,除了科研单位本身外,也成为图书馆,尤其是科研和高校图书馆在为科学研究和教学研究服务中开展创新型服务的重要工作内容之一。近十多年来,随着具有“学术共产主义”性质的国内外开放获取运动的迅猛发展,具有开放获取性质的科学数据呈现出爆炸性的几何级数增长,已经迅速成为引起学术界和科技界高度重视的一种创新模式的资源类型,成为大数据时代最强有力的支持资源。目前,世界各国政府和相关组织都已经从政策方面给予开放获取科学数据以最大程度的支持。各国政府通过成立国际开放获取数据联盟的形式[2],迅速扩大了开放获取科学数据的整体存量,目的是实现科学数据在更大范围内的开放共享利用。

2 图书馆开放获取科学数据资源建设

2.1 大数据时代图书馆的使命

当今,世界上的许多国家已经将大数据提升到国家的战略层面,认为未来国家层面的竞争力将在很大程度上体现在一个国家拥有数据的规模和运用数据的能力上。“数据是新的石油”,大数据时代的来临,正在深刻变革着人们的科研、生产、生活方式。对于各类科学数据的检索、开放、获取、共享、挖掘、存储、传送、分析与应用,不仅能推动社会各领域科学研究的发展,催生新的学科,而且能带动经济发展,造福社会。图书馆作为现代信息社会文献信息资源的集聚地和服务者,需要以全新的理念认识、理解、接受、投入到大数据时代,开展对科学数据,尤其是以免费全文获取为基本特征的开放获取科学数据的资源建设和服务中来,在大数据时代更好地体现自己在信息社会中的存在价值和意义。大数据资源的价值在于创新性应用,而前提则是对科学数据的有效收集、科学分析,从而使得科学数据的价值最大化,这就是在全球信息化发展的今天,大数据时代对于图书馆的必然要求。面对我国“互联网+”万众创新的时代号召,图书馆应当积极探索利用科学大数据服务大众创业的新途径和新方法[3]。

2.2 图书馆开放获取科学数据资源建设

图书馆为用户开展基于开放获取科学数据服务的一个重要前提条件,就是要建设相关的开放获取科学数据资源。由于这些开放获取科学数据资源全部都存在于互联网上,因此,互联网与开放获取科学数据资源是紧密相关的。随着全球互联网的快速发展,互联网用户的数量在快速增加,庞大的互联网用户群体成为创造互联网上各种科学数据资源的不竭源泉。因此,互联网上的科学数据资源类型在不断增加,科学数据的数量更是呈现出爆炸性的增长,即互联网上存在着实时动态增长的海量科学数据资源。互联网实际上已经成为全世界科学数据资源的巨大数据库,而这座巨大数据库就成为图书馆建设科学数据的最有力支持,因为图书馆可以根据用户对于科学数据的服务需求,从互联网科学数据库中检索和获取用户所需要的科学数据,为用户提供相关的服务。之所以要由图书馆来为用户提供科学数据服务,而不是用户自己寻找和检索科学数据,是因为用户在科学数据的检索和获取方面往往存在着较大的困难,而在这方面,却正是图书馆的优势所在,这也正是图书馆开展科学数据服务的主要原因。

3 图书馆开放获取科学数据的挖掘、分析与类比服务

3.1 科学数据的挖掘服务

李艳坤:基于开放获取的图书馆科学数据资源与服务

科学数据的挖掘服务指的是从海量的科学数据集合体中,将用户所需要的科学数据通过算法搜索,将隐藏在其中的有用科学数据信息挖掘、筛选和过滤出来,揭开包裹在这些科学数据之上无用的覆盖数据,过滤掉混杂在这些科学数据之中的干扰数据,清除去这些科学数据周围的附着数据,最后使得真正需要的科学数据可以清晰地出现在用户的面前[4]。由于科学数据的挖掘服务工作需要具备一定的专业技术知识和水平,因此,图书馆从事科学数据挖掘服务的工作人员一般都需要经过较为严格和专业的培训方可胜任。在具体的服务方法上,往往需要综合运用计算机、互联网、大数据和云计算技术,利用科学数据检索、科学数据统计、科学数据分析、数据机器学习、数据专家系统和数据模式识别等技术方法,来最终实现图书馆科学数据挖掘的服务目标。图书馆科学数据挖掘服务的结果,可以为用户在相当广泛的领域中发挥作用,如科学探索、工程设计、生产控制、商务管理、市场分析、网络营销等。

3.2 科学数据的分析服务

对于绝大多数用户而言,挖掘出所需要的科学数据仅仅是所需完成任务的前奏,因为获得这些科学数据并非是用户的目的,仅仅是为了达到目的的先决条件。下一步需要进行的工作,就是要对已经挖掘出的科学数据进行统计和分析,以便从中发现和找出蕴含在大量科学数据之中的某些规律,从而得出所需要的最终结论[5]。对于科学数据的统计和分析步骤,是介于科学数据挖掘和发现其中规律的中间环节,也是最为关键的环节。因为如果没有科学合理的统计分析结果,就不会发现隐含在大量科学数据之中的规律,也就难以得出最终的结论。科学数据分析的工作,一般是由用户自己承担的,但由于人员能力有限、技术力量不足、任务紧迫等各种因素的影响,用户往往也会请求图书馆予以协助。在图书馆工作人员技术力量相对较高的情况下,也会被用户委以重托,帮助用户进行科学数据的分析,这也是各类科研系统图书馆的正常工作内容之一,高校图书馆也常常被请求协助用户对科学数据进行分析服务。

3.3 科学数据的类比服务

即根据已知事物与其他事物之间所具有的相同性、相似性和相近性等关系,通过对两类或两类以上的事物进行分析比较,找出它们之间所存在的各种联系,即共同点、相似点或相近点,从而找出其中所蕴含的规律性,用于指导和改进工作。图书馆开展科学数据的类比服务,是根据用户的需求,采用在科学研究方法中经常使用到的一种基本逻辑方法——类比法,将所获取的科学数据进行类比分析,力争通过寻找其中所存在的各种联系,找到和发现各种科学数据之间所具有的某种紧密联系、相关关系或相近性质,进而通过此类科学数据类推到彼类科学数据,帮助用户通过参照对比来加深理解,可以更加明显清晰地认知事物,尽快掌握蕴含在这些不同类别科学数据中的规律性。这种科学数据的类比服务,不仅适用于行业内科学数据的类比分析,而且也适用于国内与国外同类别科学数据的类比分析[6]。当然,这对于图书馆用户服务而言,科学数据的类比服务工作,同样是一种层次较高的情报类服务工作,同样需要较高专业技术素质的工作人员承担。

4 图书馆开放获取科学数据的存储、翻译与可视化服务

4.1 科学数据的存储服务

科学数据或者是真实反映一定历史时期的历史数据,或者是某些科学研究项目中所使用过的调查数据、测量数据、实验数据、试验数据、研究数据,或者是企业和机关单位在生产和工作中所形成的生产数据、管理数据,或者是国家和军事机关需要长期保密的秘密数据、机密数据、绝密数据等。因此,这些科学数据在一般情况下需要进行存储管理,目的是保存科学数据的历史价值、参考价值和档案价值,以便于在以后的各项工作中加以利用。除了国家和军事机关以及一些需要保密处理的科学数据外,大多数类型的科学数据和绝大多数的科学数据都是可以开放供用户使用的。因此,图书馆对于这些科学数据资源,在自己有权进行检索搜集、下载获取、分析管理的职权范围内,可以进行必要的存储管理。尤其是利用目前互联网时代的云存储技术,为图书馆科学数据服务工作的开展,为用户对于科学数据存储的需求,采用国际通行的开放存取模式,即在遵守科学知识开放共享协议的基础上,开展科学数据的互联网开放存储服务[7]。

4.2 科学数据的翻译服务

随着全球经济一体化进程的不断加快,科学数据也在世界范围内得以快速而大量地产生、流通、增殖、分化。对于那些来自于国外的科学数据,国内用户往往会由于外语水平的限制,难以很好地加以利用。即使懂得一些英语的用户,对于英语以外科学数据涉及的法语、俄语、阿拉伯语、西班牙语等众多的国外语言文字也同样会感到束手无策。因此,在这种情况下,就需要图书馆为用户提供对于来自国外科学数据的相关翻译服务,以便用户可以利用本国的母语语言文字,更加方便地利用来自国外的大量科学数据,并以此作为相关研究的参考数据和调研的依据数据。目前,图书馆借助互联网上的4大在线翻译系统,最多可以实现97种语言文字科学数据内容的在线翻译。在这4大在线翻译系统中,包括谷歌翻译系统的91种语言文字,其中44种语言可以实现语音翻译;必应翻译系统的44种语言文字,其中18种语言可以实现语音翻译;百度翻译系统的27种语言文字,其中11种语言可以实现语音翻译;有道翻译系统的7种语言文字,其中4种语言可以实现语音翻译。

4.3 科学数据的可视化服务

科学数据的可视化是利用视觉的方式,将原本表现为数量巨大、内容繁杂、形式枯燥的和具有潜在逻辑关系的科学数据展现出来,使用户发现其中的关联规律,继而进行深度挖掘和统计分析,最终得出所需要的规律性结论。所以,科学数据可视化是大数据领域所有价值的终极呈现[8]。科学数据可视化技术使科学数据的价值更为直观、浅显和易懂,适用于各种类型需要科学数据服务的机构和个人。图书馆使用相关的科学数据可视化软件如“大数据魔镜”“QlikView”等,都可以实现科学数据服务中的可视化服务。在大数据时代,科学数据的可视化是大数据产业链中非常重要的一个环节,如果企业员工都学会对科学数据的分析,就可以将企业数据的价值最大化,将数据资源变为企业实实在在可以看到的“真金白银”。

可视化科学数据可以帮助用户更加深刻地理解科学数据中所包含的意义,挖掘出蕴含在科学数据背后的价值。图书馆在开展科学数据的可视化服务中,可以协助用户使用相关的科学数据可视化软件,直接通过简单的拖拽就能一步生成数据分析模型,例如精准营销、客户分析、用户画像等,从而可以有力地支持管理者用户进行相关的决策,提高企业的核心竞争力。

参考文献:

[1] 杨京,王效岳,白如江.大数据背景下科学数据互操作实践进展研究[J].图书与情报,2015(3):97-102.

[2] 王艳翠,李书宁,李爱红.研究数据联盟:建立全球数据共享和数据交换的基础架构[J].图书馆理论与实践,2015(1):52-54,73.

[3] 肖燕.高校图书馆科学数据服务的新探索[J].办公室业务,2015(7):93.

[4] 张钰莎,梁欣祺.数据挖掘在高校图书馆服务中的应用研究[J].廊坊师范学院学报:自然科学版,2015(3):32-35.

[5] 程时星.基于云平台的大数据分析与高校图书馆服务研究[J].科技情报开发与经济,2015(14):38-39.

[6] 张涵,王忠.国外政府开放数据的比较研究[J].情报杂志,2015(8):142-146,151.

[7] 王剑,黄朝光.海量农业科学数据存储体系架构与方法研究[J].广东农业科学,2015(2):152-156.

[8] 王囝囝,杨树,毕焘.大数据时代数据信息可视化的研究[J].通讯世界,2015(14):185-186.

(编校:崔 萌)

猜你喜欢
开放获取图书馆服务
基于数据挖掘的高校图书馆个性化服务研究
浅谈MOOC与信息素养教育
“大学图书馆发展趋势与服务创新论坛”综述
“国际视野中的大学图书馆发展研究高端论坛”综述
浅谈工匠精神在高校图书馆服务中的传承
浅谈阅读推广活动的探索与实践
国外开放获取平台对我国科技期刊OA发展的启示
挑战传统的“真人”图书馆发展现状调研
开放获取对国际眼科学期刊文献计量学指标的影响
公共图书馆在非物质文化遗产保护中的作用