图书馆员科学数据素养能力框架与发展策略研究

2018-10-26 08:00杨利超河南省图书馆
图书馆理论与实践 2018年9期
关键词:数据管理馆员图书馆

杨利超(河南省图书馆)

1 概念解读

科学数据是指人们在社会科技活动中按照不同需求,或系统地分析、加工生成的多个学科领域(如调查、实验、观测、计算、仿真、研究等)的数据产品和相关信息,[1]或依托其他方式获取的反映客观世界本质、特征、变化规律等的原始基本数据。科学数据的生产者为科技工作者,科学数据是科技工作者长期从事科研活动的结晶,类型包括音频、视频、纸质文献、数字资源、数值、图像等形式,不同学科研究生产的科学数据均以自身形态方式存储、应用,各有差异,但都具有动态性、前瞻性、可重复性、权威性、广泛性等特性。[2]大数据与开放获取环境下,科研情景发生改变,科学数据呈指数式增长,不同学科的科学数据相互渗透、互为交错,为科学数据共享提供可能。毋容置疑,图书馆是知识的海洋,也是科学数据的集散地,图书馆员(以下简称“馆员”)是图书馆最活跃的因素,馆员对科学数据实行全程、动态、实时的监控,发现新知识,解决用户的实际问题,因此馆员的素养高低直接决定了图书馆的科学数据管理水平。由于国内对科学数据管理的研究起步较晚,理论与实践脱节,真正开展科学数据管理项目较少,仅有如高校科学数据共享平台、复旦大学社会科学数据管理平台、北京大学开放研究数据平台、智能制造科学数据服务平台、中国科学院数据云等,其他高校、科研机构、图书情报机构等单位很少涉及这项业务。所以,馆员的数据意识和能力均无法为科研人员提供科学数据支持,馆员的数据素养能力已成为必须提高的能力。[3]

1.1 科学数据素养

科学数据素养,又称科研数据素养、数据素养、数据信息素养等。现阶段,学术界还未对其形成统一的概念描述。不同的学者由于出发点不同,对科学数据的认知与了解不尽相同,对其内涵和外延也有不同的理解(见表1)。

表 科学数据素养概念及内涵比较

从上表可知,大多数学者认为数据素养具有更加深刻的内涵,如Rubin、孟祥保、沈婷婷、黄如花均提到数据意识;Carlson、孟祥保强调数据生命周期的重要性;美国数据质量运动认为,教师依照各自专业角色和责任,遵循伦理道德准则,获取、收集、整合、分析、解释、应用和交流由不同区域、学校、课堂、家长、学生等产生的多种多样性数据,利于学生健康成长。根据已有研究对科学数据素养概念的讨论,学者或机构均认同馆员科学数据素养涉及数据获取、整合、分析、使用、评估等能力。笔者也认为,科学数据素养包括数据意识、技能、实践和探索创新等内容。

1.2 图书馆员科学数据素养能力

开放获取和大数据背景下,科学数据管理人才是图书馆开展科学数据服务的关键,其从事科研咨询、数据净化、数据挖掘、数据检测、数据评估等工作,馆员也是这种人才的重要组成部分。[13]馆员科学数据素养能力是指馆员利用自身智力优势,借助互联网技术,捕获、收集、融合、分析、诠释不同类型的数据,如结构化数据、非结构化数据和半结构化数据等,并将其转化为服务用户知识需求的一种能力。从某种意义上说,馆员科学数据素养能力是图书馆员展现给用户的综合服务实力。根据不同的分工,馆员可划分为数据管理咨询馆员、科学数据馆员、数据验证馆员、数据分析馆员、数据存储馆员、数据管理馆员、数据服务协调馆员等。数据管理咨询馆员为数据用户提供各类咨询服务,包括DMP(数据管理平台)的制订、资助机构的数据政策咨询以及数据/元数据标准咨询服务等;科研数据馆员直接参与项目科研活动,对科研需求进行评估、负责科研数据的访问与采集;数据验证馆员验证科学数据的完整性,对研究数据进行即时复查,确保数据输入质量;数据分析馆员借助统计分析工具对科研数据进行统计分析,挖掘潜在价值,提供科学数据可视化分析服务,满足数据用户的科研需求;数据存储馆员搭建底层存储模型,完成重要科研数据资源的保存工作;数据管理馆员提供RDS(Relational Database Service,云数据库)系统技术支持,完善数据管理方案,参与数据政策的制定,提供数据检索与引用协助服务;数据服务协调馆员负责协调数据用户与科研人员、数据出版商等机构的关系,定期为RDS人员提供技能培训服务,与各相关利益机构保持联络,定期与馆员、RDS专家展开会晤。

依据馆员开展科学数据所涉及到的主、客观因素和服务实施过程中的诸因素,可以把馆员科学数据素质能力划分为基本能力、应用能力和意识态度能力三大部分(见下图)。基本能力包括两部分,一部分是馆员需要具备的主观能力,如数据基础知识、使用数据工具的技能等,另一部分是客观要素能力,如馆员的数据获取能力、数据分析能力、数据评估能力等。应用能力是馆员创新能力的一种表型形式,分为数据探索与交流能力、数据驱动与决策能力两部分,承担着数据再生产与再利用的任务。意识态度能力是馆员思想认识、道德、心理意愿等一系列反应的统称,包括数据意识和数据伦理两部分。

图 图书馆员科学数据素养能力组成

图示中的馆员科学数据素养能力蕴含了数据意识、技能、实践和探索创新四个层次。[14]按照馆员专业能力发展水平由低到高排列,从基本能力到应用能力,而意识态度贯穿于整个发展过程,三者共同作用于馆员科学数据素养能力。

2 图书馆员科学数据素养能力构成要素分析

2.1 数据基本能力

2.1.1 主观要素能力

主观要素能力属于馆员主观能动性的范畴,是指科学数据管理与服务的基本知识和技能。这些能力要求中,既包含以往工作经验,又需自身学习积累或根据工作需要持续完善而成。[15]

① 数据基础知识能力。科学数据素养培养的基础目标要求馆员至少会使用一种以上的技术方法及软件,能够甄别数据,熟悉数据的属性与质量,灵活使用多样的数据,熟练操作基本的可视化图表;具备基本的统计学知识、明白数据蕴含的意义;具备一定的计算机技术和交流沟通技能。② 使用数据工具能力。馆员不仅要灵活、熟练掌握常用的数据管理工具,如读者决策采购(Patron Driven Acquisition,PDA)、专家应答系统、学习软件和学习分析工具等,也应在获取数据、转换数据等活动中掌握技能。

2.1.2 客观要素能力

客观要素能力是馆员个人拥有的认识与处理事物的能力。在馆员科学数据素养中,客观要素能力包括馆员持有的知识量、技术水平、服务能力、管理能力等内容。

① 数据获取能力。数据获取能力是馆员收集、处理数据的基础能力,馆员需能够从可访问的数据源中获取和收集与科研相关的数据并进行处理。② 数据分析能力。数据分析能力是科学数据的核心内容,要求馆员选择高效的数据分析处理方法,达到研究结果。大数据时代有许多数据分析技术,如学习分析技术、SAS(Statistical Analysis System,统计分析软件)等。馆员数据分析能力更多关注的是分析技术的操作熟练程度和对数据分析相关概念的理解与应用。③ 数据评估能力。数据评估的目的在于查验数据正确性,剔除错误、无效数据。馆员应根据不同的用户开展个性化评估及服务能力结果评估。评价方式包括服务过程形成性评价,常规形成性评价,基于基准的常规评价,基于人、实践和感知数据的评价和总结性评价。例如全国图书馆参考咨询联盟中的参考咨询服务评价数据来源于其文献咨询与知识咨询服务动态产生的文献题目、类型、读者、咨询单位、馆员、回复时间等元数据,馆员通过对照可以发现数据的局限性,提出合理整改方案。

2.2 数据应用能力

2.2.1 数据探索与交流能力

数据探索与交流能力是数据利用能力的一种拓展,馆员需要熟悉与掌握多学科领域的数据标准,根据数据设计服务策略,通过设定假设、数据交流、定量分析等方法解决用户的问题。馆员在大量科学数据的基础上,充分结合图书馆服务实际,识别与发现问题,突破简单数据的收集与整理,通过用户浏览痕迹、用户需求特征等方面的数据,发现用户需求信息,为用户提供快捷服务。实际上,数据交流即用数据说话,如馆员与用户交换对数据的感知和想法,馆员之间交流技能与经验,馆员使用数据形成服务与反思报告等。

2.2.2 数据驱动与决策

馆员通过使用大量数据,能够监控与预测服务的整个过程。数据驱动与决策能力是指馆员将数据分析的结果运用于图书馆管理与服务改进过程的能力。具体包括运用数据调整服务策略、根据数据信息制定服务计划、应用数据诊断和监控图书馆服务全过程、应用数据开展图书馆管理与服务决策的能力等,这就要求馆员关注数据的可靠性与准确性判断、数据的相关性分析、数据的差异性分析、选择合适的分析工具和数据可视化模型等内容,正确看待应用数据过程中图书馆管理与服务呈现的特征,搭建数据与图书馆管理和服务间的关联,将数据融入图书馆管理与服务的循环与改进过程,进而提升图书馆服务绩效。[16]例如馆员通过用户行为数据分析发现重点用户需求,及时调整服务策略,开展课题跟踪、定题服务等个性化服务。

2.3 态度意识

意识决定态度,态度是个体对特定对象(人、观念、情感或者事件等)所持有的稳定的心理倾向。馆员科学数据素养中的态度和意识贯穿于从基本能力到应用能力的整个过程,是馆员必须具备的基本数据素养。

2.3.1 数据意识

数据意识是科学数据素养的先决条件,[17]是数据认知层面的反映。应用数据意识对数据进行判断,分析数据的价值和意义,能够预防错误数据的危害。不同馆员由于知识结构、心理素质等有所差异,所以对数据存在不同的认知,主要表现为数据的敏感度、数据应用意识、掌控数据的能力、数据信任度等方面的差异。馆员要有使用数据解决问题的强烈意识,有敏锐的数据感知能力和对待数据的严谨态度,注意使用合乎规定的数据,做到将数据的需求显性化、精准化、具体化。[18]

2.3.2 数据伦理

大数据时代产生了海量的数据,其来源具有多样性和开放性,馆员在使用数据的过程中难免存在着一定的数据泄露风险,所以,重视数据伦理具有现实意义。数据伦理涉及法律问题、道德问题、伦理问题,是科学数据素养构成要素的重要组成部分。馆员在使用数据时,要有自己的道德判断和基本的法制观念,坚守数据伦理原则,即数据挖掘要求目的先行、“文责自负”,发布数据要求“传责自负”、方法得当与慎重等。从职业道德和责任感角度出发,数据道德强调数据使用的合法性和道德伦理,要求确保用户合法、安全地使用数据。数据安全、隐私权、数据著录等问题也是数据伦理的范畴,馆员需要具有保障用户隐私权、保护数据安全、规范数据著录的格式等思想意识,最大限度地降低馆员使用数据的侵权风险。

3 图书馆员科学数据素养能力的发展策略

3.1 注重主客观结合,完善科学数据素养教育培训体系

科学数据服务是图书馆一种深层次的信息服务,正在引发图书馆服务变革。图书馆开展科学数据服务,首先要重视馆员科学数据素养的培育,充分考虑影响馆员科学数据素养能力的主、客观因素。一方面,根据科学数据服务需要和未来发展,加强对馆员数据基本能力和使用数据工具能力的培训,提升馆员科学数据素养的主观要素能力;另一方面,图书馆自身要有大数据意识,提升数据获取能力、数据分析能力和数据评估能力,提高馆员科学数据素养的客观要素能力。其次,图书馆要对馆员进行科学数据管理意识、知识和技能方面的教育与培训,要注意囊括不同用户科学数据素养教育。

馆员科学数据素养教育培训是一项系统工程,主要针对馆员进行设计的教育培训体系。① 成立专门的科学数据管理组织机构。教育培训需要依托专门的数据管理机构,统一协调图书馆的数据服务工作,并根据馆员的具体职责和服务侧重点设置相关岗位,对馆员进行培养与再教育。② 充实培训内容。科学数据生命周期源于科学研究的生命周期,图书馆应以科学数据生命周期为基础设计培训内容:制定数据管理计划→数据收集与选择→数据描述与组织→数据分析与引用→数据保存与发布→数据发现与获取,[19]针对不同的周期开展有针对性的培训;也可通过具体案例讲解数据伦理、数据安全、引用规范知识、隐私权、知识产权等内容。强化馆员的素质和能力,要根据用户需求设计相关数据课程,实施跨学科教学,包括高等数学、统计学、管理学、计算机技术、教育学和心理学等课程,具体讲授内容为数据意识、信息管理、数据管理、信息组织与获取、元数据使用、数据审查与评估、数理统计、数据挖掘、数据处理工具使用、数据库系统、数据协议、计算机网络、数据结构、数据可视化等。③ 培训效果评估。对馆员科学数据素养培训效果评估采取定性与定量相结合的方法,既可自评,也可引入第三方评估机构。图书馆可进一步完善馆员科学数据素养的评价,包括区分评估对象、权值、明确评估方法等,实事求是、综合权衡,充分挖掘科学数据的潜在价值。[20]

3.2 拓展思路,培养具有良好科学数据素养的馆员队伍

图书馆科学数据服务与科学数据专业人才息息相关。一个合格的馆员应具备图书馆学、情报学等基本知识,也应具有跨学科领域学习与研究的能力,特别是与数据相关的知识和技能,如全面熟悉数据抽取、转换、加载(ETL)流程和数据管道建设专业知识。馆员需要掌握的一些必备工具如精通R或Python编程,SQL技能,MapReduce、Hive等基于Hadoop的技术,ETL和数据仓库专业知识等。这些知识与技能可以通过公开课线上培训、现场线下培训、e-Learning、培训协议、海外培训等形式来获取。国内信息专业教育有必要开展面向数据科学的信息管理与信息系统专业课程体系,进行数据科学基础理论、实验方法和领域数据研究的全面培养。[21]图书馆在坚持馆员科学数据素养教育培训的基础上,应科学制定前瞻性的馆员科学数据素养的队伍建设管理规划,面向海内外诚聘科学数据管理人才,为图书馆科学数据管理与服务提供人才支撑。

3.3 搭建科学数据管理平台,辅助图书馆员应用数据

图书馆拥有的大量数据是馆员开展科学数据服务的基础,这些数据包括科技论文、统计数据、产业报告等科技文献,物理性能测试、医学诊断、计量等仪器设备,科技成果、研发基地、科研项目,具有地方特色的数据库等。现实中,馆员缺乏对科学数据的认知与理解,应用数据较为模糊,难以满足用户对数据的需求,因此馆员必须具有科学数据服务的意识,挖掘数据价值,掌握应用数据能力,根据不同的数据应用情景开展不同维度的数据统计、评价、技术应用、用户分析、服务分析等。搭建科学数据管理平台,有利于提升书馆员应用数据的能力。平台具有数据内容揭示和数据功能操作双重特性,是数据有效应用的推广平台。图书馆应根据自身发展现状,酌情组建科学数据管理平台,既可承接科学数据收集、组织、咨询服务,又可锻炼馆员应用数据的能力。例如复旦大学社会科学数据管理平台设置新闻动态、数据分类、数据资源、教育与培训等栏目,提供基本检索和高级检索两种方式,开展数据存储、检索、下载、分析等服务。

3.4 加强科学数据素养宣传,营造跨组织等协作型数据文化氛围

科学数据是一个新兴事物,随着互联网技术的发展而快速发展,馆员面对海量的数据不知所措,普遍存在对科学数据认识不足的问题,极大地制约了图书馆科学数据服务发展的发展。因此,图书馆需要加强宣传与推广,普及科学数据基本知识。第一,图书馆向馆员推广科学数据的概念、管理、组织、整合、分析、生产与再利用、数据安全意识、个人信息保护等知识,将这种宣传融入到日常业务学习中,通过网站平台资讯动态、微信、微博、短信、电子邮件等形式推送有关科学数据素养培育的内容,提高馆员科学数据素养能力,为后续的科学数据服务打下良好基础。第二,图书馆需要构建馆员数据素养能力发展的外部生态,[22]营造数据文化氛围,开展数据对话,承认数据的重要性,支持并努力创建一个数据学习、研究和决策支持的数据环境,从持续均衡发展的角度出发,点面结合地开展宣传与推广工作。高校图书馆可以采取跨系联合、跨所(馆)联合、跨国联合的形式,合作制订科学数据获取和共享政策,合理设计馆员科学数据素养教学方案,完善科学数据素养教育内容。第三,馆员与培训者之间、馆员之间、馆员与用户之间要开展广泛的交流与沟通。互动是基于信任的交流,馆员、培训者、用户彼此信任,把各自的隐性知识贡献出来与大家分享,如数据质量标准、元数据、技术支持、数据伦理等知识,开展广泛而深入的沟通与交流,形成共识,以促进馆员、培训者和用户对科学数据素养形成更高层次的认知。例如科学数据素养涉及的行为伦理问题、数据安全问题等,大家一致认为,从国家层面制订政策或发布国家声明,与科学界制订的政策配合,具有更高的效力。[23]

猜你喜欢
数据管理馆员图书馆
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
青海省人民政府关于转聘谢承华、斗尕馆员为荣誉馆员的决定
图书馆
青海省人民政府关于转聘谢佐等3位馆员为荣誉馆员的决定 青政〔2017〕32号
去图书馆
论图书馆馆员领导及其角色