数据素养能力模型研究*

2019-04-16 03:10何靖怡
图书馆论坛 2019年4期
关键词:数据管理导向建构

张 靖,何靖怡,肖 鹏

随着e-Science 和开放数据计划(Open Data Initiatives)的发展,以“数据”为中心的教育日益迫切,数据素养教育(Data Literacy Education)应运而生,其目的在于培养两类人才:一是具备科研数据管理专业技能的数据专家,二是具备基本数据知识的科学工作者。从目前的实践和研究来看,关于数据素养教育的思路和内容众说纷纭,既有关注科研训练的,也有以数据管理为主轴的,还有人认为要考虑到公共事务和决策所需的数据分析诉求。然而,不管是何种思路何种内容的数据素养教育,其中心都应有一个数据素养能力模型。这些模型一般由一系列的指标体系组成(因此又称“数据素养能力指标体系”),体现了相关教育项目的设计和实施者对数据素养教育系列问题的观点:如何理解数据、数据素养与数据素养教育?受众是谁?目标是什么?如何建构相应的教育体系?教学计划设计和效果评估的焦点是什么?应当如何展开?基于此,本文对国内外数据素养能力模型进行梳理、比较和分析,结合教育实践项目,探讨数据素养教育系列问题。

1 研究设计

通过数据库(EBSCOHost;CNKI)、专业组织(ACRL;IASSIST①;ICPSR②)及研究社区(Data Information Literacy Symposium;e-Science Community Blog)等收集资料,以数据素养教育实践项目为中心、辅以相关文献,笔者梳理出14 个数据素养能力模型。参考相关文献[1],建构数据素养能力模型分析框架,见表1。

表1 数据素养能力模型分析框架及说明

2 模型梳理

综合分析各模型的特点,以是否严格界定能力为标准,这些模型可划分为两类:(1)能力导向模型,是严格意义上的数据素养能力模型,该类模型以“数据”为核心明确了数据素养能力指标,甚至建立了多级能力指标体系;(2)目标导向模型,是广义上的数据素养能力模型,主要由笔者从具体教育实践的教学目标和教学模块中提炼总结而出。与能力导向模型相比,目标导向模型的特征是它通常结合实际教学需要而设定,不一定从整个数据生命周期进行考虑。这两种模式代表了开展数据素养教育的两种思路,即将数据素养视作相对独立且整体实施的专门的教育项目,或是将数据素养视作其他能力的组成而在相关的教育项目中设置数据素养教育模块。笔者按照表1的数据素养能力模型分析框架,对14 个数据素养能力模型进行分类梳理③。本部分主要呈现各模型的提出背景、指标层级及基本内容。关于适用情境、建构方式、对应的数据生命周期等的讨论放在第三部分。

2.1 能力导向模型

围绕数据生命周期进行设计是能力导向模型的基本特征。一般而言,该类模型中的数据素养能力指标较易被识别,常常直接以多级指标的形式呈现。笔者梳理了8 个这类模型。其中,5 个模型已有与之对应的数据素养教育实践项目:美国地球数据观测网络(Data ONE)模型、英国爱丁堡大学MANTRA 模型、美国雪城大学Qin&D’Ignazio 模型、美国普渡大学Carlson 模型、美国新英格兰协作数据管理课程(NECDMC)模型;另外3 个模型为纯理论性质的数据素养能力模型:西班牙学者Prado &Marzal 模型、瑞典学者Schneider 模型以及澳大利亚统计局(ABS)模型。

(1)Data ONE 模型(2009)[2]。地球数据观测网络(Data Observation Network for Earth,Data ONE)是一个环境科学领域面向科研需求的网络平台,是众多个人和科研机构合作的成果。2009年该平台在美国国家科学基金会(National Science Foundation,NSF)的资助下建立,用户可以通过这一平台持续而安全地获取地球观测数据。为了帮助科研人员在研究过程中,尤其是在研究起始阶段,做好数据管理计划,并有效地建立、组织、管理、描述、保存和共享数据,并使得数据能够为其他科研人员重用,Data ONE 制作了《数据管理初级读本:你一直想知道的》 (Primer on Data Management:What You Always Wanted to Know),并在官网上提供以数据生命周期为线索的教学课程,以及数据管理的最佳实践、相关软件工具等学习材料。该模型从Data ONE 教学课程中梳理得出,由模块和学习效果两级指标组成。

(2)MANTRA 模型(2010)[3]。英国爱丁堡大学(University of Edinburgh)根据该校地球科学、社会与政治学和临床心理学研究生的培训需求,与英国学术发展研究所(Institute for Academic Development)合作,2010-2011年开发了面向英国研究生、初级职业研究员、信息专业人员的在线数据管理课程(Research Data Management Training,MANTRA)④,现由爱丁堡大学数据图书馆进行维护[4]。MANTRA 通过一系列在线课程,讲授科研数据管理的专业术语、核心概念和最佳实践。MANTRA 模型由知识模块和学习内容两级指标组成。

(3)Qin&D’Ignazio 模型(2010)[5]。美国雪城大学(Syracuse University)的Jian Qin 和John D’Ignazio 面向STEM(科学、技术、工程、数学)领域本科生开设“科学数据管理”课程,以培训他们在e-Science 环境下所需的数据素养。课程以“数据”为中心展开,列举了数据素养的5 个主要技能,即基于科学需求的数据收集、数据处理、数据管理、数据评估和数据使用能力。

(4)Carlson 模型(2011)[6]。一方面,技术导向型研究的复杂性及其规模挑战着学术交流、图书馆服务和图书馆员的许多传统角色,另一方面,NSF 要求所有申请项目必须提交数据管理计划,这些都给大学图书馆提出了新的命题,需要其在大学的科研过程中寻找并扮演新的角色。美国普渡大学(Purdue University)图书馆的Jacob Carlson 等认为,大学图书馆应该为大学科研人员提供数据素养培训,他们建构了这一数据素养模型,并将之运用于数据信息素养(Data Information Literacy,DIL)项目⑤。该模型由能力和学习要求两级指标组成。

(5)NECDMC 模型(2013)[7]。由美国新英格兰地区多个大学图书馆的数据管理教育模块汇聚而成的新英格兰协作数据管理课程(New England Collaborative Data Management Curriculum,NECDMC)是一个面向健康科学、自然科学与工程专业背景本科生和研究生的数据管理教育项目⑥。该课程基于伍斯特理工学院(Worcester Polytechnic Institute)图书馆(包括Lamar Soutter Library 和George C.Gordon Library)的数据管理课程框架,现有7 个教学模块,各模块下设具体的学习目标,形成二级指标体系。各教学模块由不同的机构负责:塔夫斯大学图书馆(Tisch Library at Tufts University)负责模块1、2、3,海洋生物实验室和伍兹霍尔海洋研究所(Marine Biological Laboratory and Woods Hole Oceano graphic Institute)负责模块3、6,马萨诸塞大学阿默斯特分校(University of Massachusetts at Amherst)负责模块4、6,马萨诸塞大学医学院(University of Massachusetts Medical School)负责模块5、6,伍斯特理工学院(Worcester Polytechnic Institute)负责模块5,康涅狄格大学(University of Connecticut)和康特韦医学图书馆(Countway Library of Medicine)负责模块7。

(6)Prado & Marzal 模型(2013)[8]。Javier Calzada Prado 和来自西班牙马德里卡洛斯三世大学图书与情报学系,他们认为数据在当今社会和科学领域日益重要,而开放数据计划和e-Science 更是给各种类型的图书馆提出了培养用户数据和信息素养的要求;现有的只针对特定背景、只涉及部分数据素养的模型不能很好地满足这一要求。于是在其他模型的基础之上,参照传统的信息素养框架,设计了这一全面适用于公共图书馆、学术图书馆和学校图书馆用户的数据素养模型。该模型分三层逐层细划数据素养能力,并为第三层能力指标对应了具体的学习内容。

(7)Schneider 模型(2013)[9]。瑞典学者René Schneider 认为科学研究中的不同角色对数据有着不同深度和广度的使用需求,因此她试图设计一个适用于各类科研工作者的数据素养教育课程。在她预想的课程中,不同的课程开展方式所对应的教学内容有所侧重和递进,针对不同身份的学习者也有不同的课程开展方式。参考信息素养的六大技能⑦和英国国家和大学图书馆协会(The Society of College,National and University Libraries,SCONUL)的七项指标⑧,以及美国国会图书馆的数字保存推广与教育项目(Digital Preservation Outreach & Education,DPOE),综合信息素养标准框架及数据管理框架,她提出了由两级指标界定的科研数据素养核心能力。

(8)ABS 模型(2015)[10]。澳大利亚统计局(Australian Bureau of Statistics,ABS)认为当下的劳动力需要具备更强的统计能力,应该有一个能够用于理解不同情境下劳动力所需的统计能力,并以一种共同话语对这些能力作具体描述的框架。ABS 设计了统计能力框架草案,定义了使用者和生产者面对统计工作时所需的全部能力。该模型由三级指标组成,其中第一级属于统计情境维度,第二级属于各统计情境相对应的统计过程维度,第三级则说明统计过程中所需的具体能力。

2.2 目标导向模型

目标导向模型大多与数据素养教育实践相结合,该类模型并未严格界定数据素养能力,但在教学模块及教学目标中反映了教育者对于数据素养能力的理解。英国数据档案(UKDA)模型、美国加州大学洛杉矶分校Stephenson&Caravello 模型、香港大学科技图书馆(HKUST)模型、加拿大卡尔加里大学生物学课程MacMillan 模型、英国剑桥大学图书馆Data Train 模型以及武汉大学Si模型等6 个模型属于这一类型。

(1)UKDA 模型(2004)[11]。该模型根据英国埃塞克斯大学(University of Essex)英国数据档案(UK Data Archive,UKDA)项目中的“教学活动中的调查数据”(Survey Data in Teaching Project,SDiT;该项目受JISC 资助)的学习目标总结得出。针对英国高校在讲授科学研究(如实证分析、数据统计、数据分析、数字计算能力、批判性思维)时很少利用数据,导致学生缺乏数据素养的问题,SDiT 强调真实数据在教学活动中的使用,以提高社会科学学生的数据素养。该模型可以归纳出5 个一级指标:①能够对社会科学数据应用于实际生活问题有更好的理解;②加强操作数值数据(课本、报纸、报告和数据库)的能力;③对定量数据的特征进行概念化,以使其能够支持实体的论证;④建立生产和交流数据的能力和自信;⑤成为批判性的数据消费者。

(2)Stephenson & Caravello 模型(2007)[12]。美国加州大学洛杉矶分校(University of California,Los Angeles,UCLA)图书馆员Elizabeth Stephenson 和Patti Schifter Caravello 指出,对修读社会学的学生而言,能够理解数据并用图表呈现数据十分重要,因此,有必要对他们进行数据素养能力教育。这一模型根据他们在UCLA 社会学系面向大三和大四学生开设的“社会学信息素养实验室”课程总结而出。主要包括4 个一级指标:①学会阅读和批判性评估简单的表格;②为数据表格制作精确的书目引文;③使用American Factfinder 制作表格,使表格被正确地描述和引用;④阅读包含以图示方式呈现数据的文章,并讨论该表格与文章内容的关系。

(3)HKUST 模型(2010)[13]。信息素养教育是大学图书馆的传统职能之一,然而随着信息技术和网络技术发展,信息环境日趋复杂,信息素养教育需求也发生变化,概念性理解和批判性思维日益重要。香港大学科技图书馆(Hong Kong University of Science and Technology Library,HKUST)在该校科学院、工程学院、商学院开设信息素养通识选修课程,绝大部分选修该课程的学生在科技方面的学术涉猎比在人文社科方面的涉猎要多。该课程以智力发展阶段(Stages of Intellectual Development)和认知技能(Cognitive Skills)为理论依据,旨在通过社会经济学数据的使用提高学生的信息素养。通过学习,学生应能够描述什么是社会经济学数据,能够区分社会经济学数据与科学数据,能够制作获取多种社会经济数据的可行策略以及基于可靠性和权威性的评估数据质量。根据该课程的学习目标、形式和内容,笔者总结这一模型由9 个一级指标组成:①理解社会经济学数据(授课形式为讲座);②见识社会经济学数据(活动);③社会经济学数据的特征(讲座);④数据的定义(活动);⑤收集数据与中介机构(讲座);⑥收集、可靠性与权威性(活动);⑦评估与使用(活动);⑧定位社会科学数据(讲座);⑨学习经验的反思(活动)。

(4)MacMillan 模型(2010)[14-15]。加拿大卡尔加里大学(University of Calgary)在面向生命科学管理本科生开设的两门生物学课程——“遗传学原理”和“生物化学概论”中引入这一数据素养模型,由实验室负责人、联络馆员Don MacMillan及1-2 名图书馆馆员合作,将数据素养教育融入专业课程教学,起到了很好的效果。“遗传学原理”的学习要求包括:①在一个特定的基因遗传疾病主题上使用Pub Med查找同行评审的文章;②定位一个与被认为是导致一种天生疾病的基因或突变有关的专利;③使用OMIM 数据库决定天生遗传疾病的遗传模式,以及致病的基因和突变;④使用NCBI 的基因数据库来获取基因结构上的数据,包括mRNA 和蛋白质长度。“生物化学概论”的学习要求包括:(a)使用蛋白质数据银行以定位该蛋白质的三位坐标;(b)使用ProtParam 以计算该蛋白质的等电点;(c)运行一个源序列搜索以识别同源的或相似的蛋白质,并使用ClustalW 来匹配它们;(d)使用PyMOL 来调查在蛋白质的结构和功能上突变的影响。

(4)Data Train 模型(2011)[16]。在科研成果在线出版和存档与日俱增的时代,英国剑桥大学(University of Cambridge)图书馆将考古数据的长期保存视为己任。为了培养该校考古学学生良好的数字数据管理计划,尽早着手毕业论文的数字数据管理,该馆申请到了JISC 资助项目“Data Train”。该项目由剑桥大学图书馆主导,来自剑桥大学考古系的教职员工和约克大学(University of York)考古数据服务中心(Archaeology Data Service)的专家为项目提供建议。Data Train 为考古学专业“核心研究技能培训”的任课教师提供了科研数据管理教学资料。该教学资料中主要包含四个教学模块:创建和管理考古学科研数据、处理数字数据、科研项目与专业数据、数据的存档与重用,模块下设有具体的学习内容。这,四个教学模块作为该校考古学系2011年的研究生课程“论文与出版物的数字技巧(Digital Skills for Dissertation and Publication)”中的一部分,于2011年以实验课程的方式开展。

(5)Si 模型(2013)[17]。司莉等认为,图书情报教育应该因应e-Science 对科学数据管理人才的需求,培养实践型科学数据管理专家。他们考查了国际范围内的科学数据专家招聘要求,进而结合图书情报教育在科学数据管理人才方面的培养现状,梳理出基本的教育内容:研究方法;数据科学,数据管理,数据服务;数据统计与分析;数据仓库;信息研究与技术。

3 分析与讨论

能力导向模型和目标导向模型之间的一个显著区别是:前者反映了需要让学习者对整个数据生命周期有总体了解的教育思路,后者着重某一或某些与数据处理或管理相关的技能,并将之融入特定的教育体系,亦即:能力导向模型体现了一种更为系统化的数据素养教育思路,而目标导向模型反映了一种更为专门化的教育思路。下文分析两种教育思路下所对应的教育内容、适用情境与建构方式、提出背景与应用效果的异同。

表2 基于数据生命周期环节的数据素养能力模型分析

3.1 模型基本内容:以数据生命周期为线索

为了更加清晰地观察各模型内容所涉及的数据生命周期环节,笔者将前述数据素养能力模型的基本内容与UKDA 数据生命周期[18]的各环节进行匹配,见表2。

3.1.1 能力导向模型与系统化数据素养教育思路

能力导向模型将“数据素养”视作一个独立的对象,内容往往以数据生命周期为线索,由浅入深、循序渐进地引导学生,一方面宏观了解数据生命周期,另一方面分步掌握各环节的内容。

表2显示,能力导向各模型对于数据生命周期中的数据创建(述及8 次)、数据处理(7 次)、数据保存(7 次)、提供数据入口(7 次)等环节较为关注。其中,数据创建强调制定数据管理计划和数据收集,数据处理强调数据命名、格式转换及标准化,数据保存强调数据著录、元数据、备份与安全,提供数据入口强调数据共享以及伦理问题。由各模型所关注的重点来看,系统化的数据素养教育的最终目的是使数据能够得到良好的保存和高效的共享,而这两方面都有赖于数据创建和数据处理环节对数据操作的规范化和标准化。

虽然部分能力导向模型,如Data ONE、MANTRA,并没有太多涉及数据分析、数据重用环节的内容,但笔者认为,这并不影响学习者对数据生命周期的整体认知,因为这些模型在数据创建环节中已着重强调了制定数据管理计划的重要性。而在制定数据管理计划时,学习者需要在脑海中模拟一个完整研究的实施过程,进而制定从数据收集到数据存储、共享以及相关伦理问题的完整解决方案。能力导向各模型对于数据生命周期中的数据分析(5 次)和数据重用(5 次)环节,较少关注。对这两个环节的“有意”减弱,有助于将数据素养教育与其他教育进行明确区分。

就数据分析能力而言,面向不同专业不同人群的数据分析能力要求不同,较难用统一的能力指标界定,如Carlson 模型在描述数据分析要求提及的是“熟悉学科内基本的分析工具”,说明数据分析需要与学科背景结合。其他述及数据分析的能力导向模型均有类似的反映:在系统化的数据素养教育中,着重培养学习者解读数据、评估数据等数据思维模式,一般不会涉及太多专业背景,对学习者的数据分析能力要求不高。

对数据重用环节较少关注,对e-Science科研环境而言是一种不足。在e-Science 环境下,越来越多的研究建立在对已有数据的重用之上。因此,数据重用环节中的跟踪研究、实施研究综述等行为应该得到重视,并在数据素养能力模型中加以体现。Carlson 模型在这方面可视作典范,其在“数据管理与组织”中强调“跟踪数据子集或已加工的数据与原始数据集的关系”,在“数据监护与再利用”部分提出“认识到数据在证实研究或供他人使用方面,有可能有超越初衷的价值”的学习要求[6]。

总体而言,能力导向模型能较好地覆盖数据生命周期,对应的数据素养教育实践多采用在线形式。Carlson 模型是一个特例,其对应的数据素养教育项目采用了多种课程开展方式,如嵌入到学生项目中进行指导、研讨会、专业课。

3.1.2 目标导向模型与专门化数据素养教育思路

目标导向模型反映的是将数据素养教育融入特定背景教育体系中进行的专门化教育思路。在这种思路下,数据素养的培养意味着某一项或某几项数据处理或管理能力的深入学习。例如,UKDA 模型关注数据分析和提供数据入口环节的能力培养,Stephenson&Caravello 模型关注理解数据并用图表呈现数据的能力,HKUST模型关注数据收集环节,MacMillan 模型关注与生命科学专业相关的数据创建和分析,Si 模型则融入了图书情报领域数据管理人才培养的考虑。而Data Train 模型在一定程度上体现了专门化教育思路和前述系统化教育思路的融合。一方面,它专注考古学背景下的数据长期保存,另一方面,在课程中涉及到研究生数据管理计划的知识,因此,学习者能够对数据生命周期有较系统的认知。

目标导向模型对应的数据素养教育实践主要以线下方式开展。由于教学时间有限,如一次研讨会、一学期或一学年,教学目标和内容必须有所侧重,因此在能力目标设置上有所取舍。这点在Stephenson &Caravello、HKUST 和MacMillan模型中表现得尤为突出。

3.2 模型的适用情境和建构方式比较

建构者在提出模型之前,往往需要确定其适用群体,并通过一定的建构方式,设计出贴近目标群体的数据素养能力模型。因此,建构方式的选择与模型的适用情境密切相关。各模型的适用情境和建构方式如表3所示。

表3显示,在系统化的教育思路下,能力导向模型适用的学科领域和教育对象范围非常广泛。当然,正是因为需要面向大规模的科研工作者或科研后备人员(本科生和研究生),甚至一般公众开展数据素养教育,才需要选择这一受专业限制较少的系统化教育思路。目前面向大范围群体建构的数据素养能力模型,大多出现在自然科学领域,部分模型有更广泛的适用性,但暂时未见有专门面向人文社科领域建构的数据素养能力模型。在建构能力模型、设计教育体系时,建构者或设计者需要确定目标人群,进而采取相应的建构和设计方式。然而,表2和表3显示,无论是采取案例研究方法还是采取对照传统信息素养能力标准方法,得出的数据素养能力要求并没有显著差异。比如,Prado&Marzal 模型通过对照传统的信息素养能力标准,得出面向各类图书馆用户的数据素养能力模型,其中所设定的能力以及学习的内容与专门指向高校本科生、研究生或科研工作者的能力模型(如MANTRA、Carlson等模型)并没有太大差别。在某种程度上,这一情况反映了不同学历、不同学科背景对于数据素养能力的要求具有一致性。

表3 各模型的适用情境和建构方式分析

与能力导向模型相比,目标导向模型更多涉及人文社科领域,如UKDA模型、Stephenson&Caravello 模型、Data Train 模型和Si 模型。或者可以认为,与自然科学领域相比,人文社科领域更偏向于采取专门化的数据素养教育思路。这一情况说明人文社科领域的教育者已经察觉到提高学生数据素养的重要性。较之自然科学领域强调定量研究方法,人文社科研究更常使用访谈法、田野调查法、观察法等质性研究方法。虽然定量研究方法,如仿真实验、真实实验法、社会调查法,在人文社科研究中日益重要,但教育者可能只察觉到数据生命周期某个(些)环节相关技能对其所属学科的重要性,并因此建构了对应需求的目标导向数据素养能力模型。

3.3 模型的提出背景和应用效果比较

表4分析了各模型的提出背景和应用效果。模型的提出与付诸实践需要多方的努力和支持,而模型提出者自身的知识储备和资源往往影响着模型的应用效果。

由表4可知,建构模型的主体主要有大学图书馆(4 个)、大学图情院系(3 个)、大学图书馆与大学院系(3 个)、大学院系(2 个)、其他(统计局1个,学者群体1 个)。从数量看,大学图书馆是建构数据素养能力模型的主要主体。在14 个模型中,3 个能力导向、1 个目标导向模型由大学图书馆建构。一方面,部分大学图书馆关注到e-Science 对科研环境所带来的转变,着手建构能够系统提高科研人员和本硕学生数据素养的模型及课程,如MANTRA 模型、Carlson 模型和NECDMC 模型。学科馆员和数据馆员在其中起到了关键作用。比如,Carlson 模型对应DIL 项目,该项目团队通常由一位学科馆员和一位数据馆员组成;学科馆员是图书馆与具体院系之间的桥梁,起到协调统筹作用,也承担部分教学任务;数据馆员具备数据管理专门知识,主要负责项目教育需求分析、教育方案制定以及大部分的教学任务;两者均对数据信息素养项目的开展起到重要作用。正是由于大学图书馆同时拥有这两类专业人才,方能根据学科专业数据处理和管理需求,提供特定的数据素养教育项目。另一方面,部分大学图书馆在其原有信息素养教育的基础上,加入数据处理相关模块,以适应学科和科研环境的变化。例如,Stephenson&Caravello模型,其信息素养线下课程重点关注数据处理与分析模块,虽然没有形成完整的数据素养教育体系,但能够基本满足社会学本科生的学习需求。总体而言,由大学图书馆建构数据素养模型,并由其主导数据素养教育,能够取得不错的效果。

表4 各模型的背景和应用效果

有3个模型由大学图书馆和大学院系联合建构,大学图书馆仍是主导。HKUST模型和MacMillan模型以学科馆员为中介;Data Train 模型由大学图书馆结合院系教职员工的模型建构意见,提出面向特定学科的数据素养能力要求。

大学图情院系是另外一个较常提出数据素养能力模型的主体。图情院系素来关注信息组织、信息处理、信息分析和信息共享等主题的教育。进入21 世纪后,图情教育发生了很大的变化。一方面,2005年iSchools 联盟成立,强调人、信息与技术三者之间的紧密关联,另一方面,e-Science 的兴起、大数据等概念的提出和升温,吸引不少图情专家将教育兴趣转向数据挖掘和数据管理。总体而言,大学图情院系的数据素养能力模型能够较全面地覆盖数据生命周期。

模型的应用效果能够反映出该教育思路的可行性。从应用效果、教学资料、基本内容和建构方式综合观之,Carlson 模型是能力导向模型中较为成熟的一个。首先,它受IMLS 资助,通过较为科学的建构方式建立了涵盖整个数据生命周期的数据素养指标体系。其次,该模型已应用到多个高校图书馆不同类型的数据素养教育实践项目中,发表了一系列研究成果,还在官网上提供了较详尽的开展数据素养教育项目的操作指南。目标导向模型中,Data Train 模型较为成熟,具有参考价值。

4 结语

本文通过梳理和综合分析国内外14 个数据素养能力模型及相关教育实践,提出数据素养教育的两种思路,即能够较全面地让学习者认识数据生命周期的系统化教育思路,以及能够让学习者快速掌握某些数据处理和管理技能的专门化教育思路。对应这两种思路,数据素养能力模型划分为能力导向和目标导向两种类型。

系统化数据素养教育的最终目的是,使数据能够得到良好的保存和高效的共享,而这两方面都有赖于数据创建和数据处理环节对数据操作的规范化和标准化。对数据分析和数据重用环节的“有意”减弱,有助于将数据素养教育与其他教育进行明确区分。而对数据重用环节的较少关注,对e-Science 科研环境而言则是一种不足。在系统化教育思路下,能力导向模型适用的学科领域和教育对象非常广泛。目前面向大范围群体建构的数据素养能力模型大多出现在自然科学领域,部分模型有更广泛的适用性,但暂时未见专门面向人文社科领域建构的数据素养能力模型。

就专门化的教育思路及对应的目标导向模型而言,数据素养的培养意味着某一项或几项数据处理或管理能力的深入学习。由于教学时间有限,在专门化教育思路下,数据素养的教学目标和内容必须有所侧重,因此在能力目标设置上自然也有所取舍。目标导向模型更多地涉及人文社科领域,或者可以认为,与自然科学领域相比,人文社科领域更偏向于采取专门化的数据素养教育思路。由此表明,教育者已经察觉到数据生命周期某个(些)环节的相关技能对所在人文学科的重要性。然而,数据于人文社科领域的地位越来越重要,人文社科的学生和科研人员或许也需要系统化地提升其数据素养。

而在建构模型的主体上,主要有大学图书馆、大学图情院系、大学图书馆与大学院系。其中,有大学图书馆介入的情况下,学科馆员和数据馆员发挥着重要作用。

伴随着研究范式、路径和方法的转变,在大学中为研究生和本科生——未来的科研工作者开设数据素养教育课程显得尤为必要和紧迫。目前自然科学领域已有不少较为完善的数据素养能力模型及对应的教育实践课程,而人文社科领域的数据素养教育仍处于起步阶段。在设计数据素养教育课程的过程中,一方面,根据教育原理,需依据具体情境建构面向不同群体的数据素养能力模型,才能突出后续课程的针对性和实用性。另一方面,在大学图书馆没有学科馆员和数据馆员等专业人员的情况下,可以图情院系为主导,由图书馆和其他人文社科院系协助的方式,开展相关的数据素养教育实践,以全面提高人文社科科研工作者及后备人员的数据素养。

注释

①International Association for Social Science Information Service&Technology,社会科学信息服务与技术国际协会。

②Inter-university Consortium for Political and Social Research,政治和社会研究校际联盟。

③每类模型建构以时间先后为序,每个模型以建构者及建构时间命名。

④该项目2010-2011年受英国联合信息系统委员会(Joint Information System Committee,JISC)资助,2013年至今受爱丁堡大学“科研数据管理计划”资助(http://datalib.edina.ac.uk/mantra/acknowledgements.html)。

⑤该项目受美国博物馆与图书馆服务协会(Institution of Museum and Library Service,IMLS)资助,由普渡大学、明尼苏达州大学、俄勒冈大学、康奈尔大学合作建设。

⑥该课程受美国国家医学图书馆和马萨诸塞大学医学院联合资助。

⑦信息素养六大技能(Big6 Skills,The Big 6TM)由迈克·艾森伯格(Mike Eisenberg)和鲍勃·伯科威茨(Bob Berkowitz)建立,包括任务界定、信息检索策略、定位与获取、使用信息、合成、评价等六大能力(http://www.big6.com/pages/about/big6-skills-overview.php)。

⑧SCONUL 信息素养七大指标(The SCONUL Seven Pillars of Information Literacy:Core Model)由SCONUL信息素养工作小组建构,包括信息需求识别、信息需求研究、检索策略规划、信息获取、信息评价、知识管理和知识展示与创新(http://www.sconul.ac.uk/sites/default/files/documents/coremodel.pdf)。

猜你喜欢
数据管理导向建构
以生活实践为导向的初中写作教学初探
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
情境—建构—深化—反思
“偏向”不是好导向
残酷青春中的自我建构和救赎
CTCS-2级报文数据管理需求分析和实现
基于需求导向的航天青年成长建议与实践
建构基于校本的听评课新文化