中外高校图书馆社科数据服务比较*

2016-06-22 08:50李桂华
图书馆论坛 2016年6期
关键词:数据服务社科数据管理

刘 澈,李桂华



中外高校图书馆社科数据服务比较*

刘澈,李桂华

摘要社科数据服务成为高校图书馆服务创新方向。文章通过对中外20所高校图书馆的调查,从社科数据资源建设情况和数据服务实施情况两方面展开对高校社科数据服务的比较分析,并从资源建设、馆员设置和合作平台三个方面提出发展我国高校图书馆社科数据服务的具体建议。

关键词社科数据数据服务数据管理高校图书馆

引用本文格式刘澈. 李桂华. 中外高校图书馆社科数据服务比较[J]. 图书馆论坛,2016(6):142-148.

*本文系教育部人文社会科学基金项目“项目情境下的社会科学研究者信息行为研究”(项目编号13XJA870001)研究成果之一

Keyworks social science data;data service;data manage;university library

随着数据密集型科研范式的普及,以及社会科学对定量研究的重视,社科数据服务已成为高校图书馆(以下简称“高校馆”)信息服务的重要版块。一方面社科数据服务的开展需要以丰富的社科数据资源为基础;另一方面,只有充分发展数据服务,社科数据资源建设才能彰显价值,因此,资源建设和服务实施需同步发展。本文对中外高校馆的社科数据服务情况展开调查,比较两者在资源建设与服务开展方面的差异,探讨如何缩小差距,以促进国内高校馆社科数据服务的发展。

1 研究对象及方法

按照美国社会科学数据管理联盟(DATA-PASS)对社科数据的定义[1],社科数据资源主要包括国家统计部门发布的数据以及政策制定调查产生的数据、商业组织生产的社科数据集合、社科研究者调研实践产生的统计调研数据,以及其他原生态零碎数据。本研究基于该定义,从馆藏数值型社科数据库、外链型社科数据资源和社科数据平台展开对高校馆社科数据资源的调查和分析。本文运用个案研究法,笔者于2015年4-5月对20所中外高校馆的社科数据服务情况进行了调查。数据来源主要包括图书馆数据库、图书馆参考咨询系统、图书馆微博或Twitter等信息发布平台[2]。考虑到排名靠前的高校更能代表高校数据服务的水平,因此根据世界大学学术排名(ShanghaiRanking Consultancy ARWU)、教育组织世界大学排名( Quacquarelli Symonds World University Rankings)、泰晤士报世界大学排名( Times higher education World University Rankings)这三大世界大学排名榜单选取2014-2015年综合排名靠前的10所国内高校和10所国外高校。

2 中外高校馆社科数据资源建设比较

2.1馆藏数值型社科数据库资源建设

数值型数据库是指专门提供以数值方式表示的数据的源数据库,用于存贮科学研究的原始数值数据或财政、人口等统计数据[3]。随着社会科学对研究方法科学性的追求,主要服务于社科研究的数值型数据库已经成为高校馆数值型数据库的重要版块。根据笔者所做的调查,虽然各馆的数值型数据库占比情况有较大差异,但国外10所高校馆普遍拥有一定数量的数值型社科数据库(见表1)。

表1 国外10所高校数值型社科数据库资源情况

在被调查国外高校中,大多数高校馆的数据库导航中对数值型数据库进行单独罗列,部分高校馆对其进行主题的进一步细分,将数据库资源按照主题类别与其他资源统一整合为主题指南,也因此部分高校数值数据库总量和社科数值数据库总量难以计算。例如,麻省理工学院在主题指导中列出6类主题数值数据资源指引,分别是“生物数据及图谱”“国家数据及分析”“人口及统计数据”“数据(社会科学)”“数据以及查找管理数据”。其中仅“人口及统计数据”就包括统计人口数据、经济人口数据、其他人口统计数据以及国际人口数据4个版块,在每一版块下根据内容及用户需求将相关数值数据库资源与其他网络资源分类呈现给用户,例如“人口及统计数据”下的“统计人口数据”包含5大版块,下列有“微观数据”“历史数据”等5种类型数据入口。仅在“历史数据”下便提供了3个数据库、3个网站资源、1个数据系统以及1个数据合作平台,详见图1。这样的细分可以指引有明确数据需求的用户到具体的数据库或资源网站上,节约用户时间。

在被调查的10所国内高校馆都拥有一定比例的数值型社科数据库资源(见表2)。而且调查发现大多高校的试用数据库中包含有一定数量的数值型社科数据库。比如上海交通大学,目前21个试用数据库中有8个数值数据库,占整个试用数据库38%。可见数值型社科数据库已得到国内高校馆一定程度上的重视。

2.2外链型社科数据资源建设

国外高校馆社科数据资源综合了大量的外部社科资源,在图书馆中很大一部分为国家统计部门的超级链接,且内容广泛。以墨尔本大学人口普查子主题为例,在该部分墨尔本大学提供的外部链接包括世界银行、经济学人智库、联合国月报、联合国统计局、国家统计年鉴、欧盟统计局、中情局世界概况、世界经济合作与发展组织、国际和国家统计机构、全球金融组织。也就是说,他们给出的外部链接内容涵盖了国内政府机构、世界权威统计组织、他国权威统计机构等各类权威数据源,尤其是比较全面地覆盖了各主题的政府数据源。

图1 麻省理工学院6类主题数值数据资源指引

表2 国内10所高校数值型社科数据库资源情况

国内高校馆鲜少将图书馆资源与外部社科资源综合起来。除中国人民大学图书馆外,国内高校馆均未提供其他政府及社会统计机构发布的社科统计信息。中国人民大学图书馆在“经济统计学科服务平台”集中提供22个中国行政机关统计部门超级链接、18个外国官方统计部门超级链接和13个国际统计组织如联合国统计司的超级链接。但部分链接存在失效情况,如提供的“美国普查局数据”链接至老旧的美国人口普查政府网站,该网站已失效;国内行政机关“国家发改委有关数据”超链接也显示无法访问。

2.3社科数据平台建设

集中管理和共享社科相关的研究调查数据。被调查的10所国外高校馆均有自建社科数据平台或与其他高校馆联合搭建社科数据平台,如美国高校均参与共同构建政治与社会研究高校联盟(ICPSR)。这些社科数据平台数据量大且源头广泛,便于下载,例如麻省理工学院提供HMDC哈佛—麻省理工社会科学数据中心,其数据源包括ICPSR、沃顿研究数据、美国人口普查网站、国家卫生统计局以及其他数据档案;普林斯顿大学的CPANDA收录有超过250个数据集,提供SPSS、STATA等多格式下载服务。国外高校馆部分社科数据平台还提供数据分析服务。例如,哈佛大学与麻省理工学院合作的Dataverse,在拥有海量社科调查研究数据资源的同时,提供的时间序列分析等多种数据分析服务。

被调查的10所国内高校馆中仅5所引进社科数据平台,各个平台较为独立,且这些社科数据平台网页上呈现给用户查阅使用的项目较少,数据量较小。清华大学与2009年11月成立的CDC平台网页上仅呈现2009年12月的两项项目数据;浙江大学于2009年成立的SSEC平台,最新更新时间为2012年12月;中国人民大学的CSSOD平台网页有6大研究项目,向用户提供的数据仅57条。

表3 国内调查高校社科项目数据平台质量情况

3 中外高校馆社科数据服务实施比较

本研究从社科数据馆员设置、社科数据指引服务[6]、社科数据管理服务[7-9]、社科数据使用培训服务4方面对20所高校馆的社科数据服务实施情况展开了调查,表4给出了被调查高校服务实施简况。

3.1社科数据馆员设置情况比较

社科数据馆员特指图书馆为社科数据管理特设的数据馆员,其主要工作是围绕数据生命周期和科学研究生命周期,管理数据资源,包括制定数据管理政策,完成数据选择、保存、存储与维护、元数据创建与转换等,以及开展数据服务工作,如数据管理计划咨询、数据分析、数据存取服务、数据引用、数据共享等各项工作。国外设置的相应岗位命名各有不同,如“研究数据管理服务主任”“数据馆员”“数据管理咨询员”“数据管理专家”“数据服务研究咨询员”[10]。

通过调查,国内高校均未提供专门的数据馆员,而国外8所高校均设有专门的数据馆员(见表4),其中麻省理工等甚至为每一具体主题的社科数据分配有不同数量的数据馆员,同时公布各数据馆员的详细联系方式。麻省理工学院、耶鲁大学、墨尔本大学、普林斯顿大学还嵌入实时咨询系统,有特设的数据馆员提供用户实时咨询服务。

3.2社科数据指引服务比较

社科数据指引服务,即图书馆为确保数据资源的开发利用,对数据进行介绍并提供路径指引的服务。调查主要涉及两方面:其一,图书馆是否对提供的社科数据资源进行介绍;其二,图书馆网站首页是否专门设置数据服务主题指南等相关服务指引。

3.2.1社科数据介绍

被调查国外高校馆大多对社科数据资源进行专门介绍(见表4)。以麻省理工学院图书馆为例,该馆首页有醒目的指引能引导用户进入“数据管理”版块,该版块对研究数据从3大主题进行了介绍:是什么、为什么以及对数据管理的要求;又例如剑桥大学图书馆,对社科数据的创建、组织、获取、保存维护进行了介绍,能够让用户明白社科数据是什么,如何才能共享自己的社科数据,如何获得并二次使用社科数据等。

而国内只有2所高校馆的网站对社科数据资源进行了简单介绍,包括南京大学对每个数值数据库进行数据库简介,中国人民大学仅介绍其“经济统计”学科服务平台。

对比可知,国内高校馆尚未将社科数据视为重要的信息资源来集中组织和宣传,这与国外高校馆相较还存在一定差距。

表4 国内外高校图书馆数据服务提供概况

3.2.2主题指南

调查发现,被调查国外高校馆普遍建设有社科数据服务主题指南[11],并注重社科数据的主题与数据格式,提供数据分析工具与数据获得方法(见表4)。同时每所高校的数据服务主题指南都在首页有直接或者间接的指引,便于初次访问图书馆网页的用户寻找到社科数据服务主题指南。

以麻省理工学院为例(见图2),该校建立有“社科数据服务主题指南”“数据:查找与管理主题指南”。在社科数据服务主题指南中,该馆设置有“按平台机构查找数据”版块、“按具体主题查找数据资源”版块,并包含分析数据栏、管理数据栏、特殊资源栏、相关指引栏、新闻栏、数据馆员栏、FQA栏的主页。在平台版块中,麻省理工学院列出师生常选资源平台链接以及跨学科资源平台链接,同时提供如何寻找特定主题数据的指导供用户参考。在主题版块中,提供人口统计、经济、教育等12类主题,进入每一主题后可以看见更加细分的子主题数据服务。例如,人口统计子主题,麻省理工学院从人口普查数据、经济普查数据、其他人口统计数据以及国际普查数据4个方面展开,均提供相关指南,国家人口统计局相关的统计数据(包括事实调查、能适用于各种地理信息系统的数据shp文件、dbf表等)、微观数据、规范化格式数据、史料数据以及普查方法。这两个版块的设置,可明确指引用户找到符合自己需求的数据主题,同时还能限定数据的格式以便用户直接导入数据处理工具。

而在国内调查的高校馆中,并未建设有专门的社科数据服务平台。中国人民大学建设有“经济统计”的学科服务平台,该主题指南虽然是该校学科服务平台中点击数量最大的一个,但并未对数据进行格式分类。

图2 麻省理工学院社科数据服务平台

3.3社科数据管理服务比较

社科数据管理服务包括针对社科数据的分类、处理、存储、制定规划管理方案以及利用等方面的图书馆服务。通过调查,国内所有被调查高校馆均没有提供数据管理服务,而被调查国外高校馆则均提供该项服务(见表4),且普遍对社科数据上传共享与引用制定有详细规定,如规定上传数据包括的项目介绍、数据格式、数据引用。以哈佛大学为例,其主导建立的数据服务Dataverse项目由3个部分构成:添加数据、查找数据、获得认可。获得认可版块便是在说明该项目中数据管理计划以及数据引用标准。同样我们能在引用部分找到图书馆提供的参考实例,明确用户在引用其数据时需要注明的7大部分(Dataverse引用数据的7大部分包括作者、题名、年份、数据仓库、版本号以及2个机器可读部分)。而麻省理工学院特意在图书馆二级目录中设置“管理数据”版块,该版块由“制定一个管理计划”“存储数据”“分享数据”3部分构成,分别具体说明了:数据管理计划是什么,如何组织备份保护数据,在存储数据时建议的元数据形式,共享数据需要符合的条件以及保密声明、知识产权说明。同时,在该校社科数据服务中心还另辟“Cite data”数据引用版块,向用户说明了引用数据的用处以及在引用数据同时需要注意的事项。在刻板的条例说明外,该校还以具体的引用数据案例进一步向读者说明。这些多样性的管理服务使图书馆不仅仅成为信息的提供场所,同时还能成为用户信息保存管理与交换共享的工具。

3.4社科数据使用培训服务比较

社科数据使用的培训是指高校馆针对其用户开放的有关社科数据使用管理等方面的培训,各个高校课通过开设讲座、相关课程、提供PPT/PDF/视频等多种形式开展对用户的社科数据使用培训[12]。

在调查中,国内4所高校馆都有提供社科数据用户培训服务,服务形式有专题讲座、MOOC公开课。调查中的国外高校,除帝国理工学院、斯坦福大学和墨尔本大学外,都提供用户培训服务,麻省理工学院将数据管理课程作为该校信息素养教育课程的一部分;哈佛大学则提供相关培训课件,用户可自行从网页下载;而普林斯顿大学图书馆以FAQ形式进行更细化的社科数据培训服务。它提供社科研究数据管理的常见问题及其答案,细化到每一个子主题数据服务指南之下,为每一单独主题的数据设置相关FAQ,同时该校FAQ是与其他高校合作完成的,如在NSF数据管理计划FAQ中便提到该部分的FAQ是与明尼苏达大学图书馆共同创建的(Modified with permission from the FAQ created by the University of Minnesota Libraries)。如此为主题数据单独创建的FAQ更加具有针对性,对新用户有更强的帮助指引作用,从实际操作层面上完成用户培训。

4 讨论

通过上文对比,国内外高校馆社科数据资源建设与服务开展方面差距明显。我国高校馆应从三方面改善社科数据服务。

首先,围绕数据服务目标进行社科数据资源建设,整合多种社科数据来源,建立分类主题指南。在资源建设规划时,图书馆应将社科数据作为整体考虑,多与政府统计部门、科研机构、国际组织建立合作联系,在图书馆相关资源页面也应附上数据来源网站供用户选择。

其次,设置数据馆员。目前国内大多高校馆设置的参考咨询服务是综合性质的,而用户希望图书馆提供数据分析、数据收集等方面更专业的服务,这些服务的开展需要设置专门的数据馆员以进行充分的专门知识和服务技能积累。

最后,加强合作促进平台建设。我国高校社科数据平台数据量小且各个平台较为独立[13],平台组建部门也未能和校内外其他部门合作。建议把各个高校和国内外统计机构联合起来,借力CALIS建立有层级保障的、多方参与的高校社科数据合作平台。

参考文献

[1] Data preservation alliance for the social science. About Data-Pass[EB/OL]. [2016-03-12]. http://www.datapass.org/.

[2] Choudhury G S. Case Study in Data Curation at Johns Hopkins University[J]. Library Trends,2008,57(2):211-220.

[3] 王绍平. 图书情报词典[M]. 上海:汉语大词典出版社,1990:966-967.

[4] 覃丹. 英美社会科学数据管理与共享服务平台调查分析[J].图书情报工作,2014(8):67-75.

[5] 彭建波. 北美人文社会科学数据管理的实践及其启示[J]. 大学图书馆学报,2013(31):33-37.

[6] 邢文明,吴方枝,司莉. 高校图书馆开展科研数据管理与共享服务调查分析[J].图书馆论坛,2013(33):19-25.

[7] 朱彩萍.高校图书馆提供科学数据服务的途径与内容[J].图书与情报,2014(3):97-99.

[8] 陈建新. 科学数据服务:图书馆服务的新领域[J]. 图书与情报,2013(4):93-95.

[9] 熊文龙,李瑞婻.基于科学数据管理的图书馆数据服务研究[J].图书情报工作,2014(22):48-52.

[10] 孟祥保,钱鹏. 国外高校图书馆数据馆员岗位设置与管理机制[J]. 图书与情报,2013(4):12-17.

[11] 王娟.基于美国经验的我国高校图书馆科学数据管理发展路径探析[J]. 湖南社会科学,2014(3):226-228.

[12] Kutay S. Advancing Digital Repository Services for Faculty Primary Research Assets:An Exploratory Study [J]. Journal of Academic Librarianship,2014,40(6):642-649.

[13] 张计龙,殷沈琴,张用,等. 社会科学数据的共享与服务——以复旦大学社会科学数据共享平台为例[J].大学图书馆学报,2015(1):92-96.

A Comparative Analysis of Social Science Data Services of University Libraries in China and Other Countries

LIU Che,LI Gui-hua

AbstractSocial science data service has become an important innovation for university library. This paper conducts a survey of 20 university libraries in China and other countries,and makes a comparative analysis of the status quos of social data services with regard to resource construction and service implementation. Suggestions are given on how to develop social science data service in Chinese university libraries in terms of resource construction,library staff setting and cooperation platform.

作者简介刘澈,女,四川大学公共管理学院硕士研究生;李桂华,女,四川大学公共管理学院教授,博士生导师。

收稿日期2016-03-11

猜你喜欢
数据服务社科数据管理
大数据时代高校图书馆数据服务的困境及优化路径
社科成果展示
地理空间大数据服务自然资源调查监测的方向分析
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
基于数据中台的数据服务建设规范研究
社科成果展示
社科成果展示
CTCS-2级报文数据管理需求分析和实现