我国科研机构科研数据管理现状调研*

2019-01-15 11:12邢文明杨玲
数字图书馆论坛 2018年12期
关键词:数据管理科研人员政策

邢文明 杨玲

(湘潭大学公共管理学院,湘潭 411105)

随着大数据时代和数据密集型研究范式的到来,科研数据的开放与共享在国内外受到越来越广泛的重视。相关研究显示,尽管科研数据共享的价值已被普遍接受,且图书馆等服务机构积极倡导并为科研人员管理与共享科研数据提供指导与帮助,但相对于其他因素,科研数据政策在推动科研数据管理与共享中的作用更直接且更有效[1]。英国、美国、澳大利亚等均已制定了涵盖国家/政府、科研资助机构、科研教育机构、数据存储/共享中心、学术出版机构等不同层面的科研数据政策体系[2]。其中,科研机构(主要包括高校和科研院所)作为科学研究的主体,是科研数据产出的主要阵地,其科研数据政策的制定更是至关重要[3-4]。我国于2018年3月颁布实施的《科学数据管理办法》[5]将“建立健全本单位科学数据相关管理制度”作为科研院所、高等院校和企业等法人单位的重要职责之一。可见,制定本单位的科研数据政策以促进和规范科研数据的管理与共享,将成为我国科研机构的重要职责和迫切任务。而政策的制定离不开对科研数据管理与共享现状的调研,本文对我国科研人员管理与共享科研数据的现状进行调研,以期为我国科研教育机构制定科研数据政策提供参考。

1 研究综述

了解科研人员管理与共享科研数据的现状,特别是存在的问题与困难,在此基础上提供有针对性的帮助与引导,是推动数据共享和充分发挥科研数据价值的必然路径。目前,国内外已有一些机构和学者对科研数据的管理与共享进行调研,视角主要集中在两个方面:一是科研机构为更好地推动科研数据的管理与共享而开展的摸底调研。如英国联合信息系统委员会(Joint Information Systems Committee,JISC)资助了一项旨在了解英国科研机构的科研数据管理与保存现状以更好地促进科研数据共享的研究,分别对牛津大学(University of Oxford)、南安普顿大学(University of Southampton)[6]、诺丁汉大学(University of Nottingham)[7]、埃克塞特大学(University of Exeter)[8]等学校的科研数据管理与保存现状进行调研,在此基础上提出数据资产审计框架(data audit framework),为科研机构识别和评估所拥有的科研数据及推动科研数据的管理、保存与共享提供可操作流程[9]。二是科研数据服务机构为更好地开展服务而进行的科研数据管理与共享需求调研。如加拿大皇后大学图书馆2016年对本校工程与科学领域的科研数据管理现状进行了调研[10];美国北卡罗来纳教堂山分校2012年对全校研究人员进行调查,以了解研究人员管理和共享科研数据现状、存在的问题及需求等[11];美国国家医学图书馆2017年对医学领域的研究人员进行调查,以了解他们对科研数据管理的需求[12]。国内的胡永生等[13]、洪程等[14]分别对武汉地区高校科研人员和东南大学硕博士研究生的科学数据管理现状与需求进行调查,为高校图书馆开展科学数据管理服务提供参考。然而,国内外针对科研数据政策制定需求的研究尚不多见。笔者在参考相关研究成果的基础上,对我国科研人员管理与共享科研数据的现状进行调研,以期为我国科研机构制定科研数据政策提供参考和依据。

2 研究设计

2.1 问卷设计

本文借鉴丁宁等[15]提出的科研数据生命周期管理模型,主要从数据的收集与获取、数据的管理与保存、数据的共享等角度进行问卷设计,具体内容参考英国《数据资产审计框架方法报告》[16]中的相关问题,以及文献[11,13-14]的调查内容。问卷初稿形成后,进行了一次小规模的预调查以收集相关意见,并对问卷进行修正和完善。问卷主要包括5个方面的内容:①调查对象的基本信息,包括性别、年龄、学科、身份等;②科研人员在科研过程中收集或获取数据的途径、方式及遇到的困难;③科研人员对科研数据管理与保存的现状及存在的困难,包括科研过程中对数据的管理方式、是否使用专门的数据管理工具/软件、数据保存与管理的满意度、项目结束后数据的保存方式及时长、是否发生过重要数据丢失或损毁及其原因等;④调查科研数据共享现状及对科研数据共享的态度;⑤对科研数据管理与共享政策的认知与态度。

2.2 调查对象与方法

为适应不同情况,笔者分别设计了网络版和纸质版的调查问卷。纸质问卷主要针对武汉地区的科研人员,包括高校教师、科研机构专职研究人员、图书馆员、博士生和研究生等;网络版问卷通过电子邮件、QQ群、微信群等多种途径对不同背景和学科的科研人员进行调查。在进行纸质问卷调查时,笔者还通过聊天的方式对科研人员进行非正式访谈,进一步了解其管理、保存和共享科研数据的相关情况。

本调查问卷是在深入分析科研人员管理与共享科研数据现状的基础上编制,并聘请多位相关专家反复提出修改意见,同时在正式调查前进行小范围测试并再次修改完善,在一定程度上保证了调查问卷的效度。本次调查时间为2018年5月10日—6月3日,获得有效纸质问卷171份、网络问卷240份,共计有效问卷411份。

3 调查结果

3.1 调查对象的特征分析

调查结果显示,调查对象中,以博士和硕士为代表的学生科研群体所占比例最大(56.69%),其次是教师和专职研究人员(33.00%)。从年龄层次看,中青年科研人员所占比例最大(超过70.00%),其次是青少年科研人员(29.44%),这两类人群接受能力强,富于创造性,是从事科研的主力;从学科背景看,主要集中在工、理、农、管理和医学等领域。

3.2 科研人员获取科研数据的方式及困难

3.2.1 科研数据获取方式分析

从图1可看出,科研人员获取科研数据的方式主要有实验室试验、网络采集、社会调查、实地观测、建模或模拟等,而通过购买和他人提供的相对较少。

图1 科研人员获取科研数据的方式

进一步分析发现,不同学科和领域的科研人员获取科研数据的方式有所不同,理、工、农、医领域以实验室试验为主,辅以实地观测、建模或模拟、网络采集,而经济学、法学、教育学、文学、管理学等人文社科领域主要通过社会调查和网络采集的方式获取科研数据。

3.2.2 科研数据获取存在的困难

我国科研人员获取科研数据遇到的困难主要有收集到的数据不符合要求(56.93%)、数据收集或获取成本高(53.77%)、难以找到所需数据(35.77%)。每个领域中调查对象选择“数据收集或获取成本高”的比例都较高,这在一定程度上反映出科研数据共享的重要性和迫切性。

另外,经济学研究人员选择“所需数据涉及隐私或国家机密”的比例最高,表明我国政府和公共部门的数据公开水平有待提高。

3.3 科研人员管理科研数据的方式及困难

3.3.1 科研数据管理方式与管理工具分析

为了解我国科研数据的管理现状,对科研人员管理科研数据的方式进行了调查,获知参与课题的某位老师或学生集中管理、项目组参与人员共同管理、项目负责人集中管理是3种主要的方式。由此可见,我国科研人员具有一定的数据管理意识,但主要以科研项目/团队为单位,没有形成统一的模式,处于自发状态。

为了解科研人员管理科研数据的现状与水平,笔者调查了他们是否使用专门的数据管理工具/软件,发现大多数(78%)受访者没有使用专门的数据管理工具/软件,仅有8%的调查者表示使用过。统计发现,使用较多的工具主要有SPSS(5人)、Excel(4人)、SQLServer(4人)、Mysql(3人)、Access(3人)。

3.3.2 科研数据管理存在的困难

了解科研人员管理科研数据存在的困难有助于在制定政策时提高针对性,同时也有助于图书馆等相关部门有针对性地开展相关服务,更好地帮助科研人员管理和共享科研数据。

科研人员管理科研数据存在的困难主要有缺乏有效的数据管理工具/软件(60.83%)、需要花费大量的时间和精力(54.26%)、不知道如何为数据创建索引或元数据(31.87%)。结合上文对科研人员使用科研数据管理工具/软件的调查,说明大多数科研人员缺少管理科研数据的必要技能。因而,在制定相关政策时,应充分考虑科研人员可能面临的困难,为他们管理、利用和共享科研数据提供指导与帮助,以更好地促进科研数据的管理与共享。同时,图书馆等相关服务部门也应积极为科研人员管理科研数据提供指导和帮助。

3.4 科研数据的保存与安全问题

3.4.1 项目结束后科研数据的保存方式与保存时间

科研项目结束后,应及时将收集或产生的相关数据资料进行整理和保存,以便共享和再利用。调查发现,科研项目结束后科研数据的保存人员主要有项目负责人(59.12%)、多个项目组成员(42.82%)、某项目成员(28.95%)。笔者在调研中了解到不少硕士和博士在项目结束时会将所收集或产生的科研数据副本提交给导师或师兄(通常是子课题的负责人或研究团队负责人),由他们进行集中保管或提交给项目负责人。

调查发现,个人电脑、光盘/移动硬盘、机构电脑/存储器/机构库是科研人员保存数据最主要的方式;此外,也有部分科研人员选择保存在纸质载体和网络硬盘上。

调查结果显示,我国科研数据的保管主要以个人为主(超过80%),这给数据的共享与安全带来不利影响:一是数据分散在个人手中,不利于数据的共享;二是分散保管容易造成数据的丢失和损毁,数据的安全面临风险。

关于项目结束后科研数据保留多长时间,绝大部分被调查者选择了“永久保存”和“视情况而定”。国外相关研究也表明,科研数据的保存期限不能一概而论,应根据不同学科领域的特点、科研资助者的要求和数据的重要程度具体来定[6]。

3.4.2 科研数据的安全状况

确保数据的安全是实现科研数据共享的前提和保障。为了解科研数据的安全状况,笔者调查了科研人员是否发生过重要科研数据丢失或损毁的情况,发现近70%的科研人员发生过(包括偶尔发生和经常发生)重要科研数据丢失或损毁的情况。可见我国科研数据的安全状况不容乐观,说明加强科研数据的保存与管理以确保科研数据安全的必要性和紧迫性。

进一步了解科研数据丢失或损毁的原因,发现存储设备故障和误操作/误删除是造成科研数据丢失或损毁的两类主要原因。此外,造成数据丢失或损毁的其他原因还有存储设备丢失或被盗、数据转换或导入时发生故障。笔者认为,无论何种原因,都可以通过相应的安全保护措施(如定期备份)加以避免和预防。因而,有必要尽快采取确保数据安全的措施及建立相关机制。

3.5 科研人员共享科研数据的现状及动机

3.5.1 科研人员共享科研数据的现状

科研数据的获取与再利用是共享的重要方式。调查结果显示,近80%的被调查者都有从其他途径获得科研数据的经历,说明科研数据共享是科研过程中较普遍的现象,也说明科研人员对科研数据共享有较广泛的需求。

调查对象获得科研数据的途径依次是:①导师/师兄/师姐/学长等;②数据共享中心/网站;③有合作关系的同行;④研究团队成员;⑤其他研究团队;⑥师弟/师妹/学弟/学妹/学生等;⑦同事;⑧政府部门。说明我国科研人员获取和共享科研数据的途径以人际关系为主,并主要集中于与自己关系密切或有合作关系的团队及同行。通过数据共享中心/网站获取科研数据的比例位居第二,说明公共数据共享中心/网站是科研人员获取科研数据非常重要的途径,也是非常有发展潜力的途径。

科研数据共享既包括向其他人提供科研数据,也包括从其他途径获得科研数据。调查发现,60%的调查对象曾经向其他人提供过科研数据,其中一半以上(57%)都是无偿提供。说明我国科研人员有较好的共享精神。

对于曾向他人提供过科研数据的科研人员,问卷进一步调查其共享数据的对象。结果显示,分享最多的对象依次是:①导师/师兄/师姐/学长等;②研究团队成员;③师弟/师妹/学弟/学妹/学生等;④有合作关系的同行;⑤同事;⑥其他。可见,科研人员倾向于向与自己关系密切且有科研合作关系的人员提供科研数据。

尽管大多数科研人员都有过共享科研数据的经历,但共享科研数据限于师生或有合作关系的同行,共享范围有限。调查结果显示,影响或阻碍科研数据广泛共享的原因依次是:①数据涉及保密,按规定不能公开;②担心数据被不正当使用;③数据来之不易,不愿意无条件共享。

可见,除数据涉密外,科研人员对数据被不正当使用有着较大的担心,不愿意无条件共享辛苦收集或产生的数据。这表明,需要完善数据共享的利益平衡机制、构建有利于彼此互信的共享机制,以消除科研人员的担心和疑虑,才能推动和促进科研数据共享。

3.5.2 科研人员共享科研数据的动机

调查发现,科研人员分享数据的动机依次是:互助互惠;相信对方不会不当使用或传播数据;这些数据对自身已没有太大用处,但对别人会很有帮助。可见,互助互惠原则是科研人员共享科研数据最主要的原因。此外,调查结果也显示,对共享对象的信任也是科研数据共享的重要因素。这说明在制定科研数据政策时,要重视构建使科研人员彼此互信的共享机制,这样才能更好地促进数据共享。

3.6 对科研数据政策的态度

调查对象中选择“赞成”和“非常赞成”的人员共占76%,选择“无所谓”的占16%,而选择“不赞成”和“非常不赞成”的共占8%。这说明大部分科研人员认可科研数据共享的益处,支持制定相关政策。

3.7 科研数据所有权的归属

39%的调查对象认为数据的所有权属于科研人员,34%的调查对象认为数据的所有权属于科研机构,15%的调查对象则认为所有权属于科研资助者。可见,科研人员对于科研数据所有权的意见并不一致,这与国外相关调查结果基本一致[6]。国外高校科研数据政策的相关研究表明,大多数政策都规定科研数据的所有权归机构,少数高校将所有权归研究人员;但同时指出,科研人员离开学校时,数据的所有权归学校,原始数据应保留在原单位[17-19]。

3.8 对科研数据政策的担心或顾虑

科研人员对政策的担心或顾虑,主要有以下6个方面。①削弱科研竞争力。②增加新的负担。一是担心政策实施后需要花费较多时间和精力进行数据的管理与保存,给自己带来负担;二是担心政策实施后会增加课题结题难度。③数据的知识产权和所有权如何界定,与之相关的利益能否得到保障。④权利与义务能否平衡,如何保证共享与使用过程中的公平规范。⑤数据的安全。⑥政策的执行和落实问题。一是政策执行不力或缺少相应的保障措施,最终形同虚设;二是执行政策时一刀切或被异化(如数据提交给科研管理部门后,被个人侵吞、垄断或转让牟利等),而达不到预期效果。

问题①②反映了部分科研人员对科研数据共享持消极态度,担心政策的实施会给自己带来麻烦或不利影响。从个体角度看,科研数据的管理与保存的确会给科研人员增加一定的负担,但从长远和全局看,科研数据的管理、保存与共享最终会利人利己。因此,对这类人群应加以引导教育,一方面使他们明白科研数据共享的巨大效益;另一方面也使他们认识到,由国家或各级政府资助产生的研究成果,都属于公共财富,应无限制地向公众开放,而不能据为私有。

问题③④是由于科研人员对科研数据政策缺乏了解而产生的疑虑和担心,也说明完善的利益平衡机制是政策制定的核心与重点。而问题⑤⑥反映出部分科研人员对政策执行过程或相关保障措施的担心,科研机构在制定和实施科研数据政策时应严谨周密,广泛参考国内外有益经验并构建完善的保障措施,确保政策的实施效果。

4 结论与建议

调查表明,实验室试验、网络采集、社会调查、实地观测是我国科研人员获取科研数据的主要途径。其中,理、工、农、医领域的科研数据获取以试验为主,辅以实地观测和建模/模拟,而人文社科领域主要通过调查和网络采集的方式获取科研数据。我国科研人员缺少科研数据管理的专业知识与技能,不少人员不知道如何为数据创建索引或元数据,大多数人员发生过重要科研数据丢失或损毁的情况,数据管理的技能亟待提升。虽然大多数科研人员都有过科研数据共享经历,但主要集中于与自己关系密切或有合作关系的团队及同行,共享范围不够广泛。互助互惠是科研人员共享科研数据的主要动因,而信任是实现共享的根本保障。大多数科研人员对科研数据政策持支持态度,但也存在一些顾虑。据此,提出建议如下。

4.1 科研机构应尽快制定和实施科研数据政策

认识到数据共享的重要性并不足以促使科研人员主动进行科研数据的管理与共享,科研数据的共享面临诸多挑战。本文调查显示,部分科研人员不愿意无偿共享科研数据,或不愿意为科研数据的管理与保存付出额外成本,或担心数据丢失、泄露自己的核心竞争力、被不正当使用等。相关研究指出,在科研数据共享中,政策法规的作用不可替代,对于推动科研数据管理与共享从共识变为现实及可持续发展起着关键的作用[20]。英国、美国、澳大利亚等国家的高校大都通过制定科研数据政策以规范和促进科研数据的管理与共享[21],因而,我国高校应尽快制定科研数据政策,以更好地保障科研数据共享的发展。

4.2 构建利益平衡和信任机制是政策的核心要素

明确的产权归属和利益平衡机制是保障科研数据共享的前提与基础[22]。调查发现,一方面,部分科研人员担心科研数据管理与保存带来的负担而对科研数据政策持消极态度;另一方面,科研人员对于自己付出较大努力获得的数据不愿意无条件共享。而相关研究表明,适当的回报(共享者在需要的时候也可获得他人的科研数据)和认可(如使用者的致谢或引用等)是促进科研数据共享的重要因素[23]。本文调查表明,信任也是实现科研数据共享的重要因素,这也被相关研究所证实[24]。因此,我国科研机构在制定和实施科研数据政策时,一是可以对科研人员管理与保存科研数据予以适当资助,以补偿科研人员所付出的时间、精力和其他成本;二是要求科研数据的使用者对使用数据进行引用和致谢以鼓励共享的积极性;三是建立稳健的基础设施和完善的数据安全制度,确保数据不被窃取和丢失,以消除科研人员对于数据安全的担忧。

4.3 为科研人员管理与共享科研数据提供指导与帮助

政策并非万能,要保证科研数据共享的顺利进行,相应的服务和基础设施必不可少[25]。调查发现,我国科研人员缺少科研数据管理的技能,数据管理现状不乐观。同时,科研数据分散保存在个人手中,既不利于共享,也使数据的安全面临风险。对此,可以借鉴国外的经验,由图书馆或专门的科研数据服务机构为科研人员提供培训、咨询、指导与帮助等服务[26],帮助他们更好地管理、保存和共享科研数据,推动数据的共享。

4.4 建立科研数据存储与共享中心

除为科研人员管理与共享科研数据提供指导与帮助外,科研数据共享还离不开相关基础设施与机制的保障。调查表明,由于缺少科研数据存储与共享的公共基础设施,我国科研数据大多分散保存在个人手中,既不利于共享,也存在较大安全风险。而国外不少科研机构的政策都指出科研数据必须保存在本校的相关设施中[4],或保存在受认可的本国/国际数据服务中心[19]。我国的《科学数据办法》也将科学数据中心建设作为各责任机构的重要工作。因而,有条件的机构应尽可能建立本机构的数据共享中心,国家应建设以学科领域为核心的数据共享中心,为资源不足的机构的研究者提供数据存储与共享服务。

4.5 推动形成科研数据出版与引用机制

科研数据的出版与引用是实现数据共享的重要途径之一。本文调查表明,利益平衡机制和信任是确保科研数据共享的关键要素。科研数据出版通过公开发表的形式对数据进行公布,供数据使用者进行参考和引用,有助于借助传统文献交流机制绕开数据共享的信任“陷阱”。同时,科研数据的发表,有助于数据作为科研成果得到承认,而数据的引用或致谢也是对数据生产者的认可和回报,将有助于科研数据共享的发展。当前,我国专门的科研数据期刊还较少,亟待在借鉴国内外经验的基础上完善我国的科研数据出版与引用机制。

本文通过调查的方式,对我国科研人员获取、管理、保存和共享科研数据的现状及对科研数据政策的态度与认知进行调研,以期为我国科研机构制定和实施科研数据政策提供决策依据和参考。然而,科研数据政策的制定与实施是一项复杂的系统工程,涉及多方利益主体和多种因素,仅通过一次调查难以发现所有问题,本文的调查仅是一种尝试,未来有待在调查的深度和广度上加以扩展,为我国科研机构数据政策的制定提供多方位的参考。

猜你喜欢
数据管理科研人员政策
科技部等五部门联合发文开展减轻青年科研人员负担专项行动
政策
政策
企业级BOM数据管理概要
科研人员揭示油桃果实表皮不长毛的奥秘
定制化汽车制造的数据管理分析
科研人员破译黑猪肉特征风味物质
海洋环境数据管理优化与实践
CTCS-2级报文数据管理需求分析和实现
广东公安科研人员风采