图书馆推动数字学术发展的实践探索*

2022-10-14 13:47徐雪静
新世纪图书馆 2022年7期
关键词:馆藏科研人员学术

0 引言

随着大数据时代的到来和数据密集型科研环境形成,科学研究从重视结果转变为过程与结果并重,科研过程中产生的数据作用和价值凸显,数字工具、数据平台成为了科研人员开展工作的必备条件,数字化科研成为学术研究的主要特征和发展趋势。数字化科研的领域也从天文、环境、地球、生物科学领域扩大到社会、历史等人文领域。在这种环境下,数字学术(Digital Scholarship)的概念应运而生。由于尚未完全成熟,数字学术的内涵与外延仍在不断演变与扩充,目前学界尚未对其定义形成统一的认识。华盛顿大学将数字学术定义为广泛利用数字媒体独特能力提供的一种或多种教学和研究新可能性的学术活动

。印第安纳大学普渡分校图书馆认为数字学术包含构建(building)、创造(creating)和利用(using)3个方面,构建是指为了进一步研究和分析而进行数字化馆藏建设,创造是指为馆藏建设、分析和研究馆藏而创建适当的工具和服务,利用则是指利用数字馆藏和分析工具来产生新的知识产品

。曾熙,王晓光将数字学术定义为利用数字技术与方法介入学术研究全过程的新型研究模式

图书馆以文化传承为已任,拥有丰富的信息资源,专注于资源的组织、检索和管理,配备了数字展示、保存、出版及开放获取和数据管理的软硬件环境,与数字学术具有天然的联系

。一方面,图书馆是数字学术的孵化器,能够为数字学术的理念推广、研究讨论与实践探索提供良好的人才、空间、设施设备等条件;另一方面,数字学术是图书馆的新引擎,为图书馆的发展创新、转型与变革提供新的机会

。目前,国内学者的研究主要集中在后一方面,即图书馆围绕数字学术如何实现服务创新和空间变革方面,比如刘兹恒和涂志芳对数字学术环境下学术图书馆发展新形态进行了全面总结

,邓灵斌对美国图书馆界数字学术服务的实践进行了分析

,鄂丽君对美国研究图书馆协会的数字学术支持教育活动进行了考察

,宋家梅等对英国和爱尔兰研究型图书馆的数字学术服务进行了调研

,鄂丽君

和黄晓军

都对高校图书馆数字学术空间建设问题进行了探讨。有关图书馆如何发挥数字学术孵化器作用的研究尚不多见。鉴于此,本研究从当好孵化器这一视角,分析总结图书馆推动数字学术发展的实践,即图书馆如何能够,并确实为数据管理、分析、可视化和监管提供基础设施,教育和服务以促进数字学术发展的方式。

ESR检测:空腹采集患者静脉血,1.6 mL静脉血加入到0.4 mL含109 mmol/L枸橼酸钠溶液的真空管中,混合均匀后放入Monitor-100型自动红细胞沉降率分析仪(美国Monitor公司产品)的检测位,静置30 min后自动报告结果。正常值参考范围:1~20 mm/h。

1 开发适用于跨学科研究的数据服务

随着从事跨学科研究的科研人员和学生开始探索新兴技术(例如机器学习、容器化和高性能计算)在学术研究中的应用,许多研究图书馆建立了数字学术计划,以支持科研人员应对研究方法的转变。学术和研究图书馆是数据活动天然的合作伙伴,图书馆员拥有在整个生命周期中管理数据所需的学科、信息管理和技术知识,可以说,在数据服务方面也具有天然的优势。但由于图书馆数据服务受多种因素影响,包括对人文和社会科学领域数据驱动研究的日益重视,以及对将数据视为资产的基础设施和服务的需求等,因此,图书馆还需在开发适用于跨学科研究的数据服务方面,从以下三个方面具体体现。

1.1 收集和许可用于学术分析的数据集

数据是数字学术的基础,从传感器和网络设备连续生成的海量数据集,到大量的文本数据,再到精心收集和监管的图像集。与数字学术的发展相适应,许多图书馆将可用于挖掘和分析的授权数据集纳入其馆藏范围,精心设置对公开可用数据的访问权限,并对数据使用和重用有关的知识产权问题给予指导。图书馆可以利用其信息管理专业知识及其与供应商的关系,提供用于挖掘和分析的(大)数据馆藏,并促进对专有或敏感数据的获取。例如,在纽约大学(New York University),整个大学中数据科学的发展影响到了图书馆的馆藏,纽约大学图书馆购买了更多供应商产生的数据集,以满足用户对大数据的需求(例如大型社交媒体数据),并将API集成到其馆藏和发现环境中

。与此同时,许多图书馆已经承担起了谈判和解释许可,以允许对图书馆馆藏进行内容挖掘的角色

在许多机构中,研究计算基础架构正逐渐从本地数据中心迁移到云

。云计算可促进分布式团队之间的协作,并为无法访问本地计算资源的科研人员提供解决方案。但是,它也带来了风险。存储在商业云中的数据不再完全由科研人员控制,容易受到黑客入侵或灾难性损失的影响。根据所使用的特定服务,科研人员也可能会授予第三方获取或使用其数据的权限。无论是将数据存储在云中还是本地数据中心中,托管数据存储库基础设施的图书馆必须考虑网络的安全性。

跨机构研究图书馆计划(Cross-institutional Research Library Initiatives)努力尝试正式获取大规模数据集以进行学术分析的方法。例如,在2019年十大机构利用其集体购买力从Web of Science得到了每年13 TB的文献计量数据的授权许可。为了使十大园区的用户均可以使用这一数据,由美国博物馆和图书馆协会(Institute of Museum and Library Services,IMLS)资助的CADRE项目将原始数据处理到印第安纳大学高性能计算中心的关系数据库中。完成后,CADRE将采用标准化的数据格式,提供多种格式的数据,包括关系数据库和图形数据库格式以及平面表和本机格式,共享的和自定义/私有的计算资源,提供一个跨学科的平台,一个用于共享和存储查询、算法、派生数据、分析结果、工作流和可视化的空间

数据科学家、人文主义者和社会科学家越来越多地将图书馆馆藏作为创建和发现新知识的数据源。将图书馆馆藏用于计算研究有很多潜在优势,它们通常包含高质量的元数据,一些馆藏是开放获取的,对数据挖掘的限制少,并且许多馆藏已经使用机器可读的标准进行了结构化处理。以Collections as Data为代表的一些项目,鼓励文化遗产机构认真开发支持“计算驱动的研究和教学”的数字馆藏(许可、购买和独有的)和相关服务(例如研讨会、咨询、数字平台)。图书馆可通过开发和实施从文本或其他媒体中提取数据,清理数据并以适合分析的数据库或其他格式提供数据的过程,建立机器可读的馆藏。基于Collections as Data框架,使馆藏机器可操作,从而增加馆藏的价值。犹他大学的图书馆员对《女人指数》(一家盐湖城的报纸)的整个流程进行了数字化处理,重点关注摩门教女性,开发了用于基于网络查询的数据挖掘工具,并提供了可下载的语料库访问权限。通过绘制黑人摩门教徒的历史,探索了将计算分析应用于与其社区相关的数字化馆藏材料的可行性

为了重现结果,科研人员不仅需要获取有据可查的、公开可用的数据,还需要获取用于处理和分析数据的代码。获取用于处理数据和生成结果的计算步骤与获取数据本身一样重要

。许多数据科研人员进行探索性研究的电子实验室笔记本身并不支持广泛的共享或发布数据。与同事共享时,电子实验室笔记对环境的依赖使行为无法预测。相同的代码可能在不同的环境中产生不同的结果,或者无法完全计算出

1.2 开发支持数据使用和重用的基础设施

随着资助机构和出版商的数据存储要求的提高,以及有关数据共享研究的不断深入,支持数据共享和长期保存的基础设施需求也相应增长。图书馆维护的数据存储库、学科存储库和通用存储库(例如figshare和Zenodo)迅速增加。但是,图书馆在数据管理服务上的投入远超过了对基础设施的投入

。除了图书馆提供的有价值的数据管理计划和咨询服务外,学者也需要基础设施来支持各种格式的超大型、异构、实时、联网和复杂的数据集。他们希望基础设施能够促进分布式协作、数据重用和长期保存。但是,研究图书馆的数据存储库并不总能符合这些期望。当前的数据存储库倾向于支持与论文相关的经过处理的数据集,而教师所需要的是一种活的有机体,一个不断发展的数据库。

为了实现协作,重用驱动的数据存储库正在利用工具减少与分布式团队和分散数据集一起工作所需的计算资源和花费的精力。例如,iRODS数据管理软件将其数据存储资源虚拟化,以便用户无论在哪里,使用什么设备均可访问数据。数据虚拟化支持用户跨系统查询,而不需要下载到某一设备或在系统之间复制数据。

与许多针对数据存档进行了优化的数据存储库不同,重用驱动的数据存储库旨在支持内置分析工具,使数据与计算资源的共置,并实现持续协作,包括复杂的权限选项及地理位置分散团队的访问权限设置。使用和重用驱动的存储库类似于一个热闹的车间,该车间配备了强大的工具来处理作为原材料的大数据集,而不是作为仓库来存储数据

。在数据存储库中内置可视化工具正成为流行功能。普渡大学(Purdue University)图书馆的科研数据存储库PURR通过将GIS服务器添加到其存储库基础结构中,从而合并了地理空间数据可视化工具。Web映射功能可有效地使最终用户在下载之前预览数据集并确定其与研究兴趣的相关性,而不需要查看和处理大量地理空间数据所需的专用软件。弗吉尼亚大学(University of Virginia)图书馆与人文科学高级技术学院(Institute for Advanced Technology in the Humanities)合作,将这种方法应用于3D数据,从而为存储在Dataverse中的数据集创建了增强的接口,使用开源Web 3D浏览器3D Heritage Online(3DHOP)提供交互式3D模型供用户在下载前浏览数据

强调数据的使用和重用,要求存储库基础架构从原有的重视存储和检索功能转变为重视分析和共享功能。弗吉尼亚理工大学图书馆采用了使用和重用框架作为其数据管理及服务基础架构的“原动力”

。将学术数据集与用于创建、显示或解释它们的算法和计算环境相分离变得越来越困难。即使有大量有关“数据及其使用环境”的文档,将数据从分析的自然环境中剔除以保存在孤立的存储库中,也会大大降低其价值。

当科研人员试图通过挖掘和其他数据处理方法从不断增长的数据量中提取信息时,他们需要越来越强的计算能力。这就要求图书馆与研究计算中心之间建立程序化合作伙伴关系,以确保计算需求与数据管理需求之间保持一致。提供用于高速网络的基础架构需要在国家层面进行合作。由美国国家科学基金会(National Science Foundation,NSF)资助的太平洋研究平台(Pacific Research Platform,PRP)是区域协调的一项尝试

。由NSF资助的项目通过扩展这种方法开发了国家研究平台(National Research Platform,NRP),该平台将有助于访问分布式数据集,并使科研人员能够利用国家超级计算机设施的计算和存储资源。

目前,中国的有效灌溉面积已达到0.6亿hm2,约占全世界灌溉面积的20%。灌溉面积占全国耕地面积的49.6%,灌区生产的粮食占全国粮食总产量的75%。这正是中国以占世界6%的水资源和9%的耕地解决了占世界21%人口的粮食问题的重要基础。

随着数据授权和馆藏活动的成熟,图书馆已经注意到有必要实施同样有据可查的、系统的工作流程,以收集其他学术资源。目前,很多大学图书馆主要是应教师的具体要求购买或授权数据集。这些数据集不会被集成到图书馆馆藏目录中,也无法提供给其他潜在用户使用。弗吉尼亚理工大学图书馆(Virginia Tech Libraries)有关数据许可工作流程回顾的内部报告明确指出,这种临时方法存在固有挑战

。该报告指出“由于供应商担心专有数据的安全性以及涉及在线传输大型数据集的问题”,数据集通常通过CD、USB驱动器或硬盘驱动器提供,但是这些载体缺少相应的目录记录,因此很难控制存储情况并促进数据的发现。

北京大学房地产研究中心主任楼建波表示,《房产测量规范》提到的公摊面积计算方式在《住宅设计规范》中无相应体现,致使国内报批、设计、施工每个环节都不是特别清楚公摊如何计算,只能等着房子盖出来,测绘部门最终来测公摊大小,导致出现不少乱象。

数据密集型研究支持和数据管理要求图书馆跨界工作。除了组织数据存储库,图书馆还需要根据学科或研究兴趣,通过基础设施、监管指导、知识产权专业知识和社区建设为跨机构科研人员社区提供支持

。这些“数据社区”从图书馆获得资金和人力资源,或者与作为校园大使和作为监管人的图书馆员合作。尽管学科和其他公共数据存储库(例如figshare)显示出了很高的存储率和参与度,但是他们缺乏校园数据管理员和馆员可以建立的机构联系和关系。基于机构的数据专家和与机构无关的数据存储库之间的协调与协作可以通过确保研究人员遵循最佳实践,并且其研究成果得到保留和可重复使用来推进

本研究的不足:(1)样本量较少;(2)由于伦理要求,未能对同一患者同时行两代320排螺旋CT扫描;(3)观察者内和观察者间在灌注参数测量上的可重复性存在较多争议,观察者内的一致性可能优于观察者间[16],但临床中患者的检查与随访测量较难由同一位观察者完成。

1.3 支持可复制的科学研究

科学进步取决于科学研究结果的可复制性。随着基于计算密集型方法进行的科学研究越来越多,验证和复制结果变得越来越复杂。图书馆通过数据服务鼓励学者将数据存储在开放存储库中,并以重用性为目的考虑组织、记录和授权数据的方式。图书馆还开发软件和基础设施帮助科研人员创建和保存可复制的数据集。

随着生命科学和历史等各个领域的科研人员探索以新技术为基础的方法来查询原始资料,广泛获取现有数据的需求也日益增长。单个大数据语料库可以由不同的科研人员提出不同的问题来无限挖掘,或由计算机科学家用来训练机器学习模型。要利用数据集带来的可能性,产生这些数据的科研人员必须共享它们,并使数据以被其他人解释和重用的方式进行共享

。越来越多的研究表明,已发表的科学文献和现有数据集包含了许多隐藏的假设、见解和联系,可以通过数据挖掘和应用机器学习技术来发现

。比如科研人员以多种方式使用机器学习对抗COVID-19的大流行,通过对CT扫描图像进行分类,帮助疫苗开发,并尝试预测新的疫情。

虚拟容器为应对这一挑战提供了一种解决方案。容器技术或容器化通常被描述为“虚拟机的轻量级替代品”,它将代码、软件和操作系统捆绑在一起,以便用户可以准确地重现计算研究。诸如Docker和Singularity之类的容器技术已被广泛采用。诸如ReproZip和Binder之类的项目旨在通过学术研究界广泛使用的容器化技术来提高可重复性。ReproZip的工作方式是自动跟踪工作的执行情况,然后将所有依赖项打包在一个可分发的程序包中(RPZ文件),并与各种数据分析工具、脚本和软件语言、数据库及Jupyter等电子实验室笔记兼容

。Binder可以检索托管在Git存储库中的Jupyter笔记,建立一个容器图像来为其服务,并将该图像开放给网络上的任何人。

图书馆通过创建和重新定义员工角色支持可复制的科学研究。纽约大学于2017年首次在可复制性服务中设立了专门职位;佛罗里达大学图书馆也刊登了类似的招聘广告。在纽约大学,科研数据管理和可复制性研究支持的馆员是图书馆和数据科学中心(Center for Data Science,CDS)共同任命的双重职位,主要负责教育和宣传活动,以及支持数据服务的工具和基础架开发和建设活动

。亚利桑那大学图书馆整合数据管理最佳实践对可复制性提供支持,推广脚本/软件实现工作流程的自动化,推广支持可复制研究的工具(例如Jupyter笔记),并在工作坊和讲座中倡导采用开放式研究实践

。德克萨斯大学图书馆预测,图书馆员将成为嵌入式研究的合作伙伴,为科研人员自由获得科研数据、实验记录提供支持

。在2020年举行的首届“图书馆员建立可复制性研究的驱动力”会议上,探讨了图书馆支持可复制性的方式,包括将复制性教育纳入研究生和本科生的学习计划,研究仿真服务和其他图书馆管理的工具,并将可再复制原则应用于图书馆学研究中

2 提供并维护机器可操作的馆藏

美国国家科学院(National Academies)描述了一个愿景——科研人员可以立即获取最新出版物,并可以自由搜索论文档案,包括预印本、研究软件代码、其他公开出版物、研究结果数据库,以及与物理标本有关的数字信息,这些信息全免费且不存在其他障碍。科研人员使用最新的数据库和文本挖掘工具来探索这些资源,确定嵌入在研究中的新概念,明确可以在哪里做出新贡献

。这一愿景实现的前提是机器可操作馆藏的可用性。

由于铁路线路呈长带状,这种GPR探测测线的布设导致每条测线都很长且勘探所获数据量巨大,与GPR探测配套的专业数据处理与解释软件例如常见的RADAN7等,往往需要对每条测线分段进行数据处理和翻浆冒泥病害的人机交互解释圈定,尤其是各个翻浆冒泥病害区域底界控制点的标定,根本无法按比例尺沿铁路正线进行狭长带状区域翻浆冒泥病害底界深度等值线图的绘制。有鉴如此,本论文结合RADAN7和Surfer软件,提出了一种用于GPR勘探的铁路翻浆冒泥病害底界的等值线图绘制方法。

机器可操作的馆藏不仅非常适合于计算研究,而且非常适合人工智能和机器学习工具的开发。人工智能和机器学习工具依赖于大量结构化数据,在不久的将来,人工智能和机器学习训练算法可能会成为图书馆馆藏的主要用户。IFLA的最新博文指出图书馆馆藏包含用于开发机器学习技术的最丰富的资源

。但是,基于图书馆馆藏进行人工智能训练的陷阱也有很多。圣塔芭芭拉关于Collections as Data声明的作者指出,有些馆藏的规模也可能掩盖了他们认为代表的历史中隐藏或缺失的事物,文化遗产机构必须牢记这些缺失,并提供应对策略。与有争议的做法(例如预测性警务试图通过对历史犯罪数据的计算分析来预测犯罪和再犯)一样,数字化图书馆馆藏的大数据分析也有可能发掘新的“见解”,再现甚至加剧文化偏见和历史种族主义。该声明鼓励图书馆员在开发机器可操作的馆藏时批判地对待这些可能的偏见

3 成为数据科学教育与咨询主要力量

在过去的十年中,数据科学已经无处不在,并且从STEM领域转移到了许多其他领域。同时,大数据时代从事跨学科研究的科研人员通过使用网络传感器,挖掘和抓取技术以及其他方法可以获得TB级的复杂数据,其生成或操纵数据的能力已经远远超过了他们管理、组织数据,使其易于获取的能力。美国国家科学院(National Academies)的报告指出现在许多科学领域都涉及对大型数据集的计算分析,人文和社会科学领域的科研人员也转向数据密集型方法

。随着数据科学的快速发展,即使本科生也存在获取大数据以进行数据分析的需求。一方面,大数据数量巨大,而且具有穷尽性和多样性,及时性和动态性,混乱和不确定性,高度关联性等特点,致使处理大数据极具挑战性。另一方面,由于缺乏必要的经验和专业知识,有效地从大数据集中提取价值成为科研人员面临的最大难题。当使用海量、复杂、异构和可变的数据集时,科研人员需要工具,同时也需要接受教育和培训以进行数据分析、共享和发布。

为此,图书馆积极开展数据科学教育咨询服务,成为推动数字学术发展的主要力量。图书馆努力将大数据分析的能力带给人文和社会科学领域的科研人员,支持他们探索新的研究方法,深化用户对数据科学的认识,鼓励用户对数据科学进行批判性思考

。加州大学伯克利分校图书馆(UC Berkeley Libraries)数据科学服务的核心目标是揭开数据科学的神秘面纱,从各个方向构建通往数据科学的新渠道

。为了让跨学科的学者和学生了解和使用数据科学,一些图书馆启动了包括工作坊和非学分课程在内的教育计划。例如,佐治亚理工学院(Georgia Tech)图书馆员以合作方式提供3D建模、编程语言、网络抓取、其他数据科学和数字学术方法,以及针对非数据密集型专业学生的数据素养课程。哥伦比亚大学(Columbia University)图书馆提供研究计算基础课程,为本校研究生和博士后提供非正式培训,开发利用计算的基本技能,并建立起使用计算密集型方法的科研人员社区。一些图书馆开发了基于实验室的教学项目,邀请协作团队一起应对数据科学和数字学术的挑战。例如,99 AI挑战,它是由多伦多大学图书馆赞助的活动,该活动召集99名没有技术背景的学生、教职员工和其他社区成员,共同学习和批判地使用AI技术

。以项目为中心的实验室教学项目鼓励用户更深入的参与,并可以建立长期的合作伙伴关系。它还可以帮助图书馆为新兴技术项目提供负责任的、可持续的支持,通过邀请“来自图书馆和信息技术组织的合作伙伴,以帮助创建适合实验室任务核心的通用学术解决方案和最佳实践。

奖品揭晓日期虽五花八门,但最多的还是在11月11日,剁手节。一些网友在看完奖品名单后感慨,奖是一个没中,反倒被礼品清单种了草。我也是在微博和淘宝之间反复切换。

需要注意的是,图书馆在聘请数据专家方面面临许多挑战。亚利桑那大学图书馆内部数据专家Jeffrey Oliver在数据管理计划中与其他图书馆员合作,并为生命科学研究者提供生物信息学支持,尤其是在数据分析和可视化方面。Oliver认为就让科研人员与图书馆内部和外部的资源建立联系方面,图书馆发挥着关键作用,应提供基本的教育和指导,并帮助建立起长期的研究合作伙伴关系。当雇用数据专家不可行时,提高现有馆员的技能是一个不错的选择。例如,北卡罗莱纳州立大学成立了面向图书馆员的数据科学和可视化研究所(Data Science and Visualization Institute for Librarians,DSVIL),通过提供一系列有关软件工具和与数据分析、可视化、共享和重用相关的技能的强化培训,解决了图书馆员当前在数据科学方面的技能差距

自主学习能力能够在英语实践中获得有效的开发与提升。不但个体因素会对学生自主学习能力的培养与提高有着影响,外在因素也不容忽视。以往单一的教学模式已难以满足学生发展的需求,而混合式教学模式则能够为培养与提高学生的英语自主学习能力提供了一个重要途径。具体培养策略如下:

4 结语

图书馆数据服务长期以来一直专注于基础设施,教育和倡导支持数据归档。新兴技术和科研人员不断变化的期望正在促使图书馆转向开展以数据使用和重用为中心的数据服务。开展以数据使用和重用为中心的数据服务,要求图书馆实现基础设施的重新开发,以支持数据分析和主动协作;要求图书馆使用软件和工作流将科研数据集与解释和复制结果所必需的代码和操作系统包装在一起;要求图书馆继续倡导明确支持数据重用,重新定位和挖掘的许可条款。图书馆通过提供并维护机器可操作的馆藏,为人类和机器用户通过数据挖掘和分析从数字馆藏中获取见解做好准备,对机器可操作性的投资有助于进一步增强数字化馆藏的价值,使其成为图书馆最有价值的资源。作为提供数据科学教育和咨询的主要力量,图书馆主导的工作坊和教育计划可以促进科研人员对数据科学进行批判性思考,通过将大数据分析方法和工具提供给人文和社会科学研究领域的科研人员,支持他们探索新的研究途径。在促进数字学术发展的同时,图书馆面临着专业人员短缺的难题,对于具有数据科学教育和经验的专业人员,图书馆将面临行业的激烈竞争。由于图书馆员要在新能力与现有职责之间取得平衡,因此重新培训现有馆员也会面临诸多挑战。总之,图书馆应密切关注新技术的发展,在收集和许可用于分析的数据集、开发支持数据使用和重用的基础设施、支持科学研究的可复制性三个方面,不断开发和优化面向跨学科研究的数据服务,同时通过提供并维护机器可操作的馆藏增加馆藏价值,担当数据科学教育与咨询主要力量等实践工作,扮演好数据学术孵化器的角色,为数字学术的理念推广,研究讨论与实践探索创造良好的环境和条件。

[1]University of Washington. About digital scholarship [EB/OL].[2021-02-15].https://lib.washington.edu/digitalscholarship/about.

[2]INPUI University Library. What is digital scholarship?[EB/OL].[2021-02-15].https://www.ulib.iupui.edu/digitalscholarship/mission.

[3]曾熙,王晓光.数字学术:概念、特征与案例分析[J].数字图书馆论坛,2019(3):2-10.

[4]王贤.美国伊利诺伊大学香槟分校图书馆数字学术服务及启示[J].图书情报工作,2018,62(11):143-150.

[5]涂志芳,徐慧芳.国内外15 所高校图书馆数字学术服务的内容及特点[J].大学图书馆学报,2018,36(4):29-36.

[6]刘兹恒,涂志芳.数字学术环境下学术图书馆发展新形态研究:以空间、资源和服务“三要素”为视角[J].图书情报工作,2017,61(16):15-23.

[7]邓灵斌.美国图书馆界数字学术服务的实践及其有益借鉴[J].情报理论与实践,2020,43(11):187-191.

[8]鄂丽君.美国研究图书馆协会的数字学术支持教育活动考察与启示[J].情报资料工作,2019,40(3):104-112.

[9]宋家梅,王芳,白如江.英国和爱尔兰研究型图书馆的数字学术服务[J].图书馆论坛,2021,41(4):147-154.

[10]鄂丽君.美国高校图书馆数字学术空间建设调查分析[J].图书与情报,2017(4):18-24.

[11]黄晓军.高校图书馆数字学术服务空间的构建与思考[J].图书与情报,2019(1):106-110.

[12]MUILENBURG J, RUTTENBERG J. New collaboration for new education: libraries in the Moore-Sloan Data Science Environments [J].Research Library Issues,2019(298):16-27.

[13]MARCO C, GUIBAULT L. Baseline Report of Policies and Barriers of TDM in Europe [EB/OL].[2021-02-15].https://project.futuretdm.eu/wp-content/uploads/2017/05/FutureTDM_D3.3-Baseline-Report-of-Policies-and-Barriers-of-TDM-in-Europe.pdf.

[14]YOUNG P,HAUGEN I,LENER E F, et al. Library support for text and data mining: a report for the University Libraries at Virginia Tech[EB/OL].[2021-02-15].https://vtechworks.lib.vt.edu/bitstream/handle/10919/79483/DiggingDeeperIntoTextAndDataMi ning-VLAandVLACRL-2017.pdf.

[15]Indiana University Network Science Institute. Collaborative archive & data research environment[EB/OL].[2021-02-15]. https://iuni.iu.edu/projects/cadre.

[16]KITCHIN R. Big data, new epistemologies and paradigm shifts[J]. Big Data & Society,2014(1):1-12.

[17]RODRIGO G P, HENDERSON M, WEBER G H, et al.ScienceSearch: enabling search through automatic metadata generation[C].IEEE 14th International Conference on E-Science (e-Science).2018:93-104.

[18]FANIEL I M,CONNAWAY L S. Librarians’ perspectives on the factors influencing research data management programs [J]. College & Research Libraries,2018,79(1):100-119.

[19]XIE Z, FOX E A. Advancing library cyberinfrastructure for big data sharing and reuse[J]. Information Services& Use,2017,37(3):319-323.

[20]XIE Z, CHEN Y, SPEER J, et al. Towards use and reuse driven big data management[C]. JCDL ‘15:Proceedings of the 15th ACM/IEEE-CS Joint Conference on Digital Libraries. New York:2015: 65-74.

[21]CLIR. 3D/VR in the academic library: emerging practices and trends[EB/OL].[2021-02-15].https://www.clir.org/wp-content/uploads/sites/6/2019/02/Pub-176.pdf.

[22]RICHARD M. The second National Research Platform Workshop: toward a National Big Data Superhighway[EB/OL].[2021-02-15].https://ucsd-prp.gitlab.io/images/reports/2NRP_Workshop_Report_finalsmall-9-20-18.pdf.

[23]DIALANI P. The future: AI-fueled organizations[EB/OL].[2021-02-15].https://www.analyticsinsight.net/the-future-ai-fueled-organizations/.

[24]COOPER D, SPRINGER R. Data communities: a new model for supporting STEM data sharing[EB/OL].[2021-02-15]. https://digitalcommons.unl.edu/scholcom/109/.

[25]CHODACKI J, DANIELLA L, ELIZABETH H.Advancing data publishing: the future of Dryad[EB/OL].[2021-02-15]. https://ui.adsabs.harvard.edu/abs/2018AGUFMIN52B..07C/abstract.

[26]STODDEN V, MCNUTT M, BAILEY D H, et al.Enhancing reproducibility for computational methods[EB/OL].[2021-02-15].https://web.stanford.edu/~vcs/papers/ERCM2016-STODDEN.pdf.

[27]WATSON S, BENTON W. Why data scientists love Kubernetes[EB/OL].[2021-02-15].https://opensource.com/article/19/1/why-data-scientistslove-kubernetes.

[28]STEEVES V, RAMPIN R, CHIRIGATI F. Using reprozip for reproducibility and library services[J].IASSIST Quarterly,2018,42(1):1-14.

[29]STEEVES V. Reproducibility librarianship [J]. Collaborative Librarianship,2017,9(2):80-89.

[30]OLIVER J C, KOLLEN C, HICKSON B, et al. Data science support at the academic library[J]. Journal of Library Administration,2019,59(3):241-257.

[31]Task Force on the Future of UT Libraries[EB/OL].[2021-02-15].https://provost.utexas.edu/initiatives/task-force-on-the-future-of-the-ut-libraries/.

[32]OSF.Librarians building momentum for reproducibility[EB/OL].[2021-02-15].https://osf.io/meetings/LBM4R/#!.

[33]National Academies of Sciences, Engineering, and Medicine. Open Science by Design: Realizing a Vision for 21st Century Research [EB/OL].[2021-02-15].https://www.arl.org/wp-content/uploads/2018/09/2018.09.26_FLMM_McCray_OpenScience.pdf.

[34]WITTMANN R, NEATROUR A, CUMMINGS R, et al.From digital library to open datasets[J].Information Technology and Libraries,2019,38(4):49-61.

[35]IFLA Library Policy and Advocacy. The robots are coming? Libraries and artificial intelligence[EB/OL].[2021-02-15].https://blogs.ifla.org/lpa/2018/07/24/the-robots-are-coming-libraries-and-artificialintelligence/.

[36]THOMAS P, LAURIE A, HANNAH F, et al. The Santa Barbara Statement on Collections as Data[EB/OL].[2021-02-15].https://zenodo.org/record/3066209#.YCtqmkl7mUk.

[37]BOYD D, CRAWFORD K. Critical questions for big data: provocations for a cultural, technological, and scholarly phenomenon[J]. Information, Communication& Society,2012,15(5):662-679.

[38]University of Toronto Libraries. The 99 AI Challenge[EB/OL].[2021-02-15].https://onesearch.library.utoronto.ca/ai-challenge.

[39]NC State University Libraries. Data Science and Visualization Institute [EB/OL].[2021-02-15].https://www.lib.ncsu.edu/datascience-and-visualizationinstitute.

猜你喜欢
馆藏科研人员学术
树德娃的太空之旅 学习设计
名家书画:浙江省文史研究馆馆藏书画作品选刊
Chinese Traditional Medicine
实现三代功能化轮烷树状分子合成
科学数据需共享科研围墙也要拆除
企业科研人员激励问题及对策研究
快来看,科学家都支持睡懒觉啦
2004年~2012年档案馆与图书馆馆藏量发展比较
介绍两件馆藏青铜器
董进霞 治的是学术 过的是生活