我国海洋信息研究发展现状及对策建议*

2020-02-02 08:19杨远征唐世林李莎徐超马丽丽李桂菊
科技促进发展 2020年11期
关键词:海洋文献领域

■ 杨远征 唐世林 李莎 徐超 马丽丽 李桂菊

1.中国科学院南海海洋研究所海洋信息服务中心 广州 510301

2.科技大数据湖北省重点实验室(中国科学院武汉文献情报中心)武汉 430071

0 引言

海洋信息主要包括海洋资源信息、海洋经济信息、海洋环境信息、海洋基础地理信息、海洋情报文献信息和海洋法规信息等[1],可见海洋信息资源是基础性和战略性资源。易受月球引力等外界影响的海洋跟陆地具有完全不一样的特性:空间范围大、瞬息万变和界限的不确切等特性,这些特性决定了人类在了解海洋有很大的挑战。据统计人类对海洋的了解不足5%,也就是说95%的海洋人类缺乏了解[2],那么,作为人类开展一切海洋活动基础的海洋信息[3]在了解海洋、经略海洋过程中所进行的研究也就势在必行。同时,随着国家海洋强国和21世纪海上丝绸之路建设等国家海洋战略的不断推进,中国在认识海洋、管理海洋和开发海洋过程中对各类海洋信息的需求在数量和质量上的要求必将越来越高。因此,加大力度开展海洋信息研究具有重要意义。

从国内外海洋信息化建设进展来看,海洋信息建设过程是以海洋信息基础设施为保障,针对人类认知海洋的具体需求,利用信息技术最终实现海洋信息应用服务[4]。随着国家不断推进海洋事业的建设,我国在海洋信息方面加大了建设步伐,从而带动了国内海洋信息的研究热潮。首先,在海洋信息基础设施建设方面,2003~2011年我国建设了数字海洋信息基础框架,并取得了数字海洋标准体系、数字海洋网络和数字海洋仓库等一系列研究成果,为我国数字海洋的全面建设奠定了坚实基础,也为我国海洋信息的发展打牢了基础[5-6]。其次,在海洋信息技术研究方面,已有文献主要是探讨了信息技术在海洋领域的具体应用,比如华彦宁等[7]总结了云计算的关键技术,并实践了云计算在海洋环境信息领域的应用效果;嵇晓峰等[8]提出并实例验证了海洋流场流向、流速等特征信息的动态流线可视化技术,提升了流场时空特征和复杂动态过程的可视化效率;李晓峰等[9]提出了适合于海洋遥感影像的深度学习模型,并在海岸带水淹区域制图、溢油区域提取和舰船检测等八个典型海洋遥感应用方面验证了其精准性和高效性。而海洋信息的建设最终主要应用在海洋管理、海洋开发、海洋灾害防御和海洋权益维护等各个方面,沈少青等[10]利用GIS、GPS、传感等信息技术,建立了一个集成多种监测手段、融合各类海洋自然和人文数据的深圳市海洋综合管理信息平台,用于支撑海洋空间管理、海洋环境保护和海洋经济发展等多项管理业务;王丽琳等[11]采用数据库、中间件和可视化等信息技术,建立了一套集成专题地图、观测数据、预报及减灾产品的东海区海洋观测预报减灾信息可视化系统,为防灾减灾工作提供了辅助决策服务。另外,以往对海洋信息领域的系统性综述中,主要采用传统的文献综述方法对海洋信息在获取、传输、处理及融合方面的研究[12]、海洋环境信息的可视化研究[13]、物联网技术在我国海洋领域的研究[14]、海洋地理信息系统的研究[15]等进行了论述。以上研究归纳总结了我国海洋信息相关理论和实践方面的研究成果,并在不同程度上推动了我国海洋信息领域的发展。

然而,现有关于海洋信息领域的研究主要包括海洋信息基础设施研究、海洋信息技术研究、海洋信息应用服务研究和海洋信息理论研究等,鲜有文献是基于系统性地量化分析海洋信息研究文献的方法,从宏观上较全面客观揭示国内海洋信息领域的阶段性研究成果、研究热点和研究前沿等研究现状。鉴于此,本文尝试利用CiteSpace 系统性地量化分析国内海洋信息领域研究文献,利用文献计量学和知识图谱方法对国内海洋信息领域研究文献进行信息挖掘和图谱分析,梳理我国海洋信息研究的现状与发展历程,归纳我国海洋信息的研究力量、热点以及前沿,从而客观展现了我国海洋信息研究的总体状况,以期为准确掌握我国海洋信息研究状况、深入研究和实践探索提供理论和情报参考。同时,在此基础上,参考和借鉴我国海洋信息研究现状,准确把握海洋信息发展趋势,突破海洋信息技术,从而提升系统抢救、收集和电子化我国南海及其附属岛礁海洋科学考察历年来所取得的珍贵历史数据和史料的整编水平,提升南海海洋重点数据库建设与应用服务水平,提升海洋环境信息等海洋科技大数据支撑服务水平。

1 方法与数据

1.1 研究方法

CiteSpace 软件是由美国德雷赛尔(Drexel)大学陈超美教授[16]开发的对某一研究领域文献进行计量,并可以绘制出该研究文献的作者、关键词、研究机构、国家和术语(文献标题和摘要)等知识图谱的一款信息可视化软件。本文借助CiteSpace软件,以中国海洋信息研究领域的文献为研究对象,分别通过选择软件中的Institution(机构)、Author(作者)和Keyword(关键词)等选项,得到该领域的研究机构、关键词和作者等知识图谱,并对相应知识图谱进行分析其研究力量、热点、演变路径及前沿等。

1.2 数据来源

中国知网(China National Knowledge Infrastructure,简称CNKI)是世界上最大的连续动态更新的中国学术文献数据库[17],文中数据来源于CNKI,从而确保了本文的研究具有全面性和客观性。另外,虽然CNKI 收录了众多学术期刊,但期刊的差距较大,因此,本文选定文献的来源类别为:“SCI来源期刊”、“EI来源期刊”、“核心期刊”以及“CSSCI来源期刊”并使用CNKI高级检索,检索时间为2019年12月20日,以“海洋信息”or“数字海洋”or“海洋数据”or“海洋资料”为检索主题,检索1992~2019年间的文献共862 篇,剔除不相关的文章及卷首语等非学术性文献,并删除重复文献,最终选择810篇高相关的中文期刊论文作为研究对象。

2 结果与分析

2.1 中国海洋信息研究文献量的时序分析

文献量是衡量一个研究领域发展状况的重要尺度之一[18]。整理出检索到的1992~2019年810 篇海洋信息研究的核心期刊文献,并绘制出以年份为横坐标,文献量为纵坐标的文献量变化趋势图(图1)。从图1可以看出,中国海洋信息研究的文献量呈“S”型上升趋势,可以分为3 个阶段:(1)起步阶段(1992~1999年),这一阶段发文量仅为71 篇,占总文献量的8.77%.(2)快速增长阶段(2000~2013年),该阶段文献量为407 篇,占总文献量的50.24%,并且文献量呈线性增长趋势。(3)持续发展阶段(2014~2019年),该阶段在2014年的文献量比2013年有所减少,并且年文献量有起伏,不过仍保持年平均文献量55.33 篇的较高水平。这3 个阶段在一定程度上反映了我国海洋信息研究的总体发展状况。

2.2 我国海洋信息研究力量分析

2.2.1 海洋信息研究机构共现分析

研究机构是组织研究者进行领域研究的重要依托。研究机构共现分析可以识别出某一研究领域的核心机构及研究机构之间的合作情况。通过CiteSpace,选择机构(Institution)为网络节点类型、时间跨度为1992~2019年、时间切片为1 及阀值选择TOP100 生成由75 节点,49条连线组成的海洋信息研究机构共现知识图谱(见图2),图中节点代表研究机构,节点的大小反映了该机构的发文量,节点之间的连线代表机构之间具有合作关系。图中共有75 个节点,49 条连线,网络密度仅为0.0177,网络密度值在0 至1 范围,值越接近1 则说明彼此间关系越紧密[19],因此,国内海洋信息研究机构之间的合作交流较少,也在一定程度上反映了先进的海洋信息技术与宝贵的海洋信息资源无法实现高利用率的共享,从而在某些方面限制了我国海洋信息领域的发展。另外合并二级机构、附属机构及名称变更机构,得到发文量4 篇及以上的研究机构共有10 个,具体详见表1所示。

从科研实力来看,不同机构间海洋信息研究能力存在较大差异。结合图2和表1可知,国家海洋局(现自然资源部)和中国科学院的发文量是最多的分别为108 和82,主要原因是国家海洋局和中国科学院的二级机构较多,也表明了国内海洋信息研究集中在国家海洋局和中国科学院。另外,发文量在4 篇及以上的机构有10 个,共发文量283 篇,占总发文量的34.94%,可见,研究机构之间的海洋信息研究能力相差悬殊,在一定程度上反映了海洋信息研究经费投入和科技资源分布上存在不均衡。从研究机构的区域角度来看,海洋信息研究机构分布不均衡,沿海区域发文数量较多,内陆地区较少,主要原因是国内海洋类高校和海洋研究机构集中于沿海地区。

图1 1992~2019年中国海洋信息研究文献量变化趋势

表1 海洋信息研究机构发文量统计(发文量≥4篇)

图2 海洋信息研究机构共现知识图谱

2.2.2 海洋信息研究作者共现分析

作者共现知识图谱能够识别出一个研究领域作者的发文量及其之间的合作关系[20]。运用CiteSpace软件,选择作者(Author)为节点类型、时间跨度为1992~2019年、时间切片为1 及阀值选择TOP100 生成了由162 个节点,167 条连线组成的海洋信息研究作者共现知识图谱(图3),图中的节点大小表示作者发文量的多少,节点之间连线表示作者之间的合作关系。从图中可以识别出,发文最多的是黄冬梅,达到23 篇;发文有6 篇的作者是杜云艳、姜晓轶、李莎、李四海、许建平、苏奋振;发文5篇的作者是王振华、张峰。从作者之间合作角度看,形成了4 个主要的研究团队:上海海洋大学的黄冬梅、王振华、杜艳玲组成的研究团队,国家海洋信息中心的姜晓轶、蒋冰、李四海、张峰等组成的研究团队,中科院地理科学与资源研究所的苏奋振、杜云艳组成的研究团队,国家海洋局第二研究所的许建平、刘增宏、孙朝辉、李宏等组成的研究团队。显然,研究团队的成员大多来自同一研究机构,作者之间的合作大多是在同一机构研究团队内部,因此,应加强不同的机构研究团队之间的合作交流,促进海洋信息领域的发展。

2.3 我国海洋信息研究演变路径梳理

2.3.1 关键词共现分析

关键词是文献核心内容的高度概括,那么,通过关键词出现的频次能够识别出研究领域的研究热点[21]。使用CiteSpace,设置时间跨度为1992~2019年,时间切片为1年,阀值选择TOP100,节点类型为关键词(Key‐word),采用寻径网络进行剪裁方式,运行软件后得到由104个关键词节点和75条连线组成的海洋信息研究的关键词共现知识图谱(图4)。

图4中,十字架大小表示关键词出现的频次,连线表示节点之间的关系。海洋信息研究领域的关键词(按频次由高到低)主要有数字海洋、数据处理、海洋、海洋环境、可视化、南海、云计算、数据库、质量控制、海洋数据、海洋地质、数据仓库、三维可视化、数据采集、大数据、地理信息系统、海洋观测、数字地球、海洋大数据、卫星测高、海洋监测数据、数据挖掘等关键词,这些关键词是国内海洋信息研究学者重点关注的内容。根据Donohue提出的关键词频次高低划分公式:T=[-1+(1+8I)1/2]/2(I是关键词的总个数,T是高频词的最低次数)[22],计算出海洋信息研究领域的T为14,即频次为14次及以上的关键词是该领域的高频关键词,数字海洋(29次)和数据处理(16 次)是仅有的2 个高频关键词,高频关键词占总数的1.92%,说明中国海洋信息研究的内容较广泛,但可能不够深入。

2.3.2 关键词演变趋势

图3 海洋信息研究作者共现知识图谱

图4 海洋信息研究关键词共现知识图谱

关键词演变趋势可以通过关键词时区视图揭示各个关键词随时间的演进情况[23]。运用CiteSpace软件,设置时间跨度1992~2019年,为了更好地展现关键词总体的演变趋势,时间切片选择为4年,可视化视图选择时区视图(Timezone View),得到了1992~1995、1996~1999、2000~2003、2004~2007、2008~2011、2012~2015、2016~2019年共7个时间段的中国海洋信息研究的关键词演变图(图5)。从图5可以看出,1992~1998年,数据处理、数据库、质量控制、海洋数据、海洋资料浮标是研究重点,1999年以来,数字海洋、资料同化、地理信息系统、元数据、数据挖掘、数据集成、信息服务、网格、可视化陆续成为海洋信息研究学者所关注的热点关键词,近几年,云计算、海洋大数据、物联网、深度学习等新一代信息技术是热度较高的关键词。由此可见,海洋信息的每一次的跨越式发展,都得益于信息技术的发展。当前,以物联网、大数据、人工智能为代表的新一代信息技术革命正深刻改变着社会各行各业,海洋领域也不例外。

2.3.3 关键词聚类分析

使用CiteSpace 的最大似然法(Log-Likelihood Ratio,简称LLR)对海洋信息研究关键词共现知识图谱进行聚类并选择时间线视图(Timeline)按钮得到海洋信息研究的关键词聚类图(图6)。从图6可以看出,海洋信息研究领域形成了包括质量控制、数据融合、气候预测、浮标、netcdf、海洋、海洋监测数据、水文要素、数字海洋、物联网、资料同化和时空特征共12 个聚类,Q 值是0.8397,S值是0.5561。一般而言Q 值在[0,1]区间内,意味着结构显著的,S 值在0.5 以上,一般认为聚类是合理的[23],因此,1992~2019年海洋信息研究关键词所有聚类不仅合适而且聚集特征很明显,同时很多聚类之间既有关联又有不同的,说明学科之间、研究方向等融合交叉密切,研究范围较为广泛。根据我国海洋信息研究关键词聚类图,可将该领域主要研究方向分成以下几个方面:(1)海上自动观测站、海洋浮标、海洋卫星等海洋信息基础设施研究;(2)数据融合、数据库系统、数据挖掘、大数据、云计算、物联网等海洋信息技术研究;(3)虚拟场景、高分辨率、海洋资料同化、数据共享、可视化、气候预测等海洋信息应用与服务研究。

图5 中国海洋信息研究的关键词演变图

图6 中国海洋信息研究的关键词聚类知识图谱

通过以上对我国海洋信息研究的关键词共现图、演变趋势图以及聚类图的分析,可进一步梳理出我国海洋信息研究的演变路径:(1)海洋信息发展的起步阶段(1992~1999)。该阶段主要是海洋信息的数字化。这个阶段的主要研究热点有海洋资料浮标、数据处理、质量控制以及数据库等传统的研究,海洋信息研究学者对海洋监测、调查等传统手段获取的各种海洋要素的数据以数字编码形式进行储存、传输、加工、处理和应用等数字化处理,为海洋信息化奠定了基础。不过由于我国海洋信息研究起步比较晚,当时信息技术在我国还没有完全普及,很多海洋信息技术只停留在理论的探索阶段,并没有得到实际上的应用,比如,蔡明理等[24]学者在理论上介绍了海洋地理信息系统的构成、工作流程和功能,但并没有在实践中应用海洋地理信息系统。(2)海洋信息发展的快速发展阶段(2000~2013)。该阶段主要是海洋信息的网络化。文献量以及热点关键词在这个阶段快速增长,主要热点关键词有数字海洋、海洋环境、海洋资料同化、数据挖掘、数据共享、可视化、云计算和大数据等方面的研究。同时,这个阶段的海洋信息研究一方面促进了地理信息系统、数据挖掘、可视化与海洋信息的融合与发展,实现了对来源广泛、种类繁多的海洋信息资源的采集、存储、交换、共享和应用等方面的管理,并网络化后向互联网用户共享发布了各渠道获取的海洋信息[15,25-31];另一方面,国家海洋局启动了我国首个全国范围内的大型海洋信息系统工程项目“数字海洋”的建设,该项目网络化分布在国家和11个沿海省(自治区、直辖市)海洋行政主管部门的海洋信息资源,并实现了海洋信息的分布式交换与共享服务[6,32]。(3)海洋信息发展的持续发展阶段(2014~2019)。该阶段主要是海洋信息的智能化。这个阶段主要研究热点是物联网、云计算、大数据和深度学习等新一代信息技术在海洋领域的应用[33-38],可见海洋信息智能化的热潮已经来临,海洋信息应用的层次与水平从此进入了更高阶段。物联网是人与物、物与物相连的智能化网络[39],能够实现海洋信息的实时获取,而海洋环境是瞬息万变的,那么,通过实时的海洋信息能更好地认识海洋,不少学者针对海洋环境数据或信息的特点,通过物联网技术实现了海洋环境监测系统对海洋环境数据或信息的实时采集、收发和控制等智能化操作[40-42],另外,有学者运用深度学习等人工智能技术将海洋多源数据进行融合分析实现海洋信息相关应用[43-44],帮助人类更好认知海洋和经略海洋。

2.4 我国海洋信息研究前沿探析

陈超美[45]将研究前沿定义为一组突现,突现(Burst)指关键词、术语或文献被引频次在某个时间范围突然增加,在CiteSpace中用“突现率”表示,另外,关键词是文献核心内容的高度概括,那么,通过CiteSpace 得到关键词的突现率能够识别出该领域的研究前沿。在1992—2019年海洋信息研究关键词知识图谱的基础上,使用CiteSpace 软件的Visualization 菜单中的Citation/Fre‐quency burst history 功能后,得到了5 个中国海洋信息领域的突现词(见表2)。

根据表2的突现词的突现率起止时间,可以识别出我国海洋信息研究各阶段的研究前沿:最早出现较强突现率的是在2001年,因此,基于突现率检测的研究前沿是从2001年开始算起;从表2可以看出数据处理是中国海洋信息突现时间最长的突现词,可见在长达11年之久的时期内数据处理一直是中国海洋信息研究人员研究的重点;数字地球和数据仓库分别是2001~2003年、2005~2009年的研究前沿;数字海洋在2008~2012年成为突现率最强的研究前沿;随着国家的发展和信息技术的不断进步,新一代信息技术云计算在2015~2019年占据了国内海洋信息领域研究前沿的位置。随着新一代信息技术不断进步及国家海洋战略的不断推进下,新一代信息技术将有可能继续成为新的研究前沿趋势,新一代信息技术与海洋学科将深度融合,并在海洋领域的应用更加广泛和成熟,国内海洋信息领域将因此实现变革与突破式发展。

表2 中国海洋信息研究突现词统计

3 结论与讨论

3.1 结论

CiteSpace 可视化分析软件具有针对研究文献进行定量分析某一学科领域的研究力量、研究热点、演变路径和发展态势的功能,本文在海洋信息领域中得到了很好的应用,通过在CNKI 数据库中收录的海洋信息研究的文献进行相关的可视化分析,得出以下结论:(1)我国海洋信息研究力量:从空间格局上看,我国海洋信息的研究力量主要分布于沿海地区。我国海洋信息研究形成了研究人员之间的核心—边缘型社会网络结构,形成了以黄冬梅、姜晓轶、苏奋振、许建平等学者为核心的研究团队,并且涉及到了信息学、地理学、海洋学等多个交叉学科背景,以及形成了国家海洋局、中国科学院、上海海洋大学、中国海洋大学等为首的研究机构。不足之处在于研究机构之间以及研究团队之间的合作交流较少,因此,应加强国内合作交流。(2)我国海洋信息研究热点主要有“数字海洋”、“可视化”、“海洋观测”、“数据处理”、“数据库”、“大数据”、“云计算”等。(3)我国海洋信息发展的演变路径:①1992~1999年海洋信息数字化奠定了基础。海洋信息研究者对海洋监测、调查等传统手段获取的各种海洋要素的数据以数字编码形式进行储存、传输、加工、处理和应用等数字化处理,为海洋信息化奠定了基础;②2000~2013年海洋信息网络化打造了互联互通的海洋信息服务平台。通过互联网技术,促进了海洋数据或信息的汇聚、管理、共享和交换,并向互联网用户共享发布了各渠道获取的海洋信息;③2014~2019年海洋信息智能化展现了海洋信息的实时采集、接受和处理的能力,通过物联网技术实现了多源海洋数据实时获取、接收,并利用了深度学习等人工智能技术将多源数据进行融合分析实现海洋信息相关应用,帮助人类更好认知海洋和经略海洋。(4)云计算在2015~2019年成为了研究前沿并在未来新一代信息技术有望继续成为新的研究前沿趋势。

3.2 讨论

(1)海洋信息研究领域是具有海洋学、信息技术学、地理学、气象学等学科背景的研究领域,应充分整合各个学科领域的知识、方法和技能。因此,应加强不同学科背景的学者之间的合作以及研究机构之间的合作,并将各个学科的优势交叉融合贯穿于海洋信息研究的全过程,实现海洋信息技术和海洋信息资源高利用率的共享,促进海洋信息领域发展。

(2)泛在、智能的海洋信息生态系统是海洋信息领域未来的发展方向。图灵奖得主Allen Newell和诺贝尔奖得主Herbert A.Simon 定义智能为“适应环境变化,实现自身目的”[46]。那么,针对海洋面积大、瞬息万变等特点,泛在、智能的海洋信息生态系统是在广泛存在的海洋环境中利用物联网、大数据、人工智能等新一代信息技术,能够无时无刻地做到海洋信息的智能采集、汇聚、管理、处理、分析和预判等,实现全面了解海洋、认识海洋和经略海洋。

(3)加强海洋信息关键核心技术攻关。信息技术具有很强渗透、溢出、带动和引领等效应[47],信息技术创新和应用已经成为推动海洋信息不断发展的重要手段,因此,海洋信息关键核心技术创新能力直接关系到海洋信息的总体水平。虽然国内不少海洋信息研究者利用SkyLine,World Wind,Google Earth等国外的可视化技术实现了海洋信息可视化[48-50],并取得了良好效果,但在海洋信息领域要形成核心竞争力,必须提升自主研发水平,把关键核心技术掌握在自己手中,特别是在美国发布了数据分析技术、人工智能和机器学习等14大门类的先进技术管制清单的背景下[51],提升关键核心技术创新能力,切实解决制约海洋信息发展的“卡脖子”技术,为海洋信息发展提供坚实的技术支撑。

(4)加强海洋社会科学类信息的研究。上文已分析总结出了国内海洋信息领域的主要研究方向是海洋信息基础设施研究、海洋信息技术研究和海洋信息应用与服务研究等海洋自然科学类信息方面的研究。海洋社会科学类信息是相对于海洋自然科学类信息而言,海洋社会类数据可分为海洋战略数据、海洋经济数据和海洋文化数据[52],并且建设海洋强国需要发展海洋文化等海洋社会科学[53],那么,加强海洋社会科学类信息的汇聚、管理和分析等方面的研究,把海洋自然科学类信息与海洋社会科学类信息有机结合起来,才能更加全面客观地认识海洋和经略海洋,更好地理解国家海洋战略的丰富内涵,助力构建中国特色的海洋强国。

猜你喜欢
海洋文献领域
电子战领域的争锋
将现代科技应用于Hi-Fi领域 Perlisten S7tse
Hostile takeovers in China and Japan
2020 IT领域大事记
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
领域·对峙
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
爱的海洋
第一章 向海洋出发
The Role and Significant of Professional Ethics in Accounting and Auditing