国内外应用数学领域发展情况的文献计量分析

2021-07-09 04:31车子璠张月王东洋路宽沙锐
情报工程 2021年3期
关键词:主题词聚类文献

车子璠 张月 王东洋 路宽 沙锐

1. 科学技术部高技术研究发展中心 北京 100044;2. 大连理工大学 大连 116024;3. 西北工业大学 西安 710072

引言

数学是自然科学的基础,为其它科学提供精确的语言、严格的方法和新的研究范式。应用数学是指为解决科学、工程与社会经济发展需求中提出的现实问题而发展的数学理论和算法,其主要研究方向包括了微分方程、计算数学、概率与统计、运筹与控制、离散数学等。近年来,学科之间的交叉发展已经成为科学技术进步的必然趋势,而应用数学对相关学科发展和重大技术创新的支撑作用日益凸显,在智能制造、信息技术、生物医学、现代农业、资源环境、经济金融和国防安全等重点应用技术领域发挥着越来越重要的作用。

环顾世界,所有的经济大国和科技大国也是应用数学强国。中国作为一个发展中的大国,无论是适应当前国民经济结构战略性调整的现实需要,还是为未来经济社会发展提供科学技术和人才支撑,都必须重视应用数学领域的发展。因此,对国内外应用数学领域发展情况进行充分地了解和对比,是科技管理人员和科研人员的共同需求。本文运用文献计量方法对近十年国内外应用数学领域的发展情况进行了研究和分析,希望能对相关科学研究和科技决策提供支撑。

1 文献来源与处理

本文的数据来源于Web of Science科技文献数据库(简称“WOS数据库”)。数据获取过程为:首先选取数学领域公认的、能够反映该领域研究前沿的高水平期刊,期刊名称如表1所示;其次在WOS数据库中检索上述期刊在2010–2019年间发表的所有学术论文(Article)种类文献数据,在检索结果中选择应用数学领域的文献,得到31084篇文献;最后选择国别为中国的文献数据,得到4122篇文献(2021年1月7日检索)。

表1 数学领域文献来源期刊名称

对文献数据的处理过程包括:首先利用Web of Science的分析功能对检索结果进行基本计量分析,得到文献年度分布和国家合作关系等信息;其次利用信息可视化技术分析软件CiteSpace对文献数据进行计量分析[1],包括双图叠加分析、共被引分析和共词分析等,据此把握应用数学领域的研究态势、知识演进和研究前沿。

2 国内外应用数学领域的研究态势分析

2.1 年度分布情况

对WOS数据库中检索得到的国际和我国应用数学领域文献数据进行分析,得到应用数学领域各年度论文发表情况,见图1。从2010年起,国内外应用数学领域的年度文献发表数量总体呈现增长趋势,虽然在2014–2017年间,各年度文献发表数量相近,但从2018年开始,文献数量出现了明显的增加。这表明国内外应用数学领域保持了较高的研究热度,且近年来对于应用数学领域的关注度出现了显著提升。这一情况在我国的应用数学领域体现的更为明显,在2010–2019年间,年度文献发表数量从约300篇增长到约600篇。

图1 2010–2019年间国际和我国应用数学领域发表文献数量

2.2 国家分布情况

对WOS数据库中检索得到的国际应用数学领域文献数据进行发表国家分析,其中发表文献最多的19个国家及其文献数量如图2所示。从国家分布来看,发文量最多的国家是美国,2010–2019年间发表论文数量为13303篇,占文献总量的42.8%;其次是法国、中国、德国和英国等国家,文献数量均约占美国的1/3。

图2 2010–2019年间国际应用数学领域发表文献的国家分布情况

2.3 我国的国际合作情况

对WOS数据库中检索得到的我国应用数学领域文献数据进行分析,研究我国所发表文献的国际合作情况,如图3所示。可见我国与世界各国在应用数学领域存在紧密的合作关系,有接近50%的文献存在国际合作的情况。其中,我国与美国的合作关系最为紧密,另外与法国、德国、英国、加拿大、新加坡和意大利等国家均具有不同程度的合作关系,这些国家也均是应用数学领域论文发表数量较多的国家。

图3 2010–2019年间我国应用数学领域发表文献的国际合作情况

2.4 应用数学领域的交叉态势

利用CiteSpace软件的双图叠加功能(Dual Map Overlays)可以展示施引文献和被引文献所属期刊的领域分布,以及两者之间的引用关系,由此揭示应用数学领域与其他学科之间的交叉态势[2]。

首先对WOS数据库中检索得到的国际应用数学领域文献数据进行分析,如图4(a)所示,图中椭圆的纵轴和横轴分别代表了文献数量和文献作者的数量。可以发现,国际应用数学领域的施引文献主要发表在数学、计算科学、系统科学、物理学、材料科学和化学等领域的期刊上,而被引文献所属领域更为广泛,除上述提及的领域外,在经济学、地球科学、生态科学、环境科学、生命科学、外科科学、药学、哲学等领域均有文献被引用,表明了应用数学领域与各学科之间的广泛交叉和融合[3]。

基于上述方法,对我国应用数学领域文献数据进行分析,结果如图4(b)所示。可以发现,我国应用数学领域被引文献所属领域与国际趋势一致,集中在数学、计算科学、系统科学、物理学、材料科学和化学等领域的期刊上。但是与其他领域之间的交叉程度明显不足,尤其与外科科学、药学、地球科学和哲学等领域的交叉较少。

图4 2010–2019年间国际和我国应用数学领域发表文献的双图叠加分析

综上可知,近十年间,我国应用数学领域保持了较高的研究热度,并通过广泛的国际合作推动了应用数学领域的高质量发展。然而,我国虽然在文献发表数量上位居国际第三位,但与美国相比差距仍然较大,应用数学与相关学科之间的交叉融合进展相对较慢,交叉领域不够广泛[4]。

3 国内外应用数学领域的知识演进分析

在文献计量领域,论文引用行为体现了知识从不同的研究主题流动到当前研究的过程,是知识单元从游离状态到重组产生新知识的过程,而发表的论文又被其他论文引用则是这个过程的持续。因此,科学文献的相互引证关系反映了科学发展的客观规律,体现了科学知识的积累性、连续性、继承性以及学科之间的交叉和渗透。随着科学研究的不断推进,这种引证行为逐步形成引用网络。利用CiteSpace软件的共被引分析(Co-Citation)功能可以对领域内论文的引用网络进行分析,对领域内知识演进的情况进行分析[5-8]。

3.1 国际应用数学领域的知识演进情况

对2010–2019年间国际应用数学领域文献数据进行共被引分析,其中以1年间隔为时间切片,以参考文献作为节点类型。在得到共被引网络后,使用文献关键词聚类的方式,对共被引网络进行聚类分析,并以时间轴方式展示可视化图谱,见图5。图中属于同一聚类的文献被汇聚到同一时间轴上,不同的文献沿时间轴以节点的形式展现,节点之间的连线体现了文献之间的引证关系,并通过连线的颜色来反映引证关系发生的时间。

图5 2010–2019年间国际应用数学领域发表文献的共被引分析

从图5中可看出,根据聚类规模的大小,共被引网络可以形成15类显著的聚类标签,包括:变量选取(Variable Selection)、不确定性量化(Uncertainty Quantification)、加权本质无振荡格式(WENO)、低秩逼近(Lowrank Approximation)、非凸优化(Nonconvex Optimization)、高阶混合方法(Hybrid High Order Method)、分数阶导数(Fractional Derivative)、LASSO回归模型(LASSO)、逆散射(Inverse Scattering)、自适应网络有限元分析方法(Adaptive Finite Element Method)、混合成像(Hybrid Imaging)、分数阶拉普拉斯算子(Fractional Laplacian)、分部求和(Summation by Parts)、机器学习(Machine Learning)、随机热方程(Stochastic Heat Equation)。

根据聚类标签间的相关性做进一步归纳整合后发现,这些聚类内容可大致划分为如下3个领域:有关概率统计方法的聚类、有关数据图像处理优化方法的聚类、有关微分方程求解的聚类。结合聚类标签内容和引证关系发生的时间分布,具体分析如下:

(1)概率统计方法领域的知识演进情况

不确定性量化、低秩逼近、变量选取、LASSO回归模型,机器学习等聚类标签反映出概率统计方法领域的知识演进情况。其中,不确定性量化、变量选取,低秩近似等主题在2005–2013年间发展迅速,领域内的文献引用十分密切,这表明该领域具有较高的研究热度。在此期间,随着概率统计所考虑实际问题的复杂性和不确定性不断提高,统计理论和方法被应用到更多领域,并与这些领域内的文献产生了引证关系,如变量选取和不确定性量化方法应用于逆散射、混合成像等问题。2010–2013年,LASSO回归模型方法作为新的变量选取方法以新的聚类出现,并与多个聚类主题形成密切交叉。2013年,机器学习成为研究热点,并且与同时期大部分聚类中的文献都存在密切的引证关系,这也表明各领域采取的研究方法由模型驱动逐步拓展到数据驱动。

(2)数据图像处理优化方法领域的知识演进情况

混合成像、非凸优化等聚类标签反映出图像处理优化方法领域的知识演进情况。在图像处理和医学成像等领域,如何开发高精度、高效率的成像方法是研究的热点问题。混合成像方法结合了多种成像模态的优势,能够有效的改善成像精度,因此受到广泛关注。从图5中也可以看出,混合成像主题具有较高的研究热度,聚类内文献之间的引证关系密切。2010–2013年间,混合成像主题由于考虑了图像“稀疏”特性,而与LASSO回归模型等主题之间出现引证关系。同时,随着成像设备的采集能力提高,像素数据量增大,在处理高维且具有非凸结构约束的数据时,利用非凸优化方法能够更加准确地进行建模,因而成为研究热点。2013–2019年,伴随着机器学习的兴起,非凸优化与机器学习之间产生密切的引证关系。

(3)微分方程求解领域的知识演进情况

自适应有限元、加权本质无震荡格式、高阶混合方法、分部求和、分数阶拉普拉斯算子、随机热方程、分数阶导数,逆散射等聚类标签反映出微分方程求解领域的知识演进情况。其中,自适应有限元、加权本质无震荡格式,分部求和等内容主要作为微分方程数值解的求解方法进行研究,这些研究方法在发展过程中也不断出现相互交叉和融合的情况,在各聚类之间存在相互引用关系。2013年后,加权本质无震荡格式、逆散射和分数阶拉普拉斯算子等主题分别与机器学习主题产生引证关系。

综合以上分析可知,大部分研究主题兴起初期主要以领域内的合作为主,不同研究主题之间的交叉融合较少。随着研究的积累以及对实际问题的深入探究,不同主题之间出现交叉融合,从而涌现了一些新的研究主题。自2013年,机器学习与大部分主题都存在引证关系,体现了应用数学领域数据驱动的发展态势。

3.2 我国应用数学领域的知识演进情况

采用相同方法,对2010–2019年间我国应用数学领域文献数据进行共被引分析,见图6。

图6 2010–2019年间我国应用数学领域发表文献的共被引分析

图6展示了15类显著的聚类标签,包括:托普利兹矩阵(Toeplitz Matrix)、交替方向乘子法(Alternating Direction Method)、能量稳定性(Energy Stability)、唯一性(Uniqueness)、统一气体动理学格式(Unified Gas-Kinetic Scheme)、稳定性(Stability)、确定独立性筛选(Sure Independence Screening)、适应性(Adaptivity)、可穿透障碍物(Penetrable Obstacles)、框架(Frames)、NP问题(Large P Small N)、Hermite WENO重构格式(Hermite WENO Reconstruction)、紧致差分格式(Compact Scheme)、局部间断伽辽金方法(Local Discontinuous Galerkin Method)、最优误差估计(Optimal Error Estimate)。与国际总体情况相比,我国应用数学领域共被引网络中展现的文献数量较少,聚类标签所跨越的时间范围也较短。

根据聚类标签间的相关性,上述聚类内容可大致划分为2个领域,其中,托普利兹矩阵、交替方向乘子法、NP问题、确定独立性筛选、稳定性等聚类标签归属于数据处理优化方法领域;唯一性、统一气体动理学格式、适定性、可穿透障碍物、紧致差分格式、Hermite WENO重构格式、局部间断伽辽金方法、最优误差估计等聚类标签归属于微分方程定性分析及数值解领域。

从整体来看,这些聚类内部的文献间具有丰富的引证关系,表明这些领域自身具有较高的研究热度。同时,虽然各聚类之间存在一定程度的引证关系,但与国际应用数学领域相比,各聚类之间的相互引用情况并不普遍存在。例如,归属于数据处理优化方法领域的托普利兹矩阵和稳定性聚类之间、交替方向乘子法和NP问题聚类之间存在相互引证关系,表明了上述优化方法在设计和理论分析方面具有相互借鉴关系。与此同时,可穿透障碍物、紧致差分格式等聚类仅有内部引证。这反映出我国应用数学领域各研究方向研究者之间的相互合作和交叉融合较少。

4 国内外应用数学领域的研究前沿分析

在文献计量领域,我们认为研究者在一篇文章中使用的专业术语是能反映出论文内容的主题词,这种专业术语的使用会受到其他学者成果的影响,使得研究者在论文中使用相同或者类似的术语来完成自己的论文。因此,从文献信息中提取能够表达文献核心内容的主题词,并对这些主题词进行定量的词频分析,可以用来研究领域的发展动向和研究前沿,在CiteSpace软件中,上述分析过程可通过共词(Co-Word)分析功能来实现[5,6]。

利用2010–2019年间国际和我国应用数学领域文献数据进行共词分析,其中以1年间隔为时间切片,以术语作为节点类型。在得到共现网络后,对所呈现的术语共现网络进行突发性探测(Burstness)。突发性探测是通过考察词频,将某时段内频次变化率高的主题词从大量主题词中探测出来,通过突发性探测能够识别相关领域发展的新趋势或研究前沿的转变,并突出显示具有时间重要性的主题词。

2010–2019年间,国际应用数学领域中具有较强引用突发性的主题词见表2,其中突现强度最高的10个主题词分别为:有限元方法(Finite Element)、变量选取(Variable Selection)、插值法(Interpolation)、离散格子玻尔兹曼方法(Discrete Lattice Boltzmann Method)、并行计算(Parallel Computing)、均一化(Homogenization)、多重网格法(Multigrid)、贝叶斯推理(Bayesian Inference)、相转变(Phase Transition)、逆散射(Inverse Scattering)。

表2 2010–2019年间国际应用数学领域发表文献的主题词突发性探测分析

整体而言,从突现主题词的属性来看,上述突现主题词主要集中在应用数学领域问题的具体方法学层面,如有限元方法是求解偏微分方程边值问题近似解的数值技术,贝叶斯推理应用于概率计算领域等。体现了国际应用数学领域对方法学研究的关注。而从突现主题词的研究范畴来看,上述突现主题词展现了应用数学领域受各行业实际需求驱动的现象愈发明显,如受实际应用领域中大规模科学计算问题的驱动,在大规模并行计算机上实现代数多重网格算法成为数值计算领域的研究前沿[9];受雷达探测等领域中利用障碍物对声波、电磁波或弹性波的散射数据来确定障碍物位置和形状的需求驱动,逆散射问题成为计算数学领域的研究前沿[10]。

2010–2019年间,我国应用数学领域中具有较强引用突发性的术语见表3,其中突现强度最高的10个主题词分别为:降维(Dimension Reduction)、积分方程(Integral Equation)、交替方向乘子法(Alternating Direction Method)、全局解(Global Solution)、最优控制(Optimal Control)、凸 优 化(Convex Optimal)、分数阶微分方程(Fractional Differential Equation)、局部间断伽辽金方法(Local Discontinuous Galerkin Method)、逆散射(Inverse Scattering)、乘 性 噪 声(Multiplicative Noise)。可以发现,大部分突现主题词是应用数学领域中某一研究范畴的名称[11],例如凸优化是数学最优化问题的子研究领域,研究定义于凸集中的凸函数最小化的问题,被广泛应用于自动控制、信号处理、通讯和网络、电子电路设计以及金融等领域[12]。乘性噪声则主要处理合成孔径雷达、超声波、激光等相干图像系统当中因信道特性随机变化引起的噪声。由此可以看出,我国应用数学领域在具体研究范畴的界定及其所解决问题的廓清方面汇力较多,而在具体的方法学创新方面涉猎相对较少。

表3 2010–2019年间我国应用数学领域发表文献的主题词突发性探测分析

5 结论与展望

通过对国际和我国应用数学领域文献进行计量分析,对比国际和我国应用数学领域的发展态势、知识演变情况和研究前沿,可以得出以下结论。

(1)在世界范围内,应用数学领域都受到了较广泛的关注。我国应用数学领域的论文发表保持了持续增长的态势,并通过国际合作推动了应用数学领域的高质量发展。但我国的应用数学领域的产出水平与美国等国家相比还存在一定差距,需要通过国家科技计划的稳定支持来促进应用数学领域的持续发展。

(2)与国际相比,我国的应用数学领域研究尚存在一定的不足。首先,我国应用数学与相关学科之间虽有一定的交叉融合,但交叉领域不够广泛。其次,我国的应用数学领域中,各研究方向虽然保持了较好的研究热度,但各研究方向之间的交叉融合态势尚未形成,与国际应用数学领域中普遍存在的方法学之间的融合创新趋势尚存在差距。最后,我国应用数学领域在具体研究范畴的界定及其所解决问题的廓清方面汇力较多,而对数学原理和方法上的突破关注较少,研究前沿中所涉及的具体方法学内容较少。这可能是由于我国的应用数学研究更多借助国际上存在的数学理论、方法来解决实际问题,而在数学理论和方法的创新方面关注不足,因此需要适当的政策引导,促进数学领域原始创新能力提升[13]。

(3)随着应用数学领域需解决的实际问题越来越复杂,国际应用数学领域中存在由模型驱动逐步拓展到数据驱动的方法学创新,而这一趋势在我国应用数学领域还并不显著。在后续的研究过程中,我国需要进一步加强针对大数据分析与人工智能方法的应用数学理论创新[14]。

猜你喜欢
主题词聚类文献
Hostile takeovers in China and Japan
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
智能传感器的智慧战略,新技术创造新价值
面向WSN的聚类头选举与维护协议的研究综述
改进K均值聚类算法
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing
基于Spark平台的K-means聚类算法改进及并行化实现
基于加权模糊聚类的不平衡数据分类方法
取消公文主题词的真正原因是什么?