我国“五计学”作者合作研究*

2019-04-16 03:08宋艳辉孙玉坤
图书馆论坛 2019年4期
关键词:计量学网络分析领域

宋艳辉,孙玉坤

0 引言

随着科技发展,知识领域普遍出现交叉与融合趋势。我国计量学领域逐渐由“三计学”向“五计学”方向发展,2018年国家社科基金“‘五计学’的融合与图书情报学方法创新研究”立项,表明学术界对“五计学”普遍认可[1]。“五计学”主要内容包括文献计量学(Bibliometrics)、科学计量学(Scientometrics)、信息计量学(Informetrics)、网络计量学(Webometrics)和知识计量学(Knowledge metrics)。当今科学研究领域的合作越来越普遍,合作共赢意识越来越强。五计学的作者合作关系包括显性作者合作和隐性作者合作。本文筛选出核心合作作者,利用社会网络分析法对该领域的显性合作关系作者进行分析,再对作者进行因子分析,挖掘我国“五计学”的作者潜在合作关系,探析作者之间的合作交流状况,为我国“五计学”发展提供参考。

1 数据来源与研究方法

1.1 样本选取

本文数据样本选取于CNKI,检索时间为2018年9月28日,选择检索主题=“文献计量学”and“科学计量学”and“信息计量学”and“网络计量学”and“知识计量学”,共获得9096条数据记录。对检索所得数据进行人工筛选处理,删除重复文献、会议纪要、投稿指南、综述、述评等,最终得到9065 条论文数据,根据合作率=(一定时期内相关文献)合作论文数/(一定时期内相关文献)论文总数[2],计算得到我国五计学领域合作率为23.68%。五计学领域作者共3787位。由于作者人数多,整体合作网络非常复杂,为了有针对性地分析,需要提取核心作者合作群[3]。

发文量是衡量作者学术水平和科研能力的重要指标,因此,在选取核心作者样本时运用普赖斯定律。普赖斯在《小科学,大科学》中指出,在同一主题中,半数的论文为一群高生产能力作者所撰,这一作者集合的数量上约等于全部作者总数的平方根。依据普赖斯核心作者计算公式:M=0.749(Nmax)1/2,Nmax 代表发文量最高的作者的论文数,其余作者发文数超过M 篇的,则视为核心作者变化。计算得M=3.01 篇,所以在CNKI 上共发表论文数大于等于3 篇的作者就是核心合作作者,由此得到143 位核心作者。为更有针对性地分析核心作者间的合作关系,从143 位作者中按照合作发文频次量由高到低提取出30 位作者做进一步研究。具体计算方法如下:分别计算这143 位作者与其他142 位作者的合作频次,汇总得到该作者的总合作频次,选取前30 位。从选取的核心作者看出:五计学的核心作者群既包括在计量科学研究领域内的学科权威,如邱均平、刘则渊、武夷山等,他们研究成果丰富、学术水平高,是五计学的重要支柱;也包括新涌现的高产作者,如赵蓉英、李江、宋艳辉、侯海燕、陈悦、姜春林等,他们也为五计学的发展提供了活力。

1.2 研究方法与工具

本文利用社会网络分析方法(Social Network Analysis,SNA)来探究我国“五计学”的作者合作关系。社会网络分析法是1960年代,怀特及其后继者伯曼、布里格等人运用数学图形推导出的数学分析方法,是对社会网络中各种关系结构及其属性加以分析的一套理论和方法,主要分析各行动者之间的关系模式[4]。实质上,社会网络就是为达到特定目的,人与人之间进行信息交流和资源利用的关系网[5]。本文综合运用社会网络分析方法构建五计学领域的核心作者网络,对其合作关系情况进行研究。UCINET 是社会网络分析的常用工具[6],在进行数据分析时,主要用到网络密度分析和网络中心性分析。网络密度测量网络中各个节点之间的紧密程度,整体的密度反映了网络的连通性[7],中心性则描述个人或团体在网络中所处的地位和重要性。

因子分析最早是由英国心理学家C.E.斯皮尔曼提出的一项从变量群中提取共性因子的统计技术。因子分析可在许多变量中找出隐藏的具有代表性的因子,将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设[8]。科学文献计量的理论也将贯穿研究始终,比如普赖斯定律帮助我们找到五计学领域的核心作者,在研究过程中还将利用因子分析的统计方法对五计学领域的作者合作情况进行深入分析,以发现当前具有高研究活力和研究潜力作者的分布情况,从而揭示五计学的研究热点和研究主题的变更趋向。相对社会网络分析,因子分析对探测学科前沿、研究学科知识结构更具有应用价值,它在一定程度上弥补了网络分析的局限性,对发现潜在合作关系有重要意义。这个过程将运用SPSS 统计软件得以实现。

2 作者合作网络分析

2.1 全部核心作者网络分析

对五计学的143 位作者构造合作矩阵,利用可视化工具NetDraw 绘制网络图,见图1。图1中显示的每个圆点代表一位作者,圆点的大小代表作者合作发文中间中心性的大小,圆点越大,说明作者合作中心性越强,圆点间的连线代表作者间的合作次数,连线越粗说明作者间的合作次数越多。图中邱均平、武夷山的圆点较大,代表其合作中心性较强,图中刘则渊与侯海燕间的连线最粗,说明这两位作者合作发文量最大。

图1 全部核心作者合作关系网络

在此网络中能直观地看到三个核心群体网络:网络A、网络B、网络C。网络A 以武汉大学邱均平为核心,网络B 以大连理工大学刘则渊为核心,网络C 以中国科学技术信息研究所武夷山为核心。合作网络A 和B 之间通过关键作者武夷山、宋艳辉、李江、姜春林和丁堃等人形成了一个大型的合作网络,这说明两个成熟的子网络间并不是没有联系的。在网络A 中,邱均平是沟通该网络的关键点,其他节点大部分与其连接(除刘春丽外),总体呈现出由中心向外扩散的整体形态,形成规模最大的一个合作子网,并具有较好的连通性。C 网络是以武夷山为核心的网络,重要成员包含潘云涛、袁军鹏、马峥等,这也都是中信所情报方法中心的核心成员。在此网络中还发现,联系A 网络与C 网络的关键作者是宋艳辉、孙建军,由于宋艳辉先后师从邱均平和武夷山,因此宋艳辉成为联系武汉大学与中信所的重要桥梁,即连接A、C 两个子网的关键点;武夷山、孙建军同为南京大学的博士生导师,建立了合作关系;大连理工大学的姜春林和丁堃因为学术交流的原因,同中信所的潘云涛、王宁等建立了合作关系,因此将合作网络B 和C 连接了起来。从图1中还发现一支合作网络D,这支网络与网络C 关系紧密,查看原始数据发现,卢朝晖、王宁、王敏都曾在山东省医药卫生科技信息研究所共事,建立了合作关系。王敏到中国医学科学院医学信息研究所后,同许培扬等新同事建立了合作关系。因工作原因,中国科学技术信息研究所与中国医学科学院医学信息研究所合作交流较多,学者间多有合作,从而形成网络C、D 相融合的布局。在网络B 中,形成以刘则渊为核心的蜘蛛网子网,这是第二大子网络,姜春林、侯海燕、胡志刚、梁永霞、林德明等围绕刘则渊分布,整体结构紧密,有着高度的连通性,刘则渊与陈悦、候海燕与刘则渊、候海燕与胡志刚间的合作频繁,分析发现侯海燕与陈悦曾师从刘则渊,学生间、师生间建立了密切的合作关系。盛丽娜、方红玲与梁繁荣、任玉兰等作者分别形成了各自的中小型网络,图中还有大量单点型网络和双核型网络分散分布。中小型网络中团体间的合作不多,甚至没有直接的合作关系。以上说明我国五计学的作者合作关系呈现不平衡的分布状况,几个大的合作网络间的联通性强,作者间的信息共享以及知识交流方面沟通顺畅,但是独立发文的子网络间缺少合作交流的机会。在当今各学科交叉融合的背景下,要加强作者间的合作,通过作者间跨学科的交流融合,能够发现新的研究方法、新的增长点,达成学科间的共识,更好的为各自研究领域服务。

图2 30位核心作者合作关系

2.2 进一步缩小核心作者网络分析

依据社会网络分析方法,在Excel表格中编制VBA 程序,对筛选出的30位核心作者构造30×30 合作矩阵,绘制网络图,如图2所示。

图2中的网络由30 位核心作者形成。图中显示的合作网络是一个非联通的网络,具有合作关系的子网共有4个,包含两个大型的合作网络:以邱均平为代表的大型合作网络共12 人,以刘则渊为代表的大型合作网络共7 人。这两个网络核心作者之间的知识融合、思维碰撞、资源共享方面的连通性很好。还有两个相对较小的关系子网,分别由方红玲、盛丽娜、周志新、刘雪丽形成的核心蛛网型网络,以及由任玉兰、梁繁荣所形成的双核型子网络,但与图1相比发现,没有形成以武夷山为中心的合作网络。整体来看,图2与图1所展示的合作情况基本吻合。

3 作者合作因子分析

3.1 因子分析结果与解读

运用SPSS 对作者合作矩阵(30 位核心作者)进行因子分析,采取主成分(Principal Components)萃取因素,选择直斜交(Direct Oblimin)进行转轴,可提取出14 个成分,累计贡献率为80.003%。通过因子分析,可以对核心作者群进行分组。对作者合作关系矩阵所形成的成分相关矩阵进行统计,可以发现相应合作团体的研究主题领域所在。

通过数据整理(只保留载荷值>0.2 的数据)可得到如表1所示结果:将“五计学”高频率合作作者大致分为14 个主题领域,即文献与信息计量学、科学计量学、影响因子、医学计量、可视化分析、科技政策分析、共词分析、网络计量学、科学知识图谱、被引分析、数字出版、经济计量、化学计量以及科技创新网络,不同主题领域所涉及的核心作者,以及作者对不同领域的研究贡献都有很大不同。图表显示,有两个主题下的核心作者总数最多,分别是以邱均平为代表的文献与信息计量学和以刘则渊为代表的科学计量学,二者最大载荷值和载荷总值都是最大的,可见核心作者对于这两大区域的研究集中性和活跃性相对较高。其他很多主题研究领域都是在文献与信息计量学和科学计量学这两个传统主题上衍生发展出来的,这点从他们与其他因子间的相关性上体现出来。从最初的文献计量学到后来的科学计量学、信息计量学、网络计量学,再到知识计量学,邱均平、刘则渊、武夷山、姜春林等对这些研究主题的贡献都比较大,并形成了自己的团队,尤其以邱均平为中心的师生队,如文庭孝、赵蓉英、张洋、宋艳辉等新生研究力量已经登上计量学研究舞台;以刘则渊为中心的队伍中,侯海燕、陈悦等在专利计量、科学计量等领域占有一席之地,他们对五计学的发展都做出了重要贡献。而科技创新网络与计量学在数字出版应用两个研究领域的首要载荷作者数都仅有1个,且前者的载荷值相对较低,这与以上几个研究领域的学科交叉性和综合性是有关系的,这两个研究主题在“五计学”领域还未呈现出稳定的分布态势和发展潜力。

表1 因子分析结果

表2 作者-主题贡献统计

表3 因子相关性矩阵

从表2还可以看出,五计学核心作者所涉及的研究主题情况也有很大不同。通过因子载荷统计发现,涉及领域最多的是邱均平,他在5 个领域都有研究贡献。李江、任全娥、李晔君等涉及4 个研究领域,赵蓉英等集中于3 个领域的研究,有10 位作者在2 个领域有合作关系,武夷山、周志新、盛丽娜等只在1 个领域内有贡献值,即主要专注于某一特定主题领域的研究;有些学者因为跨学科研究,只在特定因子上有较小值,在五计学领域中主要偏重于相关主题的泛在研究,或者是刚进入五计学领域的新人,还未形成专深的研究。从因子载荷分布看,大部分学者主要集中在单个主题或两个主题的研究,可见五计学领域内核心作者的研究方向普遍比较集中。

国内外学者都已证明从作者合作关系出发,可以动态地揭示一个学科主题领域的知识结构,尤其是前沿热点知识结构[9]。我们大致将核心高频合作者分为横向基础和纵向探索两大部分,前者以邱均平、刘则渊、赵蓉英、侯海燕、宋艳辉、陈悦、胡志刚、杨华、王菲菲等为代表,集中于文献计量与科学计量、信息检索与可视化分析、科技创新网络等基础性理论、方法与技术方面的研究;后者以武夷山、张洋、潘云涛、梁繁荣、任玉兰、王敏等为代表,主要涉及网络计量学、经济计量、医学计量等五计学领域综合交叉性、应用衍生性为主题的研究。进一步研究因子相关性矩阵(表3),发现基础和探索这两大部分的因子之间存在较强的相关性,如影响因子与共词分析、科学知识图谱这两大基础性研究间存在较高的关联度,这在一定程度上反映了计量学理论研究向信息分析应用研究的发展趋向,这是由这些具有桥梁作用的学者推动的,这些中间学者在合作研究过程中形成新的研究共同体,进而探讨新的研究热点。因子8 网络计量学与基础研究部分的相关性也相对较高,结合表1发现这两个主题领域的载荷总值都较大且载荷均值相近,这在一定程度上说明这两个主题领域的核心作者群已基本形成,其研究主体和客体较为稳定;还发现因子1、5、8 之间的相关性相对较高,这反映出由文献与信息计量学领域、可视化分析领域向网络计量领域进行拓展、深化、发展,这三方面研究紧密联系,或可推动现代化网络信息资源计量与管理这一热点的形成与发展。

3.2 作者合作因子分析与网络分析的对比

通过对30 位核心作者进行因子分析和网络分析,对比分析结果发现,因子分析比网络分析更能挖掘一些潜在的主题信息,比如通过因子分析,我们可以知道各个合作群体的单位以及合作的重点主题领域。通过因子分析载荷总值可以发现我国“五计学”领域学者多集中于文献与信息计量和科学计量这两个领域,除此之外还涉及网络计量、共词分析、科学知识图谱等主题领域。从因子相关性矩阵中可以看出影响因子、共词分析与科学知识图谱间的相关性较高,还发现可视化分析与网络计量学的相关性大,挖掘出潜在热点。这些都是社会网络分析解析不出的信息。

网络分析较因子分析,可更为直观地展现出不同子网络的核心作者合作群,这为进一步进行因子分析提供了深入挖掘的信息支撑。在社会网络分析辅助下,因子分析也可以发挥更大功效[10]。利用Ucinet 可对五计学领域的外在合作网络节点的中心性进行计算,中介中心性是侧重了节点在整个网络的中心程度,表示的是整个网络的集中或集权程度,即整个网络绕一个点或一组点来组织运行的程度[11]。结果如表4所示,中介中心性排名第一的是邱均平,他在五计学领域的合作网络中处于核心地位,与其他相关学者的联通性最强,同时在整个综合性合作网络中具有较大的掌控权,说明在合作网络中的影响力很大,是网络中的核心人物。此外,武夷山、丁堃、姜春林、宋艳辉的中心性也很大,图1中的圆圈大小能反映出他们在合作网络中做出关键的贡献,为五计学的研究发挥了重要作用。在前面展示的核心作者合作关系网络中,可以获得3 个大型的合作群体A、B、C,在进行因子分析后发现,这与网络分析呈现出的合作群是大致吻合的,这为五计学领域的核心作者合作研究增加了可信性,说明分析研究结果是稳健的。

表4 核心作者合作中心性测度

4 结语

本文选取的研究对象为五计学领域的核心期刊论文,通过对核心合作者的分析,得出以下主要结论:

(1)通过作者合作网络结构分析发现,五计学领域有3 个重要的合作网络:武汉大学、大连理工大学、中国科学技术信息研究所,分别以邱均平、刘则渊、武夷山为核心。这3 个合作团体间通过宋艳辉、孙建军、李江、丁堃、姜春林等关键作者的推动形成一个大型网络,从而形成五计学的一个核心研究群体。邱均平、刘则渊、姜春林、武夷山、宋艳辉等几位作者的合作频率较高,是当前五计学领域研究中较为活跃的几位作者。但从总体上看,五计学并没有形成一个高度联通的网络,作者合作网络关系图中呈现出各合作团体分散分布的现象,尤其是小规模团体和单独发文的小型网络。团体间的合作主要体现在同一单位内、相近单位之间,或有密切合作关系的师生之间、师门之间,作者合作频繁的研究方向也主要集中于文献与信息计量学、科学计量学等方面。

(2)通过对五计学领域的核心作者进行因子分析,共提取出14 个主成分,即文献与信息计量学、科学计量学、影响因子、医学计量、可视化分析、科技政策分析、共词分析、网络计量学、科学知识图谱、被引分析、数字出版、经济计量、化学计量以及社会网络分析。其中文献与信息计量学和科学计量学两大主题下的核心作者数最多,反映了在这两个主题领域的作者具有较强的专注性;影响因子主题下的首要载荷作者数最多,核心作者在这这个领域的研究集中性和活跃性都相对较高;五计学领域核心作者的研究所涉及的主题情况有较大的区别,研究范围最广的作者可涉足4 个甚至5 个主题领域,但多数作者集中于1 个或2 个主题领域。五计学领域研究大致可分为基础研究和应用探索两部分。前者主要集中于文献与信息计量、科学计量、共词分析、科学知识图谱、社会网络分析等基础性理论、方法与技术方面的研究,而后者则主要涉及网络计量、科技政策分析、经济计量等综合应用性的衍生应用主题研究。

(3)网络分析与因子各有优势。作者合作网络能直观地展示出不同子网络的分布情况,得出不同合作团体间的合作关系状况,发现各个网络间的关键作者,为进一步的因子分析提供研究空间。因子分析则可挖掘各个合作群体的单位以及合作的重点、前沿主题领域,从而更深入的揭示五计学领域内作者合作的方向和规律。因此,我们认为将网络分析与因子分析结合起来,将会是进行科学合作研究的理想方法。

最后,五计学领域发表文章的整体合作率较高,核心作者的合作联系较为紧密,也有持续大范围跨学科合作的趋势。此外,作者在不同单位学习或工作会大大增加合作机会,在此强烈建议专家学者能够通过各种方式积极参加学术交流来加强各个学科间的信息交流。

猜你喜欢
计量学网络分析领域
电子战领域的争锋
基于交通运输业的股票因果网络分析
基于ISM模型的EPC项目风险网络分析
低轨卫星互联网融合5G信息网络分析与应用
基于CiteSpace的医药语料库文献计量学分析
将现代科技应用于Hi-Fi领域 Perlisten S7tse
针刺治疗失眠症的文献计量学分析
基于Web of Science数据库的老年综合评估文献计量学分析
认知重评和表达抑制情绪调节策略的脑网络分析:来自EEG和ERP的证据*
2020 IT领域大事记