3种引文规范化指标RCR、CNCI和JNCI的相关性研究

2023-12-18 11:07郝若扬

现代情报 2023年12期

郝若扬

关键词：引文规范化评价指标；相对引用率；学科规范引文影响力；期刊规范引文影响力；论文影响力评价

ＤＯＩ：１０．３９６９／ｊ．ｉｓｓｎ．１００８－０８２１．２０２３．１２．０１２

〔中图分类号〕Ｇ２５０.２５２〔文献标识码〕Ａ〔文章编号〕１００８－０８２１（２０２３）１２－０１３３－１０

近年来，伴随着科学技术的迅猛发展，学科领域的划分越来越精细，不同学科之间的交叉、渗透和融合也越来越深入。在这样的大背景之下，如何对科研成果（特别是学术论文）进行科学、公正、客观地评价，已经成为文献计量领域面临的一个亟待解决的关键问题。特别是随着一些新兴的交叉学科领域的出现，如何对这些交叉领域的成果进行跨学科评价，也成为了文献计量领域的关键问题之一。早先的文献计量方法主要通过分析论文的被引频次及其所在期刊的影响因子等较为简单指标对论文的影响力进行评价，这在很大程度上导致了期刊影响因子等计量指标被错误使用或被异化的问题［１－２］。此外，早先的文献计量指标由于没有充分考虑学科领域、文献类型、引用环境、文献出版时间等因素的影响，很难对不同学科领域的论文（特别是跨学科领域的论文）进行客观、公正的评价，而且这些指标在对跨学科领域论文的影响力评价时展示出较大的局限性［３］。

为了解决以上问题，实现对不同学科领域论文的合理评价，文献计量研究人员提出了引文規范化指标，也被称为“相对指标”。这类指标充分考虑了学科领域、文献类型、引用环境、文献出版时间等对论文引用的影响，主要采用归一化算法对相关引文指标进行了规范化处理，使得不同学科领域、不同发表时间、不同文献类型的论文的引文指标具有一定的可比性［３］。１９８３年，ＳｃｈｕｂｅｒｔＡ等［４］提出了第一个相对计量指标（即相对引文率）来测度期刊论文的影响力。相对引文率被定义为平均引文率与平均影响因子的比值。２０１０年，荷兰莱顿大学ＷａｌｔｍａｎＬ等［５］基于所有论文在指标计算中应具有相对权重（即规范化）的思想，提出了“平均规范化引文分数” （ＭｅａｎＮｏｒｍａｌｉｚｅｄＣｉｔａｔｉｏｎＳｃｏｒｅ，ＭＮＣＳ）。ＭＮＣＳ指标被定义为每篇论文的被引频次除以其学科平均引文率所得比率的算术平均值。通过一系列实证分析，ＷａｌｔｍａｎＬ等［５］发现，在期刊出版年份标准化的情况下，ＭＮＣＳ指标很大程度上会受到最近出版期刊和被引频次较高的单一文献的影响。２０１０年，ＭｏｅｄＨＦ［６］进一步发展了ＥｕｇｅｎｅＧａｒｆｉｅｌｄ定义的学科领域“引用潜力” 的概念，提出了单篇文献的“数据源归一化影响力指数” （ＳｏｕｒｃｅＮｏｒ?ｍａｌｉｚｅｄＩｍｐａｃｔｐｅｒＰａｐｅｒ，ＳＮＩＰ）。ＳＮＩＰ指标被定义为某期刊每篇论文的被引用次数与该期刊的被引用潜力的比率。ＳＮＩＰ指标反映了期刊的上下文对引用的影响，充分考虑了学科主题领域的特征，特别是引用成熟度和用于评估的数据库涵盖该领域文献的程度［６］。ＳＮＩＰ指标基于引文规范化处理，使得不同学科领域的期刊可以公平地进行比较，而不受到学科领域引文行为的影响。同样基于规范化的思想，近年来科睿唯安（ＣｌａｒｉｖａｔｅＡｎａｌｙｔｉｃｓ）在其开发的ＩｎＣｉｔｅｓ平台上推出两个重要的规范化指标，即“学科规范引文影响力” （ＣａｔｅｇｏｒｙＮｏｒｍａｌｉｚｅｄＣｉｔａ?ｔｉｏｎＩｍｐａｃｔ，ＣＮＣＩ）和“ 期刊规范引文影响力”（ＪｏｕｒｎａｌＮｏｒｍａｌｉｚｅｄＣｉｔａｔｉｏｎＩｍｐａｃｔ，ＪＮＣＩ）［７］。ＣＮＣＩ指标被定义为论文的实际被引频次除以具有相同文献类型、出版年份和主题学科领域的论文的预期被引频次，而ＪＮＣＩ指标被定义为论文的实际被引频次除以同一期刊中论文的平均被引频次。从这两指标的定义来看，ＣＮＣＩ指标是对论文所属学科领域进行规范化，可用于对比不同学科领域的论文影响力；而ＪＮＣＩ指标对发表论文的期刊进行规范化，可用于对比同一期刊上不同论文的学术影响力。基于ＣＮＣＩ和ＪＮＣＩ指标的计算，可以在一定程度上消除不同学科领域或不同期刊之间引文模式和引用行为的差异，使得不同学科领域或不同期刊之间的论文可以进行较为直接的比较。

２０１５年，美国国立卫生研究院（ＮａｔｉｏｎａｌＩｎｓｔｉ?ｔｕｔｅｓｏｆＨｅａｌｔｈ，ＮＩＨ）在对论文共引网络（Ｃｏ－ｃｉｔａ?ｔｉｏｎＮｅｔｗｏｒｋ）计算和分析的基础上，提出了一种新的规范化指标，被称为“相对引用率” （ＲｅｌａｔｉｖｅＣｉｔａｔｉｏｎＲａｔｉｏ，ＲＣＲ）［８］。ＲＣＲ指标被定义为论文的实际引用频次除以基于共引网络分析获得的期望引用次数。ＲＣＲ指标是以ＮＩＨ的Ｒ０１项目资助的论文为基准，其中Ｒ０１项目为“Ｒ０１ＲｅｓｅａｒｃｈＰｒｏ?ｊｅｃｔＧｒａｎｔ”，它代表了ＮＩＨ的原始资助项目，主要鼓励跨学科和多学科研究。ＲＣＲ指标是基于论文共引网络来确定论文所属的学科领域，而不是基于论文发表的期刊所属学科进行归一化的，因此，ＲＣＲ指标相对于早先的规范化指标具有较为突出的创新性，同时其算法也得到了显著的改进［９］。为了计算论文的ＲＣＲ指标，ＮＩＨ开发了一个Ｗｅｂ应用程序，即ｉＣｉｔｅ［８］。该程序可以根据相关的算法为具有ＰｕｂＭｅｄＩＤ的论文计算ＲＣＲ指标。关于ＲＣＲ指标的优点和具体计算方法将在下一小节进行介绍。

上述介绍的指标（包括ＭＮＣＳ、ＳＮＩＰ、ＣＮＣＩ、ＪＮＣＩ、ＲＣＲ）都是基于引文规范化思想设计的评价指标。相对于早先基于绝对引文数据进行计量的指标而言，引文规范化指标考虑了学科领域、出版时间、文献类型等因素对指标的影响，并采用特定算法对论文的引文数据在学科领域和发表时间内进行了归一化处理，因此，这些引文规范化指标在对跨学科领域的论文影响力评价方面体现出了极大的优越性。一些引文规范化指标已经被出版商、科研资助机构、学术研究机构等应用到学术成果评价和研究绩效考核中。

近些年，由于引文规范化指标充分考虑了学科领域和文献类型对引文的影响，具有一定的先进性，所以规范化指标得到了较多的关注和研究。特别是ＲＣＲ指标由于其具有独特的创新性和改进的算法，得到了国内外研究人员的关注。ＨｕｔｃｈｉｎｓＢＩ等［９］计算并分析了ＮＩＨ获奖者在２００３—２０１０年发表的８８８３５篇论文的ＲＣＲ指标发现，这些论文具有较高的ＲＣＲ值，与学科领域专家对这些论文的评价相一致。同时，ＨｕｔｃｈｉｎｓＢＩ等［９］将ＲＣＲ指标与其他规范化指标（包括ＭＮＣＳ、ＳＮＩＰ等）进行了对比研究，研究结果表明，ＲＣＲ指标是基于论文共引网络进行学科分类的，不同于早先的规范化指标是基于期刊的学科属性或预设的分类进行学科分类的。因此，早先的规范化指标通常是一种先验定义学科分类，而ＲＣＲ指标是一种后验定义学科分类的方法［９］。这是ＲＣＲ指标与早先规范化指标最根本的区别之一。ＢｏｒｎｍａｎｎＬ等［１０］研究了Ｆ１０００数据库中１６５５７篇关于生物医学论文的ＲＣＲ指标及与其对应的ＭＮＣＳ指标、Ｆ１０００分数之间的相关性，结果表明，这些论文的ＲＣＲ指标与ＭＮＣＳ指标具有较高的相关性（相关系数达到０.８８），且与Ｆ１０００分数相关性较低（相关系数仅有０.２３～０.３１）。陈斯斯等［１１］在ＩｎＣｉｔｅｓ数据库中选取了２０１６年２２个ＥＳＩ学科期刊文献、８种交叉学科期刊文献和ＥＳＩ的８个不同学科领域中被引频次最高的单学科期刊文献，分别计算这些文献的ＲＣＲ与ＣＮＣＩ数值，并进行了相关性检验。结果表明，对于不同学科期刊文献、交叉学科文献及单学科期刊文献，ＲＣＲ指标与ＣＮＣＩ指标均展示了显著的正相关性，交叉学科文献的相关系数低于单学科文献［１１］。陈斯斯等［１２］利用ＲＣＲ指标与ＣＮＣＩ指标对２００９—２０１８年ＰＬｏＳＯｎｅ期刊所发表论文的学术影响力进行了定量评价发现，ＲＣＲ指标与ＣＮＣＩ指标具有一定的相关性，但是ＲＣＲ指标对于非生物医学领域论文的学术影响力评价具有一定的局限性。宋丽萍等［１３］选取了Ｆ１０００和ＩｎＣｉｔｅｓ数据库中的２９８５０篇细胞生物学论文和３０３２６篇生物技术论文，对这些论文的ＣＮＣＩ指标与被引频次进行了相关性分析和研究，结果表明ＣＮＣＩ指标与被引频次呈现高度正相关，并且ＣＮＣＩ在跨学科比较方面具有一定的优越性，可以代偿执行引用统计的信息过滤与学术影响力归誉的功能。陈斯斯等［１４］还选取干细胞领域的学术论文作为研究样本，对这些论文的ＲＣＲ指标、Ｓｃｏｐｕｓ数据库的ＦＷＣＩ指标（ＦｉｅｌｄＷｅｉｇｈｔｅｄＣｉｔａｔｉｏｎＩｍｐａｃｔ）和Ｆ１０００分数进行了相关性分析和研究。研究结果表明，ＲＣＲ指标与ＦＷＣＩ指标具有较强的相关性，而ＲＣＲ指标与Ｆ１０００分数之间相关性较低［１４］。

由于引文规范化指标采用了归一化算法，其计算方法和计算过程相比早先常用的引文指标（如被引频次等）复杂很多，导致规范化指标的推广过程相对缓慢，加之引文规范化指标（如ＲＣＲ、ＪＮＣＩ和ＣＮＣＩ指标等）大都是近年来提出的新颖的引文指标。从目前的研究现状来看，国内外学者对于规范化指标（特别是ＲＣＲ指标）的研究处于初期阶段，因此关于ＲＣＲ指标的研究相对较少。目前已有的研究主要采用实证分析的方法，研究某单一科学领域中论文的ＲＣＲ指标与其他规范化指标（包括ＭＮＣＳ、ＳＮＩＰ等指标）或早先传统引文指标之间的相关性。值得注意的是，论文的学科领域主要局限在生物学和医学领域，对于非生物学和医学领域的论文并没有进行较为深入的研究。这可能与ＲＣＲ指标早期主要是起源于ｉＣｉｔｅ平台中的生物类和医学类论文有关。近年来，随着学科交叉的不断发展，ｉＣｉｔｅ平台中也囊括了部分非生物学、医学领域的论文，使得ＲＣＲ指标可以推广到生物学、医学领域以外的领域。因此，本文将选取２０１８—２０２２年在ＩｎＣｉｔｅｓ数据库中的１０种不同学科领域内的论文作为研究样本，对这１０种科学领域（包括多个自然科学和社会科学领域）论文的ＲＣＲ指标、ＣＮＣＩ指标和ＪＮＣＩ指标进行相关性分析，并选取３个具有代表性的学科领域中的论文进行深入分析，计算并分析论文发表国家和研究机构的平均ＲＣＲ指标和ＣＮＣＩ指标。通过这些研究，揭示不同学科领域ＲＣＲ指标、ＣＮＣＩ指标和ＪＮＣＩ指标评价论文学术影响力的差异和关联性，为深入理解引文规范化评价指标、建立科学评价体系提供一定的指导。

１３种引文规范化评价指标的对比

１.１相对引用率（ＲＣＲ）

通过分析不同学科领域论文的共引网络，计算论文引文率（ＡｒｔｉｃｌｅＣｉｔａｔｉｏｎＲａｔｅ，ＡＣＲ）与预期引文率（ＥｘｐｅｃｔｅｄＣｉｔａｔｉｏｎＲａｔｅ，ＥＣＲ），然后将这两者（ＡＣＲ与ＥＣＲ）相除即可获得论文的ＲＣＲ指标。其中，论文的ＡＣＲ代表论文的年平均被引频次，而ＥＣＲ的计算过程则较为复杂，其大致流程为：首先将目标论文共引网络中每一篇论文的期刊引文率（ＪｏｕｒｎａｌＣｉｔａｔｉｏｎＲａｔｅ，ＪＣＲ）的年平均值作为该篇论文的领域引文率（ＦｉｅｌｄＣｉｔａｔｉｏｎＲａｔｅ，ＦＣＲ），然后选取ＮＩＨ的Ｒ０１项目资助的论文为基准，调整ＡＣＲ与ＦＣＲ的比值，通过ＡＣＲ与ＦＣＲ线性拟合，计算其回归系数即可获得ＥＣＲ。在ＲＣＲ的计算过程中，生成论文的共引网络是非常重要的环节。图１展示了一篇论文的引用网络示意图。图中红色点代表了目标论文，橙色点代表了引用目标论文的相关文献，绿色点则代表橙色点所引用的相关文献，紫色点代表了目標论文所引用的相关文献。在图１中，橙色点所代表的论文集合构成了目标论文的引文网络，绿色点所代表的论文集合构成了目标论文的共引网络，紫色点所代表的论文集合构成了目标论文的被引用网络。ＲＣＲ指标的计算主要是基于对论文的共引网络分析而获得的。随着论文出版年限的增长，论文的引用次数会逐渐增多，使得论文的共引用网络发生动态的变化，进而使得论文的ＲＣＲ数值同时也发生变化。在ＮＩＨ建立ｉＣｉｔｅ平台的早期，平台中数据主要是关于医学、生物学等领域的论文，因此，早期ＲＣＲ指标仅适用于医学、生物学等领域的论文评价。近年来，随着ｉＣｉｔｅ平台囊括了更多学科领域的论文数据，使得ＲＣＲ指标逐渐拓展到其他学科领域，特别是交叉学科领域。

１.２学科规范化引文影响力（ＣＮＣＩ）

ＣＮＣＩ指标是通过将论文的被引频次除以同出版年、同学科领域、同文献类型论文的平均被引频次而获得的。与ＲＣＲ指标不同，ＣＮＣＩ指标主要是基于期刊的学科分类体系对论文进行分类和统计分析。科睿唯安根據期刊的学科分类对期刊发表的所有论文进行学科分类。当一篇论文被划归到单个学科领域时，其ＣＮＣＩ指标的计算公式如式（１）所示：

其中，ｆ代表学科领域，ｔ代表出版年，ｄ代表文献类型，ｐ为划归的该学科领域的论文数量。根据ＣＮＣＩ的计算公式，不难看出ＣＮＣＩ指标是一种基于期刊级别的先验定义学科分类的相对指标。自从科睿唯安提出ＣＮＣＩ指标以来，由于其消除了出版年、学科领域和文献类型对论文被引频次的影响，可以对不同出版年、学科、文献类型的论文的影响力进行较好的评价，因此ＣＮＣＩ指标得到较为广泛的认可。但是，在使用ＣＮＣＩ指标时，科睿唯安指出了３点需要注意的事项： ①当待评价的样本量较小时，一篇高被引论文的被引频次将会对ＣＮＣＩ的数值带来较为显著的影响； ②ＣＮＣＩ指标是一种基于平均值的度量，因此，即使待评价的样本量足够大，少数高被引论文也可能对ＣＮＣＩ的数值产生较大的影响； ③由于论文出版当年的基准值通常很低，因此，出版当年的ＣＮＣＩ数值可能高于预期的波动。

１.３期刊规范化引文影响力（ＪＮＣＩ）

ＪＮＣＩ指标与ＣＮＣＩ指标较为类似，其主要区别在于ＣＮＣＩ指标是基于学科领域进行规范化，而ＪＮＣＩ指标是基于论文所发表的期刊进行规范化。ＪＮＣＩ指标被定义为论文的实际被引频次与该发表期刊同出版年、同文献类型论文的平均被引频次的比值。对于出版社或期刊编辑部来说，ＪＮＣＩ指标是一种重要的评估工具，可以帮助他们判断所发表的论文对学术界的影响力水平，揭示那些超越平均水平并显著提高了期刊被引频次的研究工作。表１展示了科睿唯安提供的ＣＮＣＩ和ＪＮＣＩ指标在作者层面的一个应用示例。科研工作者Ｄ和Ｅ的总论文数量和总被引频次都非常接近，他们的引文影响力几乎相同，ｈ指数也相同。仅用表１中的前４个计量指标，无法区分两位研究人员的学术影响力。然而，这两位研究人员实际上是在不同的学科领域进行研究，并且有不同的论文发表历史。使用ＣＮＣＩ和ＪＮＣＩ指标可以更好地区分和评价他们各自在主题、文献类型和出版时间方面相对于同行的表现。从表１可以看出，科研工作者Ｄ的ＣＮＣＩ（１.３２）和ＪＮＣＩ（１.８６）的数值都超过了平均值１，而科研工作者Ｅ的ＣＮＣＩ（０.４５）和ＪＮＣＩ（０.７２）的数值都低于平均值１。这表明科研工作者Ｄ发表论文的学术影响力高于全球平均水平，并高于其工作领域期刊论文的平均水平；而科研工作者Ｅ发表论文的学术影响力低于全球平均水平，且低于其工作领域期刊论文的平均水平。

１.４３种指标的总体对比

尽管ＲＣＲ、ＣＮＣＩ和ＪＮＣＩ指标都是基于规范化的思想提出的，但是由于它们的定义不同，导致这３种指标在数据覆盖范围、学科领域分类、文献类型、指标算法及指标意义等方面存在一定的差异。从数据库覆盖范围来看，ＲＣＲ指标来源于ｉＣｉｔｅ平台，绝大多数论文是与生物学和医学领域相关的；而ＣＮＣＩ和ＪＮＣＩ指标数据来源于包含ＷｅｂｏｆＳｃｉ?ｅｎｃｅ（ＷｏＳ）数据库，学科领域覆盖面更广、更全面。从学科领域分类来看，ＲＣＲ指标是根据论文的共引网路分析进行学科分类的，每篇论文的共引用网络会随着论文被引频次的增加而动态变化，因此每篇论文的学科领域也是不断变化的；而ＣＮＣＩ和ＪＮＣＩ指标是基于ＷｏＳ数据库中期刊的学科属性进行学科领域划分的，因此每篇论文的学科领域是相对固定的，不过考虑到学科交叉，一篇论文也可以被分配到１个或多个学科领域。从文献类型来看，ＲＣＲ指标将文献类型划分为Ａｒｔｉｃｌｅ或非Ａｒｔｉ?ｃｌｅ两种，而ＣＮＣＩ和ＪＮＣＩ指标则将文献类型划分为Ａｒｔｉｃｌｅ、Ｒｅｖｉｅｗ、ＰｒｏｃｅｅｄｉｎｇＰａｐｅｒｓ和Ｂｏｏｋｓ等２００多种。从指标算法来看，由于ＲＣＲ指标计算涉及论文共引网络的形成和分析，所以ＲＣＲ指标的算法比ＣＮＣＩ和ＪＮＣＩ指标的算法更为复杂。从指标意义来看，ＲＣＲ指标是以ＮＩＨ的Ｒ０１项目资助的论文为基准，当ＲＣＲ指标大于１时，说明论文的影响力高于ＮＩＨＲ０１项目资助论文的影响力平均水平；而ＣＮＣＩ指标反映了论文在同一学科领域的实际被引频次与期望被引频次比值的平均值，当ＣＮＣＩ指标等于１时，说明论文在该学科领域的学术影响力与全球平均水平相当；当ＣＮＣＩ指标大于１时，说明论文的学术影响力高于全球平均水平；当ＣＮＣＩ指标小于１时，说明论文的学术影响力低于全球平均水平。ＪＮＣＩ指标主要反映了发表在同一期刊中论文的学术影响力，因此，当ＪＮＣＩ指标等于１时，说明论文的学术影响力与该期刊论文的平均水平相当；当ＪＮＣＩ指标大于１时，说明论文的学术影响力高于该期刊论文的平均水平；当ＪＮ?ＣＩ指标小于１时，说明论文的学术影响力低于该期刊论文的平均水平。

２近５年不同学科领域文献的规范化指标相关性研究

为了研究在不同学科领域中规范化指标的相关性，本文从科睿唯安ＩｎＣｉｔｅｓ数据库平台下载了２０１８—２０２２年ＷｏＳ在１０个不同学科领域中收录的所有论文的相关信息（包括ＷｏＳ编号、ＤＯＩ、ＰｕｂｍｅｄＩＤ、论文题目、作者、出版期刊、学科领域、文献类型、出版年、被引频次、发表研究机构、发表国家、ＣＮＣＩ、ＪＮＣＩ等）。从这些论文中选出有ＰｕｂｍｅｄＩＤ的论文，然后利用ＰｕｂｍｅｄＩＤ通过ｉＣｉｔｅ平台计算获得论文的ＲＣＲ指标。随后进一步对具有ＰｕｂｍｅｄＩＤ的论文的ＣＮＣＩ、ＪＮＣＩ和ＲＣＲ指标进行统计分析。在本文数据收集和研究中，所涉及的１０个学科领域涵盖了自然科学和社会科学的多个分支，包括信息与图书情报、经济学、生物学、遗传学、内科医学、细胞生物学、凝聚态物理、有机化学、机器人技术和交叉科学。需要指出的是，数据中论文所对应的学科领域、发表国家和发表研究机构的界定都是科睿唯安ＩｎＣｉｔｅｓ数据库直接给出的。对于给定的一个学科领域，在ＩｎＣｉｔｅｓ数据库中使用“分析” 模块，在其中选择“国家”或“研究机构” 就可以对这个学科领域的论文进行相应的统计分析。

表２列出了２０１８—２０２２年研究的１０个学科领域中论文的数量和所有具有ＰｕｂｍｅｄＩＤ论文的ＲＣＲ、ＣＮＣＩ和ＪＮＣＩ指标的平均值，其中３种指标的平均值是将所有具有ＰｕｂｍｅｄＩＤ论文的ＲＣＲ、ＣＮＣＩ和ＪＮＣＩ指标进行相加求和然后除以ＰｕｂｍｅｄＩＤ论文总数获得的。从表２中的数据可以看出，对于生物学、医学等领域，ｉＣｉｔｅ数据库平台涵盖了８５％以上的ＷｏＳ论文；对于社会科学领域（如信息与图书情报、经济学等）、物理学、化学、工程技术科学、交叉科学等，ｉＣｉｔｅ平台收录的论文数量低于ＷｏＳ论文数量的５０％。这是由于ｉＣｉｔｅ平台本身主要是针对生物学、医学领域的论文评价而建立。近年来，随着交叉学科的发展和ＲＣＲ指标的广泛应用，ｉＣｉｔｅ平台逐渐扩展到了生物学和医学领域之外的学科方向，并收录了很多相关学科领域的论文。对比表２中不同学科领域中论文的ＲＣＲ和ＣＮＣＩ指标的平均值发现，遗传学、内科医学、细胞生物学、经济学、凝聚态物理等领域中论文的ＲＣＲ和ＣＮＣＩ指标的平均值较高，这说明从平均意义上而言，这些领域中的论文相比其他领域的论文具有更高的学术影响力。

对上述１０种学科领域中具有ＰｕｂｍｅｄＩＤ论文的ＲＣＲ、ＣＮＣＩ和ＪＮＣＩ指标进行Ｐｅａｒｓｏｎ相关性分析，所获得的相关系数在表２中列出。从表２中相关系数的数值来看，对于这１０种学科领域，论文的ＲＣＲ指标与ＣＮＣＩ、ＪＮＣＩ指标呈现正相关，且ＣＮＣＩ指标与ＪＮＣＩ指标也保持正相关。对于其中大多数学科领域而言，ＲＣＲ与ＣＮＣＩ指标之间以及ＣＮＣＩ与ＪＮＣＩ指标之间的相关系数均较大，而ＲＣＲ与ＪＮＣＩ指标之间的相关系数相对较小，表明这些学科领域论文的ＲＣＲ与ＣＮＣＩ指标之间以及ＣＮＣＩ与ＪＮＣＩ指标之间保持高度的正相关，而ＲＣＲ与ＪＮＣＩ指标的相关度较低。值得注意的是，遗传学论文的ＲＣＲ指标与ＣＮＣＩ、ＪＮＣＩ指标之间的正相关系数仅有０.２１～０.２２，展示了低度的正相关。这表明ＲＣＲ指标与ＣＮＣＩ、ＪＮＣＩ指标在论文评价方面出现了不一致，这可能与３种指标的来源数据库覆盖的引文范围差异有关，ＲＣＲ指标来自于ＮＩＨ建立的ｉＣｉｔｅ数据平台，而ＣＮＣＩ和ＪＮＣＩ指标来源于科睿唯安的ＩｎＣｉｔｅｓ数据库。

近年来，规范化指标不仅被用于评价学术成果的影响力，而且也被应用于评价个人、研究机构以及期刊的学术水平和学术影响力［１１，１５］。在随后的小节中，本文从１０种学科领域选择了３个具有代表性的学科领域（包括信息与图书情报、遗传学和交叉科学），对这３种学科领域中论文的发表国家和研究机构的平均ＲＣＲ指标和ＣＮＣＩ指标进行分析，进而研究不同学科领域中论文的发表国家和研究机构的学术水平。３个代表性学科领域中，信息与图书情报作为社会科学类的代表领域，遗传学则是近年来生物医学类自然科学领域中较为积极活跃的学科领域之一，而交叉科学则反映了多个自然科学领域的融合。

２.１信息与图书情报领域论文的发表国家和研究机构的规范化指标

表３和表４分别给出了２０１８—２０２２年信息与图书情报领域论文发表国家和研究机构情况及其对应的传统引文指标（论文总数和总被引频次）和规范化指标的平均值。这两个表格中的数据都是根据总被引频次进行排名的，分别给出领域中排名前十位的国家和研究机构的情况。这两个表格中的ＲＣＲ和ＣＮＣＩ指标的平均值是将对应国家或研究机构在领域内发表的所有具有ＰｕｂｍｅｄＩＤ论文的ＲＣＲ和ＣＮＣＩ指标进行统计平均而获得的。从表３和表４的数据可以看出，尽管一些国家（如美国、西班牙、德国等）或研究机构（如美国加州大学、美国宾夕法尼亚联邦高等教育系统）的论文总数和总被引频次较高，但是它们所对应的ＲＣＲ和ＣＮＣＩ平均值却相对较低。这说明尽管这些国家或研究机构所发表的论文数目较多，但是其高被引论文的数目相对较少，或其论文的学术影响力相对较低。同时也进一步表明了国家或研究机构所对应的ＲＣＲ和ＣＮＣＩ平均值与总被引频次呈现较弱的相关性。图２（ａ）和２（ｂ）分别展示了表３和表４中排名前十的国家和研究机构对应的ＲＣＲ平均值与ＣＮＣＩ平均值之间的线性相关性。从图中可以看出，这些国家和研究机构所对应的ＲＣＲ平均值与ＣＮＣＩ平均值具有显著的線性相关性。根据规范化指标的定义和内涵，ＲＣＲ和ＣＮＣＩ平均值越高的国家和研究机构，其发表论文的学术水平越高，学术影响力越大。结合表３的数据可以看出，在信息与图书情报领域，相比其他国家，我国发表论文的ＲＣＲ和ＣＮＣＩ平均值较高，说明近些年我国在该领域具有较高的学术影响力。结合表４的数据可以看出，在信息与图书情报领域，中国科学院和武汉大学在国际上具有较高的学术水平。值得注意的是，在表４中，英国斯旺西大学的论文总数仅有７４，但其论文的总被引频次高达５４７８，其原因是７４篇论文中有１０余篇论文是高被引论文。这些高被引论文使得英国斯旺西大学论文的ＲＣＲ和ＣＮＣＩ平均值高于其他９所研究机构。这反映出规范化指标的一个局限性：当待评价的样本量较小时，少数高被引论文的被引频次将会对规范化指标带来较为显著的影响。

２.２遗传学领域论文的发表国家和研究机构的规范化指标

表５和表６分别给出了２０１８—２０２２年遗传学领域论文发表国家和研究机构情况及其对应的引文指标和规范化指标。从表５和表６的数据可以看出：被引频次排名前十的国家或研究机构所对应的ＲＣＲ和ＣＮＣＩ平均值与总被引频次保持较弱的相关性。对表５和表６中的ＲＣＲ平均值与ＣＮＣＩ平均值进行相关分析发现，不同国家对应的相关系数仅有０.２４８，而不同研究机构对应的相关系数高达０.９５１。不同国家所对应的相关系数较低是由于在遗传学领域不同国家发表论文的ＲＣＲ平均值非常接近造成的。从表５的数据中可以看出，在遗传学领域，尽管我国发表的论文总数和总被引频次均居世界第二位，但是其ＲＣＲ和ＣＮＣＩ平均值与其他国家相比较低，说明我国在遗传学领域的高被引论文相对较少，学术影响力与其他９个国家有一定差距。结合表６的数据可以看出，在遗传学领域，位于世界前十的研究机构均为欧美发达国家，并且都是世界知名的研究机构，而我国未有研究机构进入世界排名前十的位置。

２.３交叉科学领域论文的发表国家和研究机构的规范化指标

表７和表８分别给出了２０１８—２０２２年交叉科学领域论文发表国家和研究机构情况及其对应的引文指标和规范化指标。从表７和表８的数据可以看出，被引频次排名前十的国家或研究机构对应的ＲＣＲ和ＣＮＣＩ平均值与总被引频次呈现低度的相关性。对表７和表８中的ＲＣＲ平均值与ＣＮＣＩ平均值进行相关分析发现，不同国家和研究机构对应的相关系数分别高达０.９７５和０.９９１。这表明在交叉科学领域，排名前十的国家和研究机构对应的ＲＣＲ平均值与ＣＮＣＩ平均值呈现高度的相关性。从表７的数据不难看出，在新兴的交叉科学领域，尽管我国发表的论文总数与总被引频次居于世界第二位，但其ＲＣＲ和ＣＮＣＩ平均值相比表７中的多数国家偏低，这说明我国在交叉科学领域论文的学术影响力有待进一步提高。结合表８的数据可以看出，在交叉科学领域，中国科学院的论文总数与总被引频次居于世界第三位，其ＲＣＲ和ＣＮＣＩ平均值也处于表８中的中上水平，这说明中国科学院在交叉科学领域中具有较多的高被引论文，其学术水平相对较高。

３结论

本文选取ＩｎＣｉｔｅｓ数据库中２０１８—２０２２年１０种不同学科领域的论文作为研究对象，对这些论文的ＲＣＲ、ＣＮＣＩ和ＪＮＣＩ指标进行了相关性分析。研究结果表明，在１０种学科领域中，论文的３种规范指标之间均保持正相关；对于其中大多数学科领域，ＲＣＲ与ＣＮＣＩ指标之间以及ＣＮＣＩ与ＪＮＣＩ指标之间相关程度均较高，而ＲＣＲ与ＪＮＣＩ指标之间的相关程度相对较低。同时，本文也选取了３个具有代表性的学科領域，对其中的论文发表国家和研究机构的规范化指标进行较为深入的分析。分析结果表明，在不同学科领域中，被引频次排名前十的国家或研究机构所对应的ＲＣＲ均值和ＣＮＣＩ均值具有较高程度的相关性，且对应的ＲＣＲ和ＣＮＣＩ均值能够反映其在学科领域中的学术水平和学术影响力。目前，本文的研究仍存在一定的不足之处，如在研究中没有分析规范化指标随时间的演化、研究中选取的学科领域仍较少等。在今后的研究中，将深入分析规范化指标随时间的演化，并关注规范化指标在不同学科领域中评价论文学术影响力的差异，同时将持续挖掘规范化指标的特点，验证规范化指标评价学术影响力的一致性和有效性，并考虑将规范化指标与其他引文指标相结合，从而建立多元化、多维度的科学评价体系。

现代情报2023年12期

现代情报的其它文章: 可计算生物医学知识视角下诊疗规范知识计算化模式研究; 社交媒体中社会比较如何影响用户消费行为; AIGC赋能的科技情报智能服务：特征、场景与框架; 基于PMC-AE指数模型的中美科学数据管理政策量化评价; 面向社会公众的高等教育评价智能信息服务模型框架研究; 开放政府数据影响因素互作用框架之元综合研究