重大科技基础设施对学科领域发展影响的计量评价
——以对撞机为例

2022-05-31 17:34李华东张晶晶刘细文

科技管理研究 2022年8期

李华东，张晶晶，2，刘细文，2

（1.中国科学院文献情报中心，北京 100190；2.中国科学院大学经济与管理学院图书情报与档案管理系，北京 100190）

1 研究背景

自20 世纪中叶出现具有大科学特点的项目工程后，世界各国建设了聚焦于不同领域、服务于多种需求的重大科技基础设施（以下简称“重大设施”）。罗小安等［1］、王贻芳等［2］将重大设施分为3 类：以热核聚变反应装置、太空望远镜、粒子对撞机为代表的专用型重大设施；以散列中子源、同步辐射装置、X 射线自由电子激光装置等为代表的公共实验平台；以遥感卫星、生物物种资源库、子午工程为代表的公益基础设施。以中国科学院（以下简称“中科院”）为代表的国内机构，目前在能源科学、空间天文科学、粒子物理与核物理、生命科学、地球系统与环境科学、材料科学、工程技术科学等领域已建设完成了20 多个重大设施，在全国范围内也有超过60 个运行或在建的重大设施［3］。

重大设施在学科领域发展、工程与技术创新、经济和社会进步、人才培养和国际合作等多方面具有广泛且重要的影响。针对重大设施的影响作用，国外机构和学者开展了系统的研究工作，如Carrazza等［4］从出版物、被引数、H 指数度量了欧洲大型强子对撞机（LHC）对高能物理实验的影响，并通过分析引文分布趋势构建了高能物理领域的知识传播模型；在分析重大设施对经济创新和社会产生影响的报告中，经济合作与发展组织［5］将欧洲核子研究中心（CERN）整体视为重大设施，并提出了6 类影响，这些影响的来源包括科学成果、工程建设及运营、人员培训、国际合作、教育和宣传以及科研过程中的技术创新等，同时认为旨在提高基础知识的纯科学成果的影响难以预测和评估，因此并未对其作详细分析；Heidler 等［6］在量化评估直线对撞机相干光源的运行情况时，从出版物的被引次数和影响因子角度分析重大设施的科学影响及其影响力与成本投入的关系。国内学者的关注点则主要集中于社会经济领域，如陈光［7］从经济发展、技术创新、人力与社会福利等角度出发，构建了分析重大设施经济与社会影响的理论框架；程晓舫等［8］分析了重大设施优化布局和共建共享的思路，开展了设施对区域一体化影响的数字化研究；徐慧芳等［9］介绍了国外研究建立的重大设施产生影响的逻辑框架，并综述了重大设施社会经济影响的评估方法，其中包括基于经济模型的方法与基于指标的综合评价方法。

重大设施对学科领域发展影响的研究中，最突出的一点不足便是多数文献将发文量、被引数等简单计量指标作为衡量重大设施影响的因素，既没有明确影响的内涵，也未对影响过程进行分析，对影响的认识不够深入。此外，专用型重大设施是为研究特定领域而建设，其最核心效益体现为科学成果以及对本学科领域发展的影响，为了深刻认识重大设施战略价值，充分发挥重大设施科研潜力，支撑未来重大设施的统筹布局，极有必要开展重大设施对学科领域发展的影响及评价研究。因此，本研究以专用型重大设施中的对撞机为对象，从其产出的科学成果出发，构建重大设施对学科领域发展的影响机制，并借鉴Law 等［10］的做法，类比领域热点分析中的战略坐标概念，提出基于引文分布和主题强度演化的三维战略坐标，以判别设施成果影响的不同类型，并通过对比分析中、日、欧三方对撞机的成果产出及影响情况，为中国重大设施的发展与管理规划提供参考建议。

2 研究设计

2.1 影响机制模型构建

分析重大设施对学科领域发展的影响需要明确4 个要素：重大设施对学科领域发展的影响来源、影响体、影响类型及其作用特点。其中，直接来源为重大设施的实验结果，以相关文献作为体现，而这些文献的被引用情况能够直接反映出重大设施成果对学科领域发展的影响。为了明晰研究路线，提出如图1 所示的影响机制模型。其中，一篇成果文献对主题领域A产生影响，领域A之后的发展情况由有关学术论文体现，则引用了上述成果文献的学术论文被称为施引文献；同时，该成果文献也会对其他主题领域（B、C、D……）产生影响。成果文献是体现重大设施在学科领域发展中起作用的核心产出形式，因此通过考察其被引情况，可以对重大设施的成果价值进行量化。引文时序分布（以下简称“引文分布”）可以直观地量化一篇文献的重要性和时效性；施引文献中的主题演化情况则进一步从语义层面揭示了重大设施成果的影响，如包含主题领域A的施引文献的数量分布与其他主题领域的施引文献所组成的引文分布，共同表征着重大设施成果对主题领域A发展的不同影响类型。

图1 重大设施成果对学科领域发展的影响机制模型

基于上述分析，按照“获取文献数据—抽取主题强度—定义影响类型—提出类型判别指标—形成判别条件—构建三维战略坐标—应用”的分析路线展开研究（如图2 所示）。

图2 重大设施成果对学科领域发展的影响分析路线

2.2 技术方法与研究对象

抽取能体现文献核心内容的关键词，以及划分有效主题是整个工作的基础。目前应用广泛的关键词抽取算法有TF-IDF（词频-逆文档频率）、TextRank 算法、LDA（Latent Dirichlet Allocation）主题模型等。以上算法的应用广泛，如周宁等［11］利用TextRank 算法抽取关键词，赵晓平等［12］利用TF-IDF 方法结合词向量抽取关键词并聚类主题，顾益军等［13］、宁建飞等［14］将LDA 主题模型和TextRank 算法、Word2vec 模型结合抽取关键词。

关键词抽取是主题抽取流程的其中一步，后续仍需对抽取到的关键词进行识别并划分有效主题。以上方法中，LDA 主题模型可得到分类后的主题（需人工解读）和对应的关键词，TF-IDF 和TextRank算法仅能用来抽取关键词，对于主题的识别还需要结合其他（聚类）算法。不过，上述方法存在多种问题，如TF-IDF 会把在不同文档中同时出现的关键词筛选掉，而这明显是不合理的；TextRank 算法需要构建词图以及进行迭代计算，整体速度较慢，且效果并不显著优于TF-IDF 方法；LDA 主题模型本质上是基于统计的算法，它能给出主题-关键词间的共现，但在语义层面依赖于人工干预。此外，在主题确定方面，即使有多种方法（文本聚类、困惑度、贝叶斯模型等）来协助选择主题数量，但模糊性仍然较大。基于以上考虑，本研究提出一种更为直接的主题抽取算法。

2.2.1 基于模式匹配的主题抽取法

对于关键词抽取，由于作者书写习惯的不同、单词含义的多样性以及行文结构的变化，将文档中的周边共现词作为一个关键词整体更为合理。所谓模式匹配，就是给定一个（文本）数据结构，然后在全部数据中找出与该数据相同的内容。例如，将词组“standard model”作为给定数据考虑共现词的模式匹配时，如果文本中出现“standard abc model”“abc standard of model xyz”等形式时，也会被判定为匹配成功，其中，“of”一般作为停用词；“abc”“xyz”为不影响语义结构的其他单词或停用词。本研究使用的基于模式匹配的主题词抽取法具体步骤如下：

（1）读取一定数量的施引文献关键词，采用专家判读法进行分类整合成主题词，每个主题词下包含一系列关键词组成关键词库。

（2）对所有施引文献的题目、摘要和关键词进行词频统计，将词频较高的单词定义为保留词。对保留词及其周边共现词与关键词库进行模式匹配，若匹配成功，则无新主题元素产生；若未能完成匹配且词频模式强度较高，则将此类共现词模式保留并构建新的主题词。所有主题词及其对应的关键词库统称为主题词库。

（3）将施引文献按发表年份进行时间切片，对每篇论文的题目、摘要和关键词进行模式匹配，将匹配出的主题词按年份合并，遍历文献数据中的所有文档后，便得到了所需的历年主题及其强度。

通过以上步骤，构建了一套适用于高能物理领域的主题词库，并编写了基于模式匹配的主题抽取算法。

2.2.2 研究对象

用于粒子物理实验的对撞机是具有重要战略地位的科技基础设施。为了使研究更具针对性，研究对象的选择基于以下几方面考虑：（1）目前仍在运行；（2）包含目前世界上最先进的对撞机；（3）包含中国的对撞机；（4）与中国对撞机有对比性；（5）对未来规划有参考意义。最终选择的研究对象包括欧洲的大型强子对撞机（LHC）、中国的北京正负电子对撞机（BEPC）以及日本的非对称正负电子对撞机（KEKB）1）（以下简称“样本”），其中，LHC 是目前在运行的、全球最先进的对撞机；BEPC其与BEPC 都属于电子对撞机，对撞能量接近、研究领域有所交叉，具有可对比性；LHC 和KEKB 分别是目前对撞能量最大和亮度最高的对撞机，二者有部分交叉的研究领域，对中国未来的重大设施规划具有一定参考意义。参考陈和生等［15］、Belleii［16］和肖振军等［17］的研究，整理汇总了样本对撞机的部分信息（如表1 所示）。

表1 样本对撞机部分主要信息

2.3 影响类型的定义与判别

2.3.1 类型定义

所谓设施成果影响类型，分类标准来自于设施成果对学科领域发展所起的不同作用。一个领域的完整生命周期可分为酝酿、增长、繁荣和衰落等4个阶段，对于一个设施成果而言，其可能会令一个领域繁荣发展，可能会使之衰落，也可能会出现在成果发表几年后又对该领域发展起到支撑作用的情况（如“睡美人”文献）。专用型重大设施（对撞机）的成果展现是真实的实验结果，因此可以排除负面的施引原因（即施引文献是为了反驳而引用）；余下的则是正面（成果有用）和中立（仅作提及）的引用。

从引文分布和主题强度演化趋势出发，在ISI Web of Science 数据库中下载LHC 的ATLAS、CMS、ALICE、LHCb实验组、KEKB的Belle实验组、BEPC的BES实验组发表的成果文献。为了满足影响类型判别的分析需求，需要确保到2020 年年末时引文分布和主题词强度的演化至少经过了4 年，以达到判别所需的最低年份数要求，筛选了2016 年前发表的成果文献数据（见表2）。此外，对成果文献的引文分布及施引文献的主题强度演化进行多轮实验分析后发现，强度大于40 的施引文献主题能形成较为稳健的演化曲线，而满足该强度的成果文献的被引数几乎全部在100 以上，因此，将分析范围限定在2016年前发表的、被引数大于100的成果文献中（本研究称之为“高被引文献”）。统计发现，可供分析的成果文献的施引文献共有82 070 篇，从中抽取了931 个主题，以此归纳总结了重大设施成果的4 种影响类型（见表3）。数据采集时间为2021 年2 月15 日。

表2 样本各实验组产出文献主要指标

表3 重大设施成果的4 种影响类型

2.3.2 判别条件

从表3 可以看出，类型1 和类型2 的影响更为持久，它们之间最大的区别在于重大设施成果价值凸显时间的早晚；类型3 和类型4 则与成果价值的持续性和重要性紧密相关。如类型3 可从类型1、2退化而来，即当高影响的重要性不够、后期突出影响的持续性或重要性不足时，将其归为类型3；类型4可从类型1、3 退化而来，即当高影响的持续性不够，或一般影响的重要性不足时，将其归为类型4。参考李凌英等［18］的做法，用重大设施成果价值凸显时间（以下简称“凸显时间”）代表施引文献中主题强度达到年度最大值时距离成果文献发表的年数。

表4 样本成果价值持续参数

进一步提出面积差值法（见图3）来判定比值整体是否满足价值持续性。图3 中横坐标的“年份”表示距Sij(H)出现后的年份数，纵坐标的“比值”对应表4 中的参数值。D1表示表4 中第2 列参数连接形成的折线与坐标轴上部所围区域的面积，即阴影部分，D2、D3、D4同理。D(t)表示待判定的区域面积，即虚线与坐标轴上部所围区域，其中t表示所在年份。面积差值法判定的数学形式为：

图3 样本成果价值的比值区域

式（2）中：参数0.15 为分析总结后得到的经验数据。

根据是否满足式（1），可影响类型1 和类型2进一步划分为4 种类型（见表5）。

表5 重大设施成果价值持续条件与影响类型

以上主要围绕主题强度的演化过程判别重大设施成果影响类型，若是仅考虑主题强度演化很容易因为不同主题间的数据量差异而带来误判，所以结合考虑引文分布很有必要，否则主题强度很高但持续性较低的重大设施成果影响可能会被误判为类型3 或类型4，而强度较低的主题却很可能由于整体波动性较小而被误判为类型1。一篇关于重大设施成果的文献一般会涉及多个主题领域，其中受影响较大的领域会集中且有目的地引用该成果，塑造了引文分布的整体走势；受影响不太显著的领域则会相对随机地出现在施引文献中。综合考虑主题强度与引文分布的演化模式，有助于对重大设施成果的影响类型进行合理分类，为此，本研究提出“价值重要性”的概念，以主题强度和引文分布趋势的相关系数衡量，并利用Pearson 系数对二者演化趋势的相关程度进行度量，形式如下：

2.3.3 三维战略坐标

基于上述分析，可形成系统判别设施成果影响类型的三维战略坐标，其中凸显时间、持续性、重要性分别是3 个维度的判别指标。图4 给出了三维战略坐标的二维表示，其中横坐标原点为0.15，纵坐标原点为0.80。圆形、方形分别代表价值凸显时间为设施成果发表后的前两年、3 年及以上年份。图框中的数值表示在不同的象限下对应的影响类型。

图4 重大设施成果价值的三维战略坐标

3 研究结果

3.1 影响类型判别

结合相关判别条件与图4 各个象限所对应的影响类型，判断样本对撞机的6 个实验组成果文献影响类型，统计结果如表6 所示。

表6 样本各实验组对应的影响类型分布

总体而言，带来类型1 影响的重大设施成果文献数量最少，且主要集中于ATLAS、CMS 实验组；ALICE、LHCb 和Belle 实验组带来类型2 影响的文献数量要多于类型3，而ATLAS、CMS 和BES 实验组则相反；此外，ATLAS 和CMS 实验组带来类型4影响的文献数量占比较高，分别达到了39.47%和31.50%，这与另外4 个实验组有明显区别。从4 种影响类型的定义与内涵可知，类型1 和类型2 对有关学科领域发展产生了较为积极正面的影响，由此进一步将类型1 和类型2 命名为“积极类型”，将类型3 和类型4 命名为“一般类型”。各实验组对应的两种类型分布情况如图5 所示，可见ATLAS、CMS、BES 实验组的一般类型数量明显多于积极类型；ALICE、LHCb、Belle 实验组两种影响类型数量较为接近。

图5 样本各实验组对应的两种影响分布

分析得到影响类型1 实验组对应的主题情况如表7 所示。

表7 样本影响类型1 实验组的对应主题

影响类型2 在6 个实验组都有出现，其中ATLAS 共涉及27 个主题词，CMS 为31 个，ALICE为11 个，LHCb 为18 个，Belle 为15 个，BES 为7 个。限于篇幅，表8 仅列出了各实验组对应的前10 个主题词。

表8 样本影响类型2 所涉及的主题

3.2 成果产出评价

从以上分析可以看出，虽然LHC 的运行时间最短，但其论文产出总量大幅领先于其他两个重大设施；即使将其包括的4 个实验组分开来看，LHC 的产出效率也有明显优势。在高被引论文占比方面，KEKB 的Belle 实验组的表现稍微优于LHC 中的ATALS、CMS 实验组，明显优于与其研究领域相一致的LHCb 实验组。在主题抽取方面，对比ALICE和LHCb 发现，虽然LHCb 对应的施引文献数（6 933篇）远小于ALICE（10 242 篇），但从LHCb 的施引文献中抽取到的主题数量（104 个）明显多于ALICE（77 个）。此外，Belle 实验组在高被引论文占比与数量方面都要明显高于LHCb 实验组，但从二者相应的施引文献中抽取的主题数却无显著差别，表明LHCb 实验组的成果可能更具广泛影响，在文献数量不占优势的前提下也能影响到足够多的领域主题数。

从影响类型分布可以看出，ATLAS、CMS 实验组的成果在影响领域发展方面占有数量上的绝对优势。在不同影响类型的分布方面，影响类型1 集中出现在LHC，表明LHC 对促进学科领域发展具有重要作用。ATLAS 和CMS 是LHC 最为先进与核心的两个探测器，它们具有同样的探测目标，研究领域为希格斯物理、高能标下的新物理等，由于世界上没有同等能量量级的对撞机，因此这两个实验组之间相互补充和相互验证；在影响类型方面，二者带来的影响类型4 的比例明显高于其他实验组，一个可能的解释是虽然它们的论文产出十分高效、成果影响范围广，但至今只有少数具有真正促进学科领域发展的价值。在成果产出量与全类型的影响数量方面，ATLAS 和CMS 实验组均取得了显著成效，为学科领域开疆拓土起到了重要作用。ALICE 是在LHC 上进行重离子对撞实验的探测器，其主要研究对象为夸克胶子等离子体，后者是宇宙大爆炸之初富集的物质形态。值得注意的是，从图5 可以看出，ALICE 是唯一一个带来积极影响类型多于一般影响类型的实验组。由于ALICE 对应的主题抽取数量较少，本研究推断ALICE 实验组成果所影响的领域主题较为集中，且有效推动了这类领域的发展。LHC的LHCb 探测器和KEKB 的Belle 探测器都侧重于B物理、CP 破坏等研究，其对应的影响类型分布也表现出了明显的一致性，特别是在积极影响类型和一般影响类型的占比方面二者差别较小，本研究推断比起设施参数，设施成果的影响表现与其研究领域更相关。

而中国的BEPC 在成果产出方面与其他设施有较大差距。当然，考虑到设施建设年代、投入资金、工程参数等方面，这种比较并不公平但仍有参考意义。BEPC 是专注于粲物理研究的国际领先的对撞机，不过由于能量参数的限制，其所研究的领域并不广泛。抛开成果的数量，从图5 可以发现，BES 实验组对应的积极影响类型比例与CMS 实验组十分接近，而无论是研究领域还是设施参数，BEPC 和LHC 都相差巨大，因此上述的比例接近情况值得后续研究。与BEPC 相比，LHC 的运行时间并不长，且在LHC之前没有对撞机能开展TeV 量级的实验工作，因此，依赖于ATLAS 和CMS 进行的实验也远没有BES 的成熟。换言之，在ATLAS、CMS 上开展的希格斯物理、新物理等领域研究还有很大的发展空间，BES 在粲物理、tau 轻子等领域或许还会有新的重要发现，但相对来说或许已发展到了较为成熟的阶段。结合图5 的比例情况，本研究推断：一个领域的发展阶段可以通过设施成果在领域内的影响类型比例来估测。同时，CMS、ATLAS 所探索领域还有许多仍未解决的问题，结合以上分析可知，类似的影响类型比例情况或许体现了探索这些领域的困难程度。此外，还有一种可能便是该比例情况体现了设施的运行水平。不过，鉴于本研究认为重大设施成果的影响表现与研究领域更为相关，因此暂不能草率地通过此指标来评判设施的表现。

4 结论与讨论

本研究通过结合文献数据中的引文分布和主题强度演化过程，探究了LHC、KEKB、BEPC 等重大设施的论文产出、聚焦主题领域等情况，定义了重大设施成果的不同影响类型，形成了判别重大设施成果影响类型的三维战略坐标。基于以上结论，为促进中国重大科学基础设施发挥对学科领域的基金影响，提出以下建议：

（1）提高现有设施运行与科研效率，充分发挥设施性能潜力。中国的BEPC 已建成运行了30 余年，虽然在2009 年之前取得了几项国际领先的重要成果，但成果总量较低；2009 年完成性能升级后，成果产出量稳步上升，2013 年发表了影响力最高的一篇论文。可见，科研进步是点滴推进的，量变可引起质变。中国目前仅有BEPC 一个对撞机，在当前客观环境下，为了持续提升中国在高能物理领域的总体水平，需要充分发挥BEPC 对撞机的最高性能，提高重要成果产出效率。

（2）建设世界领先的重大设施，提升中国科技水平与领域内影响力。作为世界上最先进的对撞机，LHC 的科技水平、综合实力、成果数量与质量等方面都远超其他同类设施，即使在物理领域外，它的知名度与影响力也是其他设施所不能匹敌的。在后LHC 阶段，目前世界上已有多个关于未来对撞机的提案，其中，中国科学院高能物理研究所于2018 年发布了环形正负电子对撞机（CEPC）的概念设计报告［20］。30 多年前，中国在规划建设BEPC 时受到了资金等多种因素的限制，但如今的中国有足够实力建设世界领先的新设施，可以预见，随着未来更多重大科学基础设施的建设运行，中国多个领域的科技水平与影响力会实现大跨越。

（3）发掘具有优势前景的研究领域，紧盯领域前沿的同时做到多面推进。KEKB 和LHC 各自都有明确的物理目标，其中，KEKB 是为了验证CP 破坏，LHC 要寻找希格斯粒子；同时，基于设施应用的相关学者获得了诺贝尔物理学奖［21］。从KEKB 的建设经验可以看出，发掘具有良好前景的重要领域、做好多领域的协同发展是推动研究领域发展的关键。

（4）进行专业的第三方评估，推动未来合理布局。重大设施伴随着高投入、高风险，在第三方对其开展系统评估时，需要进行广泛全面、更为专业深入的分析，有助于推动未来设施的合理规划和布局。

然而，本研究中并未对LHC 的ALICE 实验进行同类对比分析，且由于主题演化趋势的多样性与复杂性，很难以一种机械的方式涵盖所有演化情况，所以今后可以用神经网络等更智能的方法来判别影响类型。

注释：

1）KEKB 已于2018 年升级为SuperKEKB，为了行文的简洁统一，本文中称之为“KEKB”；BEPC 也已升级为BEPCII，本文中称之为“BEPC”。

重大科技基础设施对学科领域发展影响的计量评价——以对撞机为例