知识图谱技术在物理实验教学中的应用探讨

2020-07-27 07:52林子舰冯超超王廷振
物理与工程 2020年4期
关键词:声速视图图谱

林子舰 冯超超 王廷振 王 槿,2

(南开大学 1物理科学学院; 2基础物理国家级实验教学示范中心,天津 300071)

1 简介

物理实验是科学研究的基本方法之一,其作为科学教育的基本手段引入大学物理教育已有100多年的历史。目前,在新工科建设和课程思政建设的背景下,物理实验课的教学设计也需要不断提升[1-3]。物理实验的教学标准化设计是提高物理实验教学水平的有效途径。在进行实验教学标准化工作时,需要考虑相关知识体系演化。教师们发现基于关键词等输入的传统搜索局限于机械地比对查询词和信息库之间的匹配关系,难以建立不同学科领域间的关联关系,因此对于特定实验课题的热点、前沿等信息分析会耗费大量时间精力。另外,对于同一主题的实验,不同学校的实验装置、内容和考核标准等各不相同,在进行标准化制定时信息过于琐碎。即使是实验教学经验丰富的教师们在实验标准化建设中依旧面临诸多新问题。

科学知识图谱是以网络分析和可视化为核心方法,利用相关的可视化软件,将各节点及其关系依据其自身属性以图谱的形式表现[4]。科学知识图谱涵盖了“图”和“谱”特点,即同时具有可视化的知识图形与序列化的知识谱系两个特征。知识图谱展现了诸多学科与知识之间相互交叉、相关影响的复杂关系,这些复杂关系之中又包含了无数隐藏的新知识。通过对某一领域的文献进行计量分析,可以展现相关课题的基本形势、热点变迁、发展趋势。迄今为止,科学知识图谱已广泛应用于科学学、管理学和图书情报学等诸多领域[5]。CiteSpace是美国德雷塞尔大学(Drexel university)计算与信息计量学院陈超美教授基于Java语言开发的信息一款引文可视化软件,是目前常用的科学知识图谱绘制工具之一[6-7]。在该软件的应用方面,2012年一篇关于再生医学领域的CiteSpace应用论文[8]识别出日本京都大学山中伸弥团队的两篇论文在该领域具有优异表现和重要影响,在该文发表后5个月,山中伸弥凭借这两篇论文涉及的研究成果获得诺贝尔生理学奖。该事例体现了CiteSpace在获取知识信息方面的价值。截至2020年4月13日,中国知网上关于CiteSpace的文献已达到3696篇之多。

本文首先以声速的测量等实验为例介绍科学知识图谱的可视化技术,进行样本库的数据可视化分析,再结合目前物理实验课程标准化的具体要求,探讨知识图谱技术对实验课程标准化的辅助功能及在基础物理实验教学中的应用。

2 数据库构建及研究方法

文中的数据构建均来自中国知网(CNKI)数据库。在库中分别以“声速测量”“转动惯量测量”“多普勒效应”为主题或关键词进行检索,并根据文献的标题、关键词、摘要等信息,筛选分别得到422篇、600篇和1984篇文献作为声速测量、转动惯量测量以及多普勒效应实验的样本文献。图1给出了以“声速测量”为关键词构建的数据库特征,图中设置了每四年为一个时间切片查看该词被引用的历史频次。从图中曲线趋势可知,关键词“声速测量”的被引频次可以分为两个阶段:第一阶段为2001年之前,此时间段内该领域的施引文献发文量维持在低水平;第二阶段为2001年之后,此时间段内该领域的施引文献发文量开始明显增多。

图1 关键词“声速测量”被引频次历史

3 数据可视化分析

论文的关键词反映了该项研究的主题概念。文中进行信息抽取时选取关键词为聚点类型,再对时区选择、聚点类型、阈值调节等功能参数进行调节形成知识图谱数据库,根据模块值和平均轮廓值评估知识图谱的清晰度与可信性。多次调节相关参数,得到理想的知识图谱,进而对相关词频、突显词、相关词和时区分布等信息进行分析。

以声速的测量实验为例,将各功能参数设置为:①时间切片:1990年至2020年,每年设置一个切片;②聚点类型:关键词;③选择标准:每个时间切片中选取其中被引频次最高的50个词;④剪枝与可视化:默认剪枝类型;静态聚集视图;显示合并的网格。设置完成后运行,出图后对节点、连线等进行美化,再显示图谱。

3.1 关键词词频分析

表1展示了词频排名前18名的关键词的名称、引用频次以及中心性。其中引用频次最高的两个关键词为“声速”和“声速测量”,频次分别为101次和97次,而且中心性分别为0.30、0.41,说明其与大多数其它关键词有共被引关系,证明了数据的可信性。关键词“驻波”“超声波”“驻波法”的频次分别为34、24、17,这与目前声速测量实验中常运用超声波作为波源进行测量、使用驻波法为常用实验方法的事实一致。

表1 “声速测量”实验关键词词频排前18名

3.2 关键词聚类分析

LLR算法(Log Likelihood Ratio)即对数似然比算法,具有简单有效且易实现的特点,是计算相似度的一种常用算法[9]。形成聚类图后,软件自动生成19个聚类群,并按照LLR算法对每个聚类群提取标签词。为保证聚类的准确性,使用软件的过滤器功能并选择展示具有最大关联程度的聚类群,如图2所示。对“关键词”为聚点的聚类进行处理后我们发现,样本中“声速测量”领域主要围绕6个聚类群展开。表2展示了各聚类群中LLR对数似然值由大到小排列的前四位标签词。

图2 “声速测量”的聚类图谱(如果需要清晰的图片,请扫描二维码 下载本篇全部的图。)

表2 聚类标签词排列前四位

由自动生成的聚类群可知,目前“声速测量”领域的文献主要集中在声速测量的原理研究、实验方法以及实际应用三个方面。聚类群#2聚焦于声速测量中相关原理的讨论;聚类群#1、#6、#0则从软件仿真、测量方法方面集中于实验方法的研究;聚类群#3、#4从声速测量的应用方面进行研究。

通过点击聚类群中的任意一个节点,可以查看此聚类的信息总结,得到该聚类中各关键词的使用情况以及该聚类的施引文献,精读这些文献可做该聚类的内容分析。通过点击节点也可以查看被引历史,该关键词被引的时间切片关系图或该关键词的施引文献,进而得到对应文献基本信息。

3.3 时间线视图分析

在CiteSpace中,时间线视图是聚类视图的另一种表现形式。聚类视图测重表示基于一定知识基础的研究前沿,而时间线视图侧重于描述聚类之间的关系和某个聚类中施引文献的时间跨度。如图3所示,同一聚类的关键词被串连在一条水平线上,这条水平时间线展示了该聚类群的历史成果。在这条时间线上,可以获知哪些年份在某个聚类中出现了具有影响力的文献,并如何影响这个聚类的发展,或如何影响着其他聚类的出现或终结。通过对时间线视图的分析,可以更直观了解实验的历史发展脉络。例如在2010年附近出现了声速实验相关的虚拟仪器。

图3 “声速测量”的时间线视图

3.4 时区图与突变词图谱分析

时区图是另一种侧重于从时间维度上表示知识演进的视图,它可以清晰地展现文献的更新和相互影响。图4的时区视图展示了节点之间的演化关系。

图4 “声速测量”的时区视图

CiteSpace可以通过分析突变词生成突变词图谱,计算出相关词引用量在哪一年份激增,并且直观呈现出该词的流行时间。如图5所示,图中year,strength,begin和end分别表示为该词首次出现时间、研究热度、开始流行时间与趋冷时间。突变次图谱适用于对知识点和测量方法等的分析。

图5 “声速测量”的突变词图谱

图5中,突变词“气相声速”和“圆柱定程干涉法”不仅在突显时间上一致,还存在共被引的关系。这后面的物理知识背景包括,2009年国际温度咨询委员会推动通过重新测量玻尔兹曼常数来重新定义热力学温度,这引起了相关学者的广泛关注[10]。气相声速是流体的基本热力学参数之一,也是测量准确度最高的热物性参数之一。在气相声速测量方法中,圆柱定程干涉法可以取得较高的精度。清华大学建立了测量高压气相声速的实验系统,为该领域研究奠定了研究基础[11]。因此,在2013年与2014年间,清华大学热科学与动力工程教育部重点实验室在“气相声速”和“圆柱定程干涉法”及相关领域的发文量激增,在国内形成了该领域知识演化的一个突变点。在基础物理实验中,将这项内容结合2018年11月的第26届国际计量大会中对于千克、安培、开尔文和摩尔4个基本单位改由普朗克常量、基本电荷常量、玻尔兹曼常数和阿伏伽德罗常数来定义的计量领域背景知识讲述,可以丰富学生对国际单位制趋于稳定性和通用性的发展过程的认识。

在标准化过程中,时区图和突变词图谱可以帮助教师对该实验课题的历史发展格局有直观的了解,了解知识的发展历程。

4 科学知识图谱对实验标准化的辅助作用

下面将结合实验标准化工作中的课程思政、分层次教学、能力培养、知识点、关联学科与延伸实验等模块,分析知识图谱技术的关键词词频分析、关键词聚类分析、时间线视图分析、时区图与突变词图谱分析等功能所提供的信息,探讨其与实验教师的专业背景结合辅助标准化设计可行性。

4.1 课程思政

实验课程中的课程思政元素涵盖了科学精神、实验思想、物理规律的发现过程、科学辩证法等诸多因素。在用CiteSpace辅助课程思政设计时,我们应重点关注与关键词有直接关联的其他关键词,因此作图之前调整选择标准为“g index”,并设置其参数k=25。图6展示了“声速测量”节点及其直接关联的节点。在直接关联的节点中选择“实验物理教学”关键词,查看其引文历史找到相关文献。18世纪德国物理学家孔脱在前人工作的基础上于1866年首创测量声速的方法,他发明的孔脱管仍在基础物理实验中得到应用[12]。以同样的方式对“换能器”节点进行分析,可以找到其它若干篇文章,白福义等介绍了一种采用脉冲回鸣原理的声速测量装置[13],这种装置与适当探头配合使用,可以测量液体、固体、生物软组织等多种媒质的的声速。

图6 “声速测量”的节点及其相关节点

通过对聚类图中的高频引用节点以及主要聚类的分析,还可以得到国内外对于相关领域研究的深度、广度以及方向上的不同信息。例如,在“多普勒效应验证”实验的可视化分析中,我们对国内外文献样本进行综合分析。通过查看图7中的节点“bench-scale experiment”“estimation theory”“interference suppression”的施引文献,可见国外该领域在实验方法及相关原理上的侧重点。

图7 “多普勒效应”的聚类分析图

4.2 分层次教学

在进行分层次教学工作时可以通过分析实验的聚类情况,找到聚类中关于实验方法中的聚类群,重点分析此聚类群。通过表2中我们总结出聚类群#0是关于声速测量实验方法的聚类。查看聚类群#0的信息总结,在该聚类群中词频排在前几位的关键词有:声速、不确定度分析、变频测距法、声速测量、数字示波器、时差法、相位法、超声波、驻波法。该聚类的施引文献对测量声速经典方法,包括驻波法、相位法、时差法、变频定距法、超声光栅法的原理进行了简单分析[14]。

此外,分析聚类图时可以由大到小调节显示节点标签的门槛,先后显示引用程度较高的关键词。如图8所示,“转动惯量测量”实验中引用程度较高的几个关键词中,与实验方法有关的关键词的引用程度较高,如关键词“三线摆”“扭摆”“复摆”等,再通过分析单个关键词节点的引用历史可以进一步获得有价值的信息。

图8 “转动惯量测量”的聚类图谱

4.3 学科关联

以声速的测量为例,分析表2得到聚类群#3、#4是从声速测量应用的角度进行聚类的。首先对聚类群#3进行聚类内容分析,施引文献中,石明吉等设计了一种利用单片机及步进电机等搭建了全自动声速测量系统,并利用驻波法和相位比较法进行声速测量,在数据处理上应用了傅里叶变换方法去除次峰的影响,显著减小了数据的相对误差[15]。对聚类#4做同样分析,陈军等通过光纤探针探知冲击波与三氯甲烷间作用的发光强度,测得炸药超压爆轰的拉格朗日声速,并确定热力学CJ态[16]。此外,样本检索条件放宽的知识图谱分析中,会产生更多相关聚类,通过聚类分析,可以得到声速测量与其它学科关联情况。例如在“神经网络”聚类中,郑大腾等阐述了如何在神经网络算法等手段下通过测量声速得到压力的大小[17]。说明了在复杂工程应用背景下,正是声速具有与温度、介质的成分等相关的物理本质,导致传统测量方法不适用,进而产生了利用人工智能算法进行声速测量的新方法。在时区视图中,节点“声学温度计”中的文献展示了通过声速的测量获得高精度的热力学温度的技术方法[18]。在节点“热力学性质”中,张凯将液相以及超临界区声速作为流体的热力学性质进行分析,并通过一定方法获得了超低偏差的纯水液态声速[19]。此外,节点“测量”中的文献,光学Mach-Zehnder干涉仪被用于海水的声速测量,并取得了高精度的测量结果[20],这个知识点也与声呐技术在海洋学领域广泛应用相关。课堂中,结合这些案例进行分析,一方面可以强化学生对声波的物理本质的理解,例如声音的波动特性,声速与温度、介质的成分等相关的性质;另一方面,可以增强学生对于工程应用、信息技术、人工智能等跨学科领域的理解。

转动惯量测量实验的各聚类如图9所示。聚类“#14 matlab”提示了 matlab软件在教学中的应用。聚类“#4 单片机”展示了单片机在改进实验装置方面的应用。对聚类#4、#14分析,可以得到转动惯量的测量与信息技术、电子技术等学科关联。

图9 “转动惯量测量”的聚类图谱

上述例子显示出在新工科背景下,利用知识图谱技术在基础物理实验教学中融入学科关联,培养复合型、应用型人才的优势。

4.4 延伸实验

分析图2中“声速测量”的聚类图谱中的“多普勒效应”节点,并对该节点对应的关键词及其所在聚类分析,得到该节点属于聚类#0。提取聚类信息总结中的文献[21],任常愚等对传统声速测量实验的实验装置改进,实现了利用超声波的多普勒效应和拍来测量声速。同样可以对图2中聚类#1中的节点“远程实验”做引用历史分析,周旋等[22]提出的一种应用Labview软件等实验平台进行声速测量的远程实验办法。通过对节点或者聚类的分析,可以实现不同实验之间的关联信息。

5 总结与展望

知识图谱技术利用软件进行知识可视化分析,能够从海量、模糊的知识中合成清晰有效的信息,并对相关领域研究做出科学分析。本文以声速的测量等经典实验为例,以CNKI数据库中的论文作为样本,探讨引文可视化软件CiteSpace在实验课程标准化中的应用。直观的知识图谱可以在课程思政、分层次教学、学科关联与延伸实验等各个环节提供信息,辅助实验教师高效分析相关知识领域的知识演化进程,从而提高实验教师工作效率。在物理实验教学领域引入人工智能,从海量信息中提取相关领域的演进历程与方向,以此获得的知识点和知识体系演化等知识也可用于后续的实验教学和研究,为今后的实验教学发展提供了启示。

猜你喜欢
声速视图图谱
基于图对比注意力网络的知识图谱补全
火箭起飞和跨声速外载荷辨识方法
绘一张成长图谱
声速剖面未知条件下的平均声速计算方法∗
图表
视图
Y—20重型运输机多视图
SA2型76毫米车载高炮多视图
声速表中的猫腻
声速是如何测定的