基于CiteSpace 的总氮检测知识图谱分析

2023-09-05 04:42史红雨王玉欣
山西化工 2023年8期
关键词:发文图谱可视化

罗 颖,史红雨,王玉欣,张 薇

(1.江岸区生态环境监测站,湖北 武汉 430010;2.广州医科大学生物医学工程学院,广东 广州 511436)

0 引言

近年来,随着我国对环境保护事业的高度重视,环境监测在环境保护事业中的作用也获得越来越高的关注。环境监测是对人类和环境有影响的物质含量、排放量的检测[1]。我国水质恶化呈现逐年恶化的趋势,污水排放总量逐年增加[2]。总氮(totalnitrogen,TN)是水中各种形态无机和有机氮的总量,主要反映水体受污染的程度和自净状况,是水体污染监测体系中主要的污染指标,也是衡量水质营养化的重要指标。

目前,少有完整的知识体系对总氮检测进行详细全面的归纳分析。知识图谱是人工智能应用的基础技术,是目前解决数据多源分布及信息超载最有效的方法。为此,本研究基于知识图谱可视化分析,以中国知网(China national knowledge infrastructure,CNKI)收录的总氮检测相关文献为对象,应用知识图谱分析工具CiteSpace 软件,对近10 年来已发表的关于总氮检测的文献进行可视化分析,以探究总氮检测研究的热点与趋势,为国内总氮检测的进一步研究提供借鉴。

1 数据来源及分析方法

1.1 数据来源

CNKI 是国内收录文献最为全面的文献数据平台[3],本文中进行分析的数据均来源于CNKI 数据库。通过CNKI 数据库进行高级检索,设置主题为“总氮检测”,设置时间范围为2012 年1 月1 日至2022 年1 月1 日,选择学科为“环境科学与资源利用”,共得到1 174 条记录。

1.2 基于CiteSpace 软件的分析方法

对时间序列内的发表文献进行分析在一定程度上可以反映出学者专业对一个领域的关注度[4-5]。本文的研究是基于CiteSpace 软件进行的,该软件是由陈超美博士联合大连理工大学基于“共现聚类”,运用Java 程序进行设计研发的,可以把研究领域的分布、发展规律等进行可视化展现,进而分析研究领域的热点和发展趋势[6-7]。

通过CNKI 自带的可视化分析对发文量和主要主题进行统计。由于文献数量多、涉及的方面广、研究内容多,具有一定的时间跨度,为了对文献涉及领域及内容进行更为全面的关联性统筹分析得到更加有全局观的数据,通过CiteSpace(5.8.R2 版本)对批量导出的文献进行关键词聚类分析、关键词凸显分析、作者合作贡献分析等。

1.3 数据预处理

为了更好地使用CiteSpace 对数据进行分析,使用软件自带的数据转换界面对数据进行预处理。通过数据预处理不仅可以修正导出数据的格式还可以对数据进行过滤和除重,最大程度上保证后续分析的准确性[6-7]。

2 可视化结果与讨论

2.1 关键词聚类分析

关键词是快速提取一篇文献核心思想的重要因素,在文献分析中起着关键性作用。因此对文献进行关键词分析,分析关键词出现的频次和中心中介性(用于衡量网络中节点的重要性的指标,中介中心性越高,节点的重要性越高[5])。通过对文献关键词进行可视化聚类分析,得到关键词聚类图谱,如图1 所示。

图1 关键词聚类图谱

对所得的关键词聚类图谱进行分析,得到节点359 个,连线567 条,对分析的关键词进行频次和中心度的统计,汇总为关键词频次及中心度信息表,见表1。

表1 关键词频次及中心度统计表

由图1 和表1 可知,其中出现次数最多的是“总氮”,频次为91,其次是“水质”和“水质评价”,频次分别为70 和59。发现关于总氮的分析一般都是对于水质进行分析,更加详细来说是对水质进行评价,其关联性很强。从初次出现的年度来看,都是2012 年首次出现,可见水质总氮的分析和评价是较早的研究成果和方向,时至今日,仍是该领域方向的研究热点。

同时对中心度的强弱程度进行分析,可以看出关键词之间并不是独立存在的,多个关键词往往存在一定的相关性[8]。同时,分析关键词的中心度也可以确定在水质总氮检测方向的主要研究领域和基本内容[9]。较强中心度的关键词往往与其他关键词有更强的联系。由图1 和表1 可以看出,“脱氮除磷”和“总磷”两个关键词的中心度相对较高,分别为0.36 和0.41。可以看出,对于水质总氮检测方向的分析,更多的研究出现在如何解决水质中存在氮和磷的问题,同时总氮和总磷的分析也是息息相关的。脱氮除磷相关技术工艺广泛应用于污水的处理,随着近几年水处理微生物学方向的深入研究,生物脱氮除磷工艺由简单地将几种基本原理相叠加逐渐向耦合工艺转变[10]。可以看出目前对于水质总氮检测方向而言,不仅仅关注对于水质的检测评价,如何解决这一城市污水问题,也是广泛研究的对象。

2.2 研究趋势及前景分析

使用CiteSpace 自带的Burstness 功能,对关键词进行突显分析,可以反映出某一阶段研究者所关注的该研究领域的研究热点及发展趋势[6],获得关键词突显图谱,如图2 所示。水质总氮检测方面的研究是一个连续的过程,在2012 年出现的关键词,其中间的发展没有断层,一直都是保持着继续研究发展的状态。研究初期,出现的更多是对水质总氮的全局描绘或是对于一种工艺大领域的描述研究。随着时间的推移,出现了对水质总氮升高的污染源的一种分析讨论,探究造成水质污染的原因,找到了源头就更能快速应对水质污染问题,找到更加直接的解决方法和预防手段。

图2 水质总氮检测关键词突显图谱

总体上来看,水质总氮检测的研究大方向依旧是保持不变的,但是研究越来越多元化,无论是加入模型的运用或者采用高通量的方法,都是在提升现有的检测和处理手段。水质评价和工艺精进依旧是水质总氮检测的热点和发展趋势。

2.3 年度发文量分析

通过上述数据检索方式,在CNKI 数据库共得到1 174 篇记录,其中学术期刊216 篇、学位论文945 篇(硕士817 篇,博士128 篇)、会议10 篇、特色期刊2 篇、成果1 篇。

以时间为单位,从发文数量上进行统计学分析,得到2012—2022 年度发文量统计图表(图3)。通过对发文量折线图进行分析,可以发现发文量呈现稳步提升的趋势,但在2020—2021 年这个时间区间内出现大幅度的下滑,针对发文量下降这一问题,分别对不同“研究层次”的发文量进行逐年统计,得到2012—2022 年度不同“研究层次”发文量统计表及统计图(图4)。可见“技术研究”类文章的发文量下降趋势最为明显,但是当“技术研究”、“工程研究”和“技术开发”类文章都呈现发文量下降趋势时,“应用基础研究”类文章发文量是继续呈现上升状态的。根据“研究层次”的发文量比较可以看出,针对“总氮检测”这一研究方向而言,基础研究仍在继续,保持着一定的发展趋势。虽然“技术”类研究的发文量有下降的趋势,但是在基础研究没有停下的基础上,发文量的上升指日可待。目前更多是继续对基础研究进行深挖,在基础研究进行到一定程度后,技术类的开发和研究也会紧跟。因此,“总氮检测”这一方向仍然具有研究的前景,且需要更多的研究投入精进基础和技术。

图3 2012—2022 年度发文量统计图

图4 2012—2022 年度不同“研究层次”发文量统计表及统计图

2.4 作者发文分析

分析上述进行过预处理的数据,在“Node Types”中选择“Author”,得到作者合作网络图谱,如图5 所示。

图5 可视化作者合作网络图谱

对所得的作者合作网络图谱进行分析,作者节点数为281,作者合作连接数为83。可以发现,作者发文处于比较分散的状态,中心中介性不高,仅有部分作者的发文存在联系,构成较为紧密的小型作者合作网络。同时,分析作者的发文频次可以很好地反映该作者在某个领域内的研究力度情况,是分析文献一个关键的要素[11]。虽然作者发文量没有明显差异,并且合作较少,但是对于水质总氮检测方面,有大量作者发文,说明该领域方向有广泛的研究背景,是值得关注的一个环境科学问题。

3 结论与展望

通过一系列的分析可以发现:

1)水质总氮类相关论文发文数量多,主要以学术期刊和学位论文形式发表,以基础研究为主;

2)作者发文存在发文分散的现象,作者间的发文合作较少;

3)就目前研究方向而言,如何解决城市污水问题,是广泛研究的对象;

4)水质总氮检测的研究大方向依旧是保持不变的,但是研究越来越多元化,提升现有的检测和处理手段,水质评价和工艺精进依旧是水质总氮检测的热点和发展趋势。

相信伴随着多学科的交叉联动,水质总氮检测这一在水质监测中的关键性检测手段可以有长足的发展和进步。相关作者和研究机构间有更多的研究联系,使得现有的研究更加深入,总氮检测的手段更加多元化、便捷化、精确化,后续的水质治理工作也可以衔接性开展。

猜你喜欢
发文图谱可视化
基于CiteSpace的足三里穴研究可视化分析
基于Power BI的油田注水运行动态分析与可视化展示
绘一张成长图谱
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
基于CGAL和OpenGL的海底地形三维可视化
“融评”:党媒评论的可视化创新
校园拾趣
爷孙趣事
以牙还牙
补肾强身片UPLC指纹图谱