基于SCI-E新型冠状病毒肺炎知识图谱可视化分析

2021-07-11 11:16郭翊
中国中医药图书情报 2021年3期
关键词:新型冠状病毒肺炎可视化分析知识图谱

郭翊

摘要:目的  对世界范围新型冠状病毒肺炎(以下简称“新冠肺炎”)研究文献进行可视化分析,通过对知识图谱的解读发现新冠肺炎研究的现状与趋势。方法  运用CiteSpace可视化分析软件对SCI-E数据库中有关新冠肺炎的研究文献从引文分析、合作网络分析两大层面6个角度进行分析。结果  引文分析层面,文献共被引分析显示,世界范围新冠肺炎研究的前10篇关键文献中我国科研人员发表的文献为7篇;文献共被引聚类图谱显示,研究主题主要形成于2020年,共分为9种类型,主题之间存在交集;文献共被引高突现值文献发表时间均为2020年,前10篇高突现值文献中我国科研人员发表的文献为6篇。合作网络分析层面,作者合作图谱网络密度为0.021 4,合作关系较弱;机构合作图谱网络密度为0.035 6,合作关系不强;国家/地区合作图谱网络密度为0.200 0,合作关系较为紧密。结论  对新冠肺炎的前沿研究正逐步深入到更加细分的医学领域,机构及国家层面的合作关系相对较强。

关键词:SCI-E;新型冠状病毒肺炎;知识图谱;CiteSpace;可视化分析

中图分类号:G250    文献标识码:A    文章编号:2095-5707(2021)03-0012-08

DOI: 10.3969/j.issn.2095-5707.2021.03.003        开放科学(资源服务)标识码(OSID):

Visualization Analysis of Knowledge Mapping of COVID-19 Based on SCI-E

GUO Yi

(Library of Taiyuan University of Science and Technology, Taiyuan 030024, China)

Abstract: Objective To conduct a visualization analysis on the articles of new coronavirus pneumonia (hereinafter referred to as “COVID-19”) in the worldwide; To discover the current situation and trend of COVID-19 research by interpreting the knowledge mapping. Methods CiteSpace was used to analyze the articles of COVID-19 in SCI-E from six perspectives from two levels of citation analysis and cooperation network analysis. Results In the citation analysis, co-citation analysis showed that among the top ten key articles of COVID-19 research in the worldwide, seven were written by Chinese researchers; co-citation clustering mapping showed that the research topics were mainly formed in 2020, among which there were nine types of topics and intersection; the co-citation high emergent value articles were all published in 2020, and six were written by Chinese researchers among the top ten highest emergent value articles. In the analysis of cooperation network, the network density of authors cooperation mapping was 0.021 4, and the cooperation relationship was weak; the network density of institutions cooperation mapping was 0.035 6, and the cooperation relationship was not strong; the network density of countries/regions was 0.200 0, and the cooperation relationship was close. Conclusion The research frontier of COVID-19 is gradually deepening into more subdivided medical fields, and the cooperation of institutions and countries/regions is relatively strong.

Key words: SCI-E; COVID-19; knowledge mapping; CiteSpace; visualization analysis

世界衛生组织(WHO)在发布的新型冠状病毒最新疫情报告中,建议将新型冠状病毒感染的肺炎暂命名为“2019-nCoV急性呼吸疾病”[2]。2020年2月11日,WHO总干事谭德塞在瑞士日内瓦宣布,将新型冠状病毒感染的肺炎命名为“COVID-19”[3]。2020年2月21日,国家卫生健康委发布了关于修订新型冠状病毒肺炎英文命名事宜的通知,决定将“新型冠状病毒肺炎”英文名称修订为“COVID-19”,与WHO命名保持一致,中文名称保持不变[4]。 2020年2月29日,国家卫生健康委疾病预防控制局发布了《中国-世界卫生组织新型冠状病毒肺炎(COVID-19)联合考察报告》[5]。2020年3月4日,国家卫生健康委发布了《新型冠状病毒肺炎诊疗方案(试行第七版)》[6]。随着新型冠状病毒肺炎(以下简称“新冠肺炎”)感染病例在世界范围的爆发式增长,新冠肺炎已经成为世界各国政府及科研人员的一项全新的重要研究课题。

科学知识图谱是以知识域为对象,显示知识的发展进程与结构关系的一种图像。它具有“图”和“谱”的双重性质与特征:既是可视化的知识图形,又是序列化的知识谱系,显示了知识单元或知识群之间网络、结构、互动、交叉、演化或衍生等诸多隐含复杂的关系[7]。CiteSpace是美国德雷赛尔大学计算机与情报学教授陈超美博士于2004年使用Java语言开发的信息可视化分析软件,是一款着眼于分析科学文献中蕴含的潜在知识,并在科学计量学、数据和信息可视化背景下逐渐发展起来的多元、分时、动态的引文可视化分析软件,可以进行文献共引分析,并挖掘引文空间的知识聚类和分布,还提供其他知识单元之间的共现分析功能,如作者、机构、国家/地区的合作等[8]2。

本文试图对世界范围新冠肺炎的研究文献进行可视化分析,通过对知识图谱的解读,揭示该项研究的现状、热点及发展趋势。

1  资料与方法

1.1  数据来源

数据来自Web of Science核心合集数据库中的《科学引文索引》扩展版(Science Citation Index Expanded,SCI-E),检索时间为2020年6月20日。

1.2  检索方法

在Web of Science核心合集数据库中勾选SCI-E。由于太原科技大学订购的SCI-E数据年限回溯至2009年,所以检索时间跨度为:所有年份(2009-至今),检索方式“标题=(COVID-19)”。

1.3  纳入及排除标准

纳入标准:文献类型为Article,Review,Early Access,Editorial Material与Letter。排除标准:去除重复检索结果,使用CiteSpace软件的“remove duplicate(WoS)”功能完成去重操作。

1.4  研究方法

运用CiteSpace 5.6R5[9]对SCI-E数据库中的新冠肺炎研究文献进行可视化分析,分别从文献共被引分析、文献共被引聚类分析、文献共被引突现分析、作者合作分析、机构合作分析、国家/地区合作分析6个角度对知识图谱进行解读。

2  结果

根据纳排标准,共获得7806条文献记录。

2.1  引文分析

2.1.1  文献共被引分析  2篇文献共同出现在第三篇施引文献的参考文献目录中,则这2篇文献形成共被引关系[8]139。文献共被引图谱中共有106个节点与81条连线,图谱网络密度为0.014 6,图谱网络较为稀疏,表明该研究领域文献之间的关联不够密切(见图1)。

CiteSpace图谱中具有高中介中心性的节点称为关键节点,关键节点文献对图谱中其他研究文献起中介桥梁的作用,中介中心性数值的大小表示该文献与其他文献的关联强度,体现该文献在整个引文网络中的重要性。

中介中心性数值排名前10位的文献如表1所示,表中第8、10位分别发表于2017年、2012年,其余8篇均发表于2020年。

2.1.2  文献共被引聚类分析  使用CiteSpace聚类功能进行文献共被引聚类分析,可以挖掘相似文献的共同研究主题及主题之间的关系。使用对数似然率算法(LLR算法)对共被引分析的结果进行聚类,文献共被引聚类图谱形成了9个聚类主题(见图2),聚类图谱反映了世界范围新冠肺炎研究的主题内容及其相互之间的关系,其中#0聚类的时间范围为2019年,其余聚类为2020年,说明新冠肺炎的研究主题主要形成于2020年,其中#3与#6聚类有部分重叠,#7与#8聚类有部分重叠,表示聚类主题的研究内容存在交集。文献共被引聚类图谱中的9个聚类详见表2。

2.1.3  文献共被引突现分析  突现反映了一个新兴研究领域的出现,预示研究主题未来可能的发展方向,通过突现算法得到的结果,还可以识别出研究主题在时间上的变化趋势。

突现值最高的文献与中介中心性最高的文献相同,为武汉市金银潭医院副院长黄朝林等联合撰写的Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China,该文献的突现值为0.913 1。其他9篇文献的突现值在0.660 6~0.692 6左右,高突现值文献详见表3,10篇文献均发表于2020年。

2.2  合作網络分析

CiteSpace提供了3个层次的科学合作网络分析,分别是微观的作者合作网络,中观的机构合作网络及宏观的国家/地区合作网络,在合作网络图谱中,节点大小代表发文量的多少,节点之间连线的粗细表示合作关系的强度[8]181。

2.2.1  作者合作分析  作者合作图谱显示了新冠肺炎研究领域所有署名作者的发文数量与相互之间的合作关系,可以反映该研究领域全球范围内的作者合作情况。作者合作图谱中共有178个节点与337条连线,网络密度为0.021 4,密度较低,说明在该研究领域作者之间的合作关系较弱(见图3)。作者的发文量体现了作者参与合作研究的次数,作者合作图谱中发文量排名前10位的作者见表4。

2.2.2  机构合作分析  机构合作图谱可反映新冠肺炎研究领域科研机构发文数量与机构之间的合作关系。机构合作图谱中共有54个节点与51条连线(见图4),网络密度为0.035 6,密度较低说明在该研究领域跨机构的合作关系不强。机构合作图谱中发文量前10位的机构见表5。

2.2.3  国家/地区合作分析  国家/地区合作图谱从宏观层面反映了发文分布情况,发文量与国家/地区之间的连线体现了各个国家/地区的科研实力及科研合作关系。国家/地区合作图谱中共有31个节点与93条连线(见图5),网络密度为0.200 0,密度较高说明在该研究领域跨国家/地区的合作较为紧密。国家/地区合作图谱中发文量排名前10位的国家/地区如表6所示。

3  討论

3.1  高中介中心性文献

高中介中心性文献是新冠肺炎研究文献共被引图谱中的关键节点,这些文献共同构成了文献共被引网络中的知识基础。排名前10位的文献中8篇文献发表时间为2020年,2012、2017年各有1篇。2012年与2017年的2篇文献是当前新冠肺炎研究的支撑性研究,为当前的科学研究提供了循证依据。关键节点文献的研究内容涉及新冠肺炎的流行病学、临床、实验室和放射学特征、瑞德西韦与氯喹在体外对新型冠状病毒的抑制作用、新型冠状病毒在感染者上呼吸道的载量、新型冠状病毒的母婴传播途径、对重症监护病房的严重病例与非严重病例的临床比较、新冠肺炎患者临床病程与死亡因素、呼吸机的临床使用指南与气溶胶的产生及传播风险。10篇文献中有7篇为我国科研人员所发表,表明我国在新冠肺炎研究中处于重要地位,受到了世界范围研究者的广泛关注。

3.2  高突现值文献

高突现值文献反映了世界范围新冠肺炎研究的前沿领域及未来的发展趋势,前10篇高突现值文献的研究内容为:新冠肺炎的流行病学、临床、实验室和放射学特征研究,新冠肺炎临床病程及预后研究,新冠肺炎患者的心肌肌钙蛋白Ⅰ的荟萃分析,新冠肺炎患者是否应停用肾素-血管紧张素系统阻断剂,胃肠道的症状及潜在的粪口传播途径、在胃肠镜检查中的风险,新冠肺炎与消化道疾病的相互影响,炎症性肠病在新冠肺炎暴发期间的管理,新冠肺炎患者遗体的组织病理学研究,新型冠状病毒所致的心血管系统损害研究。这些高突现值文献与高中介中心性的文献相比,研究内容涉及更加细分的医学领域,拓展到了消化系统、心血管系统及组织病理学,为人类更加系统全面地认识新冠肺炎进行了医学实践与探索,为今后的相关研究提供了理论依据。前10篇高突现值文献中,我国科研人员发表的文献为6篇,体现了我国在新冠肺炎前沿领域的研究中处于世界领先地位。

3.3  合作网络分析

合作网络分析分别从作者、机构及国家/地区层面对发文量与合作关系进行了阐释,3个层面的合作网络密度由小到大,体现了合作关系的紧密程度由弱到强,说明了中观层面的机构合作网络与宏观层面的国家/地区合作网络更能体现当前世界范围研究合作的总体态势。中国、美国、英国与欧盟国家是该研究的主导力量,亦存在较为广泛的合作关系。新冠肺炎已经成为当前全球各国共同面临的严峻挑战,开展更加广泛和开放的科研合作显得愈发重要,跨国家/地区与跨机构的研究合作有助于发挥各方优势资源,集中全人类的智慧与力量,共同战胜疫情。

3.4  针对科研人员的建议

根据本文的研究结论,对科研人员的建议主要有3点。第一,重视知识图谱中的高中介中心性文献,这些文献是起中介作用的重要转折点,通过这些文献可以了解该研究领域知识基础的构成,进而通过共被引聚类图谱了解研究文献的主题分类及各主题之间的关系。第二,高突现值文献反映了研究领域的前沿知识,通过阅读前沿文献可以准确把握该研究领域的发展趋势,为科研人员确定研究方向与研究目标提供指引。第三,需要进一步加强作者、机构及国家/地区层面的研究合作,充分利用合作优势,共享研究基础数据,形成更多具有研究价值的优秀科研成果。

3.5  本文的局限性

第一,新冠肺炎研究文献数量增长非常迅速,随着大量新研究文献的发表出版,与之相对应的学科前沿研究领域也将呈现出新的热点与趋势,本文的研究结论从形成的那一刻开始即存在一定的滞后性,这也是所有数据分析类论文共同存在的问题。第二,研究样本的语言均为英语,但仍然有大量的研究文献是使用世界其他语言发表的,本文对该类文献的研究内容存在一定的缺失。

参考文献

[1] 国家卫生健康委办公厅,国家中医药管理局办公室.关于印发新型冠状病毒感染的肺炎诊疗方案(试行第三版)的通知[EB/OL].(2020-01-23) [2020-07-30].http://www.gov.cn/zhengce/zhengceku/2020-01/23/ content_5471832.htm.

[2] 中国新闻社.世卫组织建议新型肺炎暂命名为“2019-nCoV急性呼吸疾病”[EB/OL].(2020-01-31)[2020-07-30].http://www.chinanews. com/gj/2020/01-31/9074028.shtml.

[3] 新华社.世界卫生组织宣布将新型冠状病毒感染的肺炎命名为“COVID-19”[EB/OL].(2020-02-12)[2020-07-30].http://www.gov. cn/xinwen/2020-02/12/content_5478892.htm#1.

[4] 国家卫生健康委.国家卫生健康委关于修订新型冠状病毒肺炎英文命名事宜的通知[EB/OL].(2020-02-21)[2020-07-30].http://www.gov. cn/zhengce/zhengceku/2020-02/22/content_5482019.htm.

[5] 疾病预防控制局.《中国-世界卫生组织新型冠状病毒肺炎(COVID-19)联合考察报告》发布[EB/OL].(2020-02-29)[2020-07-30]. http://www.nhc.gov.cn/jkj/s3578/202002/87fd92510d094e4b9bad597608f5cc2c.shtml?from=timeline&isappinstalled=0.

[6] 国家卫生健康委办公厅,国家中医药管理局办公室.关于印发新型冠状病毒肺炎诊疗方案(试行第七版)的通知[EB/OL].(2020-03-04) [2020-07-30].http://www.nhc.gov.cn/yzygj/s7653p/202003/46c92 94a7dfe4cef80dc7f5912eb1989.shtml.

[7] 陳悦,陈超美,刘则渊,等.CiteSpace知识图谱的方法论功能[J].科学学研究,2015,33(2):242-253.

[8] 李杰,陈超美.CiteSpace:科技文本挖掘及可视化(第二版)[M].北京:首都经济贸易大学出版社,2017.

[9] CHEN C M. CiteSpace: Visualizing patterns and trends       in scientific literature[EB/OL].(2019-10-25)[2020-07-30].http:// cluster.ischool.drexel.edu/~cchen/citespace/download/.

[10] HUANG C L, WANG Y M, LI X W, et al. Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China[J]. The Lancet, 2020,395(10223):497-506.

[11] CHEN N S, ZHOU M, DONG X, et al. Epidemiological and clinical characteristics of 99 cases of 2019 novel coronavirus pneumonia in Wuhan, China: a descriptive study[J]. The Lancet, 2020,395(10223):507-513.

[12] WANG M L, CAO R Y, ZHANG L K, et al. Remdesivir and chloroquine effectively inhibit the recently emerged novel coronavirus (2019-nCoV) in vitro[J/OL]. Cell Research  [2020-07-30].https://www.nature.com/articles/s41422-020-0282- 0#citeas.

[13] ZOU L R, RUAN F, HUANG M X, et al. SARS-CoV-2 viral load in upper respiratory specimens of infected patients[J]. N Engl J Med, 2020,382(12):1177-1179.

[14] CHEN H J, GUO J J, WANG C. et al. Clinical characteristics and intrauterine vertical transmission potential of COVID-19 infection in nine pregnant women: a retrospective review of medical records[J]. The Lancet, 2020,395(10226):809-815.

[15] WANG D W, HU B, HU C, et al. Clinical characteristics of 138 hospitalized patients with 2019 novel coronavirus-infected pneumonia in Wuhan, China[J]. JAMA, 2020,323(11): 1061-1069.

[16] ZHOU F, YU T, DU R H, et al. Clinical course and risk factors for mortality of adult inpatients with COVID-19 in Wuhan, China: a retrospective cohort study[J]. The Lancet, 2020,395(10229):1054-1062.

[17] Fan E, Del Sorbo L, Goligher E C, et al. An Official American Thoracic Society/European Society of Intensive Care Medicine/Society of Critical Care Medicine clinical practice guideline: mechanical ventilation in adult patients with acute respiratory distress syndrome[J]. Am J Respir Crit Care Med, 2017,195(9):1253-1263.

[18] Holshue M L, Debolt C, Lindquist S, et al. First case of 2019 novel coronavirus in the United States[J].N Engl J Med, 2020,382(10):929-936.

[19] Tran K, Cimon K, Severn M, et al. Aerosol generating procedures and risk of transmission of acute respiratory infections to healthcare workers: a systematic review[J]. PLoS One, 2012,7(4):1-8.

[20] Danese S, Cecconi M, Spinelli A, et al. Management of IBD during the COVID-19 outbreak: resetting clinical priorities[J]. Nature Reviews Gastroenterology & Hepatology, 2020,17:253-255.

[21] Lippi G, Lavie C J, Sanchis-Gomar F. Cardiac troponin Ⅰ in patients with coronavirus disease 2019 (COVID-19): Evidence from a meta-analysis[J]. Progress in Cardiovascular Diseases, 2020,63(3):390-391.

[22] Kuster G M, Otmar P, Thilo B, et al. SARS-CoV2: should inhibitors of the renin-angiotensin system be withdrawn in patients with COVID-19?[J]. European Heart Journal, 2020,41(19):1801-1803.

[23] MAO R, LIANG J, SHEN J, et al. Implications of COVID-19 for patients with pre-existing digestive diseases[J]. The Lancet Gastroenterology & Hepatology, 2020,5(5):425-427.

[24] Repici A, Aragona G, Cengia G, et al. Low risk of covid-19 transmission in GI endoscopy[EB/OL].BMJ[2020-07-30].https:// gut.bmj.com/content/early/2020/05/21/gutjnl-2020-321341.

[25] 姚小紅,李廷源,何志承,等.新型冠状病毒肺炎(COVID-19)三例遗体多部位穿刺组织病理学研究[J].中华病理学杂志,2020,49(5):411-417.

[26] GU J Y, HAN B, WANG J. COVID-19: gastrointestinal manifestations and potential fecal-oral transmission[J]. Gastroenterology,2020,158(6):1518-1519.

[27] YANG X B, YU Y, XU J Q, et al. Clinical course and outcomes of critically ill patients with SARS-CoV-2 pneumonia in Wuhan, China: a single-centered, retrospective, observational study[J]. The Lancet Respiratory Medicine, 2020,8(5):475-481.

[28] ZHENG Y Y, MA Y T, ZHANG J Y, et al. COVID-19 and the cardiovascular system[J]. Nat Rev Cardiol, 2020,17:259-260.

(收稿日期:2020-09-09)

(修回日期:2020-10-14;编辑:魏民)

猜你喜欢
新型冠状病毒肺炎可视化分析知识图谱
新型冠状病毒肺炎的CT影像特点及应用价值
疑似及确诊新冠肺炎的临床及胸部CT影像特点
曲靖地区13例新型冠状病毒肺炎的中西医结合诊治初探
我国职业教育师资研究热点可视化分析
声波吹灰技术在SCR中的应用研究
可视化分析技术在网络舆情研究中的应用
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析