国内外医学信息学研究现状的可视化分析

2016-03-21 11:40,,
中华医学图书情报杂志 2016年8期
关键词:信息学热点医学

, ,,

医学信息学(Medical Informatics)是以信息学、信息管理和信息技术为依托,研究医学领域中的信息现象和信息规律,用于医学决策和管理的一门交叉学科[1],于20世纪70年代作为一门正式学科被提出。随着各国医疗行业信息化技术的不断提高,计算机技术、网络技术、软件技术的不断革新,云计算、大数据、物联网、移动应用、智慧医疗的兴起,医学信息学在过去的40多年,尤其是在近10年,研究热点不断涌现,新的有价值的研究成果层出不穷。医学信息学作为一门学科日趋繁荣,学科的地位和价值也不断提高。

2016年6月24日,国务院办公厅印发了《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》,明确指出要强化医学信息学学科建设和着力培育高层次、复合型的研发人才及科研团队[2]。随着新医改的深入开展,医学信息学愈加显示出其在实现建立高效统一、系统整合、互联互通以及信息数据共享中的支撑作用。全面了解世界各国医学信息学的发展概况,对于促进我国医学信息学的进一步发展具有重要的意义。

1 材料与方法

在Web of Science核心集中,被收录的文献都被赋予了至少一个学科类别,每一条记录都有一个“Web of Science类别”字段,因此使用该字段进行检索可以较为完整地检索到某一学科被SCI收录的文献。本文以Web of Science核心集数据来源,检索方式为“Medical Informatics”学科分类检索,检索时间跨度为2005-2016年,得到36 873篇文献。数据下载日期是2016年4月3日。借助CiteSpace软件分析得到的文献全纪录(包括关键词、作者、国别、参考文献等),绘制出医学信息学领域的国际发展现状的科学知识图谱,并结合这些图谱对国际医学信息学的发展现状和研究热点进行了分析。

2 结果与分析

2.1 全球医学信息学发展现状分析

2.1.1 文献统计量分析

统计2005年-2016年每年的累计发文量(表1),并分析文献增长规律(图1)。

表1 全球医学信息学年累计发表文件量

图1 2005-2015年医学信息学领域SCI文献增长趋势

从文献增长趋势分析可知,在2005-2015年之间医学信息学领域的文献符合线性增长模型,F(t)=3448.4t+400(以2005年为初始时刻:t0=0,Multiple R=0.994742,R Square=0.989512)。线性增长模型表明医学信息学处于一个平稳增长的时期,学科不断发展壮大,成果不断涌现(2016年的文献数据尚不完整,故文献增长模型不包含2016年)。

2.1.2 机构和国家研究实力分析

将下载的数据导入CiteSpace软件中,选择合适的参数,分别把节点类型设定为国家(Country)和机构(Institution),运行CiteSpace软件后得到国家之间和机构之间合作网络图谱(图2、图3)。表2和表3分别展示了排名靠前的国家和机构研究实力的具体数据。

图2 国家合作网络

图3 机构合作网络

图2显示,国家合作网络中78个节点代表不同的国家,每个节点以同心圆环表示,圆环的大小与所代表的国家的研究成果数量正相关,每一个同心圆环厚度代与不同年代的发文量正相关;节点之间的连线代表国与国之间的合作关系,连线越粗则表示合作的强度越大。图2中的节点间的连线有496条,呈现出世界范围内的合作态势 。

表2 各国医学信息学发表文献量

从图2和表2中可知,在国家合作网络中,美国和英国以其0.24和0.21的中心度,形成了两个合作中心。美、英两国中心地位明显,尤其是美国科研实力雄厚,成为了世界各国争相合作的对象。另外,从表2还可看出,澳大利亚、德国以及法国的中心度大致相等(平均在0.12),形成了以美、英为首的大合作网络下的3个小合作网络。从图2还可看出,国家合作网络中,中国虽然在论文绝对数量上居于第二位,但在网络中的中心度却仅有0.01,在国际上还缺乏影响力,所以该领域内的研究实力还有待提高。

图3显示,机构合作网络图中共有117节点,代表了来自全世界的117家研究机构,节点之间的连线有148条。在发文量前10位的机构中(表3),美国哈佛大学居于首位,并与另外的7所大学(包括哥伦比亚大学、华盛顿大学、范德堡大学等)形成了医学信息学领域的科研集群优势,奠定了美国在此领域内的优势地位。加拿大的多伦多大学和荷兰的阿姆斯特丹大学分别位居第4位和第6位,具有不俗的科研能力。网络中仅有美国的华盛顿大学、哈佛大学、哥伦比亚大学及杜克大学的中心度大于0.1,而且图3中117个机构之间的合作关系仅有148个,说明在世界范围内机构间的合作非常有限,存在着一定的学术壁垒问题。

表3 医学信息学领域机构分布

2.1.3 学科分布分析

借助CiteSpace软件,选择合适的参数,以学科(Category)为节点类型,运行后可得医学信息学学科分布图谱(图4)。从图4可看出,该学科分布的科学知识图谱中有节点31个,分别代表31个学科类型,节点之间的连线72条。

图4 医学信息学领域学科分布的科学知识图谱

结合医学信息学领域学科分布(表4),除医学信息学(Medical Informatics)外,发文量处于前3位的学科分别是计算机科学(Computer Science )、保健科学(Health Care Sciences & Services)、工程学(Engineering)。

根据社会网络分析理论,中心度在一定程度上代表了各个节点之间的联系,并显示了该节点在整个网络中的地位,同时它衡量了网络中的某一个节点对经过该节点并彼此互相连接的其他两个节点的控制能力[3]。CiteSpace软件中同样用中心性(Centrality)指标衡量所得的科学知识图谱中的节点在网络中的重要性。因此中心度的大小在一定程度上代表了各学科之间联系的紧密程度。结合图4和表4,与医学信息学密切相关的学科中,计算机科学(Computer Science )、放射学(Radiology)、数学与计算生物学(Mathematical & Computational Biology )、医学(Medicine)、保健科学(Health Care Sciences & Services)、通讯(Telecommunications)、工程学(Engineering)、数学(Mathematics)、统计与概率(Statistics & Probability学科的中心度分别为0.31、0.30、0.27、0.16、0.14、0.12、0.11、0.11、0.11。这些学科构成了医学信息学领域学科之间相互交流合作的纽带和桥梁,同时也体现出医学信息学多学科交叉的学科特征。

表4 医学信息学领域学科分布

2.1.4 关键节点文献分析

将文献数据导入到CiteSpace软件中,选择合适的参数,把节点分析类型设置为文献共被引(Cited

Reference),得到文献共被引网络图谱(图5)。

文献共被引网络中共有176个节点,节点之间有509条连线,节点的大小与文献被引用的频次正相关。选取被引频次≥10的文献为高被引文献,节点的中心度显示出节点在网络中的重要性程度。在图5中,节点标签按照中心度来进行标注,其中中心度>0.01的节点有6个,它们代表的关键节点文献均为高被引文献。在这些关键节点文献中,Basit C等人在2006年的研究中系统回顾了健康信息技术对医疗保健质量、效率以及医疗费用的影响,证实健康信息技术在提高医疗保健的质量和效率方面的有效性[4]。在2007年,Kuperman G J等研究发现临床决策支持(CDS)可提高患者的安全性和降低药物相关的费用[5]。美国学者Blumenthal D和Tavenner M探讨了电子病历的合理有效利用[6],Dolin RH等和Black A D等分别在HL7标准的发展和临床运用方面和eHealth技术的开发和使用方面取得了有价值的研究成果[7-8]。在2010年发表的名为“Mayo clinical Text Analysis and Knowledge Extraction System (cTAKES): architecture, component evaluation and applications”的文章中,Savova G K等人建立和评估了一个可以从电子病历中提取可用信息的开源自然语言处理系统[9]。这些文献构成了医学信息学领域的基础文献或奠基性文献,受到了研究者的普遍认可和关注。

图5 文献共被引网络

2.2 国际医学信息学研究热点分析

爆发词(Bursts Word)具有在短时间内迅速增长或者使用频次突然增高的特点,因此,我们通过借助爆发词可以对科学研究趋势和热点进行预测和挖掘[10]。CiteSpace软件提供的Bursts检测功能可以直观展示某个研究领域的研究热点,同时也可以在时间维度上展示出研究热点的变化。图6是医学信息学领域的借助关键词显示出的领域内研究热点的变化情况。

对图6进一步解读发现,在2005年,“系统”、“电子健康档案”、“模型”、“临床试验”、“保健”、“肺癌”等成为爆发词,说明疾病模型的建立、信息系统和电子健康档案成为研究者关注对象;到了2006年,爆发词进一步发展为“临床实践”和“信息技术”,表明医学信息学领域内的研究逐步关注临床实践和对信息技术的研究;2007年,爆发词变为“系统”和“分级”,说明此时对信息系统的分级评估成为了一个新的研究热点;2008-2009年,“管理”和“卫生技术评估”成为爆发词,说明2007年的研究热点有了进一步的发展;在2010年-2014年的5年间,爆发词分别为“初级保健”、“质量”、“患者安全”及“健康”,说明在这段时间内患者以及人群的初级保健成为了研究的热点。值得关注的是,继2005年研究者对电子健康档案开始关注以来,“电子健康档案”在2015年成为了爆发词,说明随着医疗行业信息化的不断提高以及信息技术的不断提高,电子健康档案的重要性再一次被研究者认识和关注并成为新的研究热点。进入2016年,“模型”、“疾病”、“设计”及“实施”成为了爆发词,结合2015年的电子健康档案,说明疾病模型的设计与实施以及对电子健康档案的研究将成为今年研究热点及未来几年的发展趋势。

图6 医学信息学领域关键词时间分布

3 结论

本文通过检索近12年Web of Science数据库中“Medical Informatics”学科类别的文献数据,借助可视化的科学计量学的研究工具CiteSpace从多个角度对其进行了深入分析,得出以下结论。

一是通过对文献随时间的积累变化可知在这12年中医学信息学领域的文献增长呈现出线性增长特点,说明了医学信息学是一门高速发展、成长中的、具有活力的学科。

二是医学信息学的研究在地域上呈现出以美国和英国为大中心,澳大利亚、德国以及法国为小中心的世界合作态势。我国在医学信息学领域的研究内的研究成果数量众多,但是在世界范围内的影响力较弱。美国以其医学信息学领域内高等学府聚集的优势奠定了其优势地位。在机构合作的研究中发现世界范围内的研究机构之间的合作非常有限,存在着学术壁垒。

三是通过文献共被引分析,展示出了医学信息学产生、发展过程中的经典文献。跟踪受到学者们普遍认可和关注的经典文献有助于了解学科的发展脉络和领域内的最新动态。

四是从学科分析中可直观显现出医学信息学以医学(Medicine )、放射学(Radiology)、计算机科学(Computer Science )、数学与计算生物学(Mathematical & Computational Biology )、数学(Mathematics)、统计与概率(Statistics & Probability)等多学科交叉为特征的学科特性。

五是借助bursts检测发现研究者的关注点:2005年的疾病模型的建立、对信息系统和电子健康档案的研究,2006年对临床实践以及信息技术的关注;2007-2009年对信息系统分级管理和卫生技术评估的研究,随后的5年患者的安全和初级保健逐渐受到关注。2015年电子健康档案再一次被重视,并结合进入2016年以来疾病模型的设计与实施成为新的研究热点,说明疾病模型的设计与实施以及对电子健康档案的研究将成为今年研究热点及未来几年的发展趋势。

猜你喜欢
信息学热点医学
热点
本刊可直接使用的医学缩略语(二)
鸡NRF1基因启动子区生物信息学分析
医学的进步
预防新型冠状病毒, 你必须知道的事
热点
初论博物馆信息学的形成
结合热点做演讲
中欧医学信息学教学对比研究
医学、生命科学类