我国医学信息学领域的研究现状及其可视化分析

2019-10-09 04:10杨林朋董一超赵祖桉崔雪宁刘新奎
中国卫生产业 2019年22期
关键词:共词分析可视化分析

杨林朋 董一超 赵祖桉 崔雪宁 刘新奎

[摘要] 目的 该文旨在通过信息可视化方法直观展现和分析医学信息学领域热点及前沿趋势,梳理该学科发展脉络和学科的演化历程,提出医学信息发展建议。方法 以CNKI《中国学术期刊全文数据库》所载文献为统计源,运用文献计量学的词频统计和共词分析及聚类分析方法,借助SATI2.3、Ucinet、Netdraw和SPSS 21.0统计学软件,对我国2014—2018年医学信息学研究论文进行计量分析。结果 揭示2014—2018年医学信息学研究论文的研究热点和趋势,提出了医学信息5个热点研究方向。结论 国内研究虽然呈现良好的发展态势,但是就整体而言,国内科研论文的数量和质量仍有待提高。

[关键词] 医学信息学;文献计量法;共词分析;可视化分析

[中图分类号] R-05 [文献标识码] A [文章编号] 1672-5654(2019)08(a)-0160-05

Research Status and Visual Analysis of Medical Information Science in China

YANG Lin-peng, DONG Yi-chao, ZHAO Zu-an, CUI Xue-ning, LIU Xin-kui

The First Affiliated Hospital of Zhengzhou University, Zhengzhou, Henan Province, 450052 China

[Abstract] Objective This paper aims to visualize and analyze the hotspots and frontier trends in the field of medical informatics through information visualization methods, sort out the development of the subject and the evolution of the discipline, and propose medical information development. Methods The CNKI "Chinese Academic Journal Full-text Database" was used as the statistical source, using the word frequency statistics and co-word analysis and cluster analysis methods of bibliometrics, with the help of SATI2.3, Ucinet, Netdraw and SPSS 21.0 statistical software. A quantitative analysis of medical informatics research papers in 2014-2018. Results The research hotspots and trends of medical informatics research papers from 2014 to 2018 were revealed, and 5 hot research directions of medical information were proposed. Conclusion Although domestic research shows a good development trend, on the whole, the quantity and quality of domestic research papers still need to be improved.

[Key words] Medical informatics; Bibliometrics; Co-word analysis; Visual analysis

醫学信息学是一门由医学、信息学等交叉而来的新兴学科[1]。随着医学信息领域的范围增大,医院信息化的快速发展,医学信息海量增加,医学信息学研究成为医学界和信息学界共同关注的一大热点[2]。该文通过对2014—2018年医学信息、医学图书情报论文的计量分析,明晰该领域的关注热点,全面了解我国医学信息学的发展概况,为以后的相关领域研究提供参考,对于促进我国医学信息学的进一步发展具有重要的意义。

1  数据来源与分析方法

以CNKI《中国学术期刊全文数据库》作为数据库来源,检索式TI=(信息+信息学+情报+图书)*医学-声明-稿约-启事OR KY=(信息+信息学+情报+图书)*医学,限定时间为2014—2018年,得到文献1 623篇,经过筛选、去重后共得到有效文献1 207篇,其年度分布,见表1。由表1可知,2014—2018年我国医学信息学领域的发文数量逐年增长,但增长幅度较小,总体上呈现平稳上升的态势。利用文献计量分析软件SATI3.2、社会网络分析软件UCINET、可视化软件NETDRAW以及SPSS 21.0统计学软件分析样该文献的全记录信息,绘制相关图谱,从而探讨2014—2018年我国医学信息学研究的发展趋势。

2  研究结果分析

2.1  样本论文作者合著情况及高产作者群分析

该次研究共得到有效样本论文1 207篇,涉及作者3 221位,平均一篇论文有2.67位作者,其中合著论文共计809篇,占论文总数的67.03%;参与合著的学者共计2 823人,占作者总人数的87.64%。样本论文作者合著情况结果详见表2。由表2可知,合著论文数和作者间的合作率均在60%以上,2~5人合作最为普遍,也存在更多人合著的情况,最高一篇文章作者数量为12人。由此可知,我国医学信息学研究具有一定的合作基础,但合作能力和合作意识仍需进一步提升。

由普赖斯定律,选取高产核心作者,即以该领域最高产作者发表论文数的平方根的 0.749倍为界,该文中最高产作者发文11篇,则核心作者中最低产作者论文数应为 2.247篇,取最大整数为3篇,高于此发文量的作者即为该领域的核心作者。统计数据表明,发文4 篇及以上的作者共15人,则这15位作者构成了医学信息领域核心作者群。由此可知,目前我国医学信息学领域核心作者群已经形成,具有离散性,核心作者还较为薄弱。

2.2  样本论文高频关键词词频统计分析

利用SATI3.2软件对1 207篇样本论文的题录数据进行分析,抽取关键词并进行词频统计,合并、去除含义相同或无意义的关键词,得到频次≥8的关键词40个,按出现频次降序排列,如表3所示。分析排名前40位的高频关键词可知,目前我国医院信息学的研究主要集中在信息素养、信息服务、医学图书馆建设、卫生信息化、生物信息学、大数据、医学信息检索以及信息系统等方面;同时,注重医学教育、医学情报、电子病历、医学院信息管理、数据挖掘、医学信息技术以及医学信息系统等方面的研究;有些还涉及信息工程、云计算、知识图谱、信息索引等计算机信息技术领域。

2.3  文献高频关键词共现分析

利用SATI3.2软件构建41×41的高频关键词共词矩阵,由于篇幅限制,该文仅列举频次排名前10的关键词数据,见表4所示。以共现频次≥5的关键词为切入点,发现卫生信息化与医学信息学、医学生与信息素养、知识图谱与医学信息、信息技术与医学教育以及循证医学与信息服务等组合出现的频率较高。为了更加直观形象地展示近5年来我国医学信息学领域研究主题分布情况,将高频关键词共现矩阵导入Ucinet软件中,利用可视化软件NETDRAW绘制高频关键词共现网络,详见图1、图2。图1中每个节点代表关键词,节点的大小代表关键词在共现网络中的中心度,节点越大,说明其位于整个网络的中心位置,越具影响力,节点位置越分散,节点越小,说明其位于整个网络的外围,影响力越小。而图2中节点间的连线表示关键词之间的共现强度,线条越粗表示两者共现强度越高,节点之间的距离即节点之间连线的长短可以说明关键词之间的密切程度。结合图1和图2可知,医学信息学、信息技术、医学图书馆、信息素养教育、卫生信息化以及医学信息服务等关键词节点较大,位于整个关键词网络的中心位置,是近5年我国医学信息学样本论文的核心关键词,其中医学信息学与卫生信息化,医学信息学与信息技术,医学生与信息素养,医学信息学、数据库与电子病历等共现强度较高,联系较为密切。

2.4  样本论文高频关键词聚类分析

该文中的聚类分析法通过计算关键词之间的距离,将距离较近即联系较为密切的关键词聚集起来,形成不同的类别,使得属于同一类别的关键词之间相似度尽可能大,而不同类别的关键词之间的相似度尽可能小[3]。由于关键词数量过多,通过进一步过滤删减,限定为频次排名前35的关键词,并生成35×35的高频关键词共词相异矩阵,再将高频关键词共词相异矩阵导入SPSS 21.0统计学软件中进行层次聚类分析,在“聚类方法”中选择“Ward法”,在“標准化”菜单中选中“Z得分”,最后得到聚类树状图,见图3所示。

结合样本论文高频关键词共现网络及聚类树状图,可将聚类结果分为五大研究类别,分别对应:(1)计算机信息技术在医院中的应用。随着社会经济的不断发展和人们生活质量的不断提高,患者对医疗系统的便捷性提出了更高的要求,医院必须顺应时代发展的要求,尽可能地满足患者个性化需求,这就需要医院提高信息化建设能力,运用先进的网络技术不断提高信息化水平,增加患者的满意度。目前,计算机技术涉及医院信息化建设的多个方面,如医疗服务信息化,医院通过构建计算机网络的平台,解决医疗资源短缺的问题,与计算机技术结合在一起,使得医院的治疗资源实现优化配置;医技人员通过网络熟悉并掌握有关医疗器械的相关法律法规,有利于提高设备管理工作的效益;病历书写及统计管理信息化,计算机网络技术的使用使得医院病案的保管更加有序、安全,其自动生成的统计功能使得医院日常活动的统计变得更加准确[4-5]。

(2)对临床医学和研究型数据等医学信息资源的开发利用。研究发现,近5年来利用计算机自然语言和文本挖掘技术对医院电子病历、医学影像、病理参数和化验结果进行研究是我国医学信息学领域的关注热点。大数据、知识图谱、云计算以及数据挖掘等关键词的频繁应用,表明国内医学信息学的研究方法的不断丰富,从单纯的文献计量法到机器学习和数据挖掘方法[6-7] 。

(3)教育与信息素养。开设与医学信息相关的课程,适合我国高等教育的国情。医学信息课程种类较多,其中文献检索课是我国目前实施信息素养相关教育活动的一种最普遍、最丰要的形式,对学生信息意识和信息能力的提高有一定的作用。目前也有学者认为要树立新型信息素养教育观念,对文献检索课程体系进行全面革新。此外,对信息的分析和利用也是信息素养的一个重要体现方面[8]。

(4)医学图书与循证。首先,文献信息资源的深度利用,包括从文献信息服务转化到知识服务,其次,是探索网络环境下的信息个性化服务以及很多图书馆都在实施的学科馆员制度;另外,循证医学也是医学图书馆的信息服务很重要的一部分[9]。

(5)以电子病历为代表的信息管理。目前,学者们对以电子病历为首的医院资源安全管理方面的研究主要集中在以下2个方面:①电子病历安全隐患。包括电子病历系统书写存在的安全隐患、电子病历运行中存在的安全隐患以及电子病历医疗信息准确性和真是性无法保障等;②提出电子病历安全管理策略。如,建立医院电子病历安全保障机构,确立医院电子病历风险管理体系以及严格制定执行医院安全管理制度等[10]。

3  结语

该文对近5年来我国医学信息学领域的国内发文进行共词分析,利用聚类分析对相关文献的关键词进行主题分类,借助UCINET构建关键词共现网络,根据聚类分析的树状图归纳出我国医学信息学领域国内研究成果的五大类别。通过以上对我国医学信息学研究热点的透视,提出新的发展思路,目前我国在医学信息学领域的研究内的研究成果数量众多,但是在世界范围内的影响力较弱[11],科研人员应该增强自身的科研能力以及吸收他人科研成果的能力,与国际同步;另外,在以后研究中,可以结合该领域实践性的调查研究方法,使研究内容更加丰富,对五大类热点研究内容也可进一步的拓展分析。

[参考文献]

[1]  王伟.医学信息学[M].北京:高等教育出版社,2006:14.

[2]  张婷婷,朴雪.医学信息学与生物信息学发展状况分析—基于文献调研[J].继续医学教育,2018,32(1):63-66.

[3]  潘伟.个性化信息服务关键技术—聚类分析[J].现代情报,2007(10):212-214.

[4]  魏石磊.基于信息化平台的数字化医院系统研究[J].城市建设理论研究:电子版,2015,5(12):1611-1612.

[5]  黄正东,肖飞,郭雪清,等.基于信息化平台的数字化医院架构研究[J].华南国防医学杂志,2012,26(4):362-366.

[6]  李萍.云计算与大数据时代医院信息化的三个转变[J].中国医院管理,2013,33(12):80-81.

[7]  孙磊,胡学龙,张晓斌,等.生物医学大数据处理的云计算解决方案[J].电子测量与仪器学报,2014(11):1190-1197.

[8]  王伟.我国医学信息教育面临的发展机遇与挑战[J].中华医学图书情报杂志,2012,21(3):1-3.

[9]  董瑞玉,冯占英,张晓梅,等.基于大数据应用的医学图书馆服务定位[J].医学信息学杂志,2017,38(1):75-78.

[10]  沈崇德,王彬夫.基于电子病历的医疗质量控制与安全管理策略[J].中国医院管理,2012,32(8):42-44.

[11]  亢川博,王伟,张世玉,陶成琳.国内外医学信息学研究现状的可视化分析[J].中华医学图书情报杂志,2016,25(8):24-30.

猜你喜欢
共词分析可视化分析
高校学生管理法治化研究:基于CiteSpace的可视化分析
我国职业教育师资研究热点可视化分析
声波吹灰技术在SCR中的应用研究
可视化分析技术在网络舆情研究中的应用
基于德温特数据库的关键共性技术分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
基于知识图谱的智慧教育研究热点与趋势分析
基于共词分析的近年国内O2O研究主题分析