基于知识图谱的自闭症谱系障碍研究主题分析

2020-11-13 09:38张靓齐昊
中国卫生产业 2020年20期
关键词:知识图谱

张靓 齐昊

[摘要] 自闭症是一种广泛性發育障碍的疾病,近几年的自闭症患者数量不断增加。该文选取自闭症相关研究文献,从PubMed数据库中抽取自闭症相关文献,通过发文量统计发现自闭症研究文献呈现指数上涨趋势且在2016年达到顶峰。运用词频分析法截取相关高频词制作关键词词云发现随着自闭症患者年龄的不断增长,研究者较为关注自闭症的共病问题。利用中心性分析、共词分析和社会网络分析方法,通过VOSviewer可视化软件形成了6个研究主题的聚类,分别为自闭症的相关基础理论研究、致病因素研究、表型症状研究、临床诊断研究、干预措施研究、共病研究,并基于知识图谱对自闭症研究相关文献进行主题分析,从发文量和研究热点角度探究自闭症的研究现状及发展趋势,为科研人员提供参考依据。

[关键词] 自闭症谱系障碍;知识图谱;主题分析

[中图分类号] R749.94 [文献标识码] A [文章编号] 1672-5654(2020)07(b)-0191-06

An Analysis of Research Topics on Autism Spectrum Disorder Based on Knowledge Graph

ZHANG Liang1, QI Hao1,2

1.Medical Big Data Center of the First Hospital of Shanxi Medical University, Taiyuan, Shanxi Province, 030001 China; 2.Department of Endocrinology, the First Hospital of Shanxi Medical University, Taiyuan, Shanxi Province, 030001 China

[Abstract] Autism is a disease of widespread developmental disorders. In recent years, the number of patients with autism has been increasing. This article selects autism-related research literature and extracts autism-related literature from the PubMed database. Through the statistics of the number of publications, it is found that the autism research literature has an exponential upward trend and reached its peak in 2016. Using word frequency analysis to intercept relevant high-frequency words to create a keyword word cloud found that as the age of autistic patients continues to grow, researchers pay more attention to the comorbidity of autism. Using centrality analysis, co-word analysis, and social network analysis methods, clusters of 6 research topics were formed through the VOSviewer visualization software, which are related to basic theoretical research on autism, pathogenic factors, phenotypic symptoms, and clinical trials. Diagnosis research, intervention research, comorbidity research, and based on the knowledge map to conduct thematic analysis of autism research related literature, explore the current status and development trend of autism research from the perspective of the number of articles and research hotspots, and provide reference for scientific researchers.

[Key words] Autism spectrum disorder; Knowledge graph; Topic analysis

自闭症谱系障碍(autism spectrum disorder,ASD),又称孤独症,是一种发育障碍类疾病。美国在2013年颁布了《精神疾病诊断与统计手册—第5版》(DSM-5),并以自闭症谱系障碍替代了除雷特氏症以外的广泛性发育障碍[1]。目前,自闭症多高发于儿童,且男女比例差异明显,男孩多于女孩。其主要特征为社交互动障碍、语言沟通障碍和重复刻板行为等[2]。然而自闭症的病因尚不明确,但有研究[3]认为与遗传、免疫、代谢、肠道菌群和环境等因素密切相关。近几十年来,自闭症谱系障碍(ASD)的发病率持续上涨,根据美国疾病控制与预防中心CDC估计,大约每59名儿童中就有1名被确诊患有自闭症谱系障碍。随着医学技术和医疗信息化等技术的迅速发展,生物医学数据呈现出爆发式增长的趋势[4],以此为基础的生物医学文献数量也急剧增长。生物医学文献中蕴含着大量的生物医学知识,及时从中获取有效的信息就显得尤为重要。该文基于知识图谱方法研究自闭症相关文献,了解自闭症研究现状并探究其发展趋势,为科研人员提供参考依据。

1  数据与方法

1.1  數据来源

该研究数据来自于 PubMed 生物医学文献数据库,通过MeSH词检索到9个与自闭症相关的医学主题词分别为autistic disorder(自闭症);autism spectrum disorder (自闭症谱系障碍);rett syndrome rett (综合征);akinetic mutism (动力学缄默症);macrocephaly autism syndrome (自闭症综合征);AUTS2 protein, human AUTS2 (蛋白,人);Auts2 protein, mouse(Auts2 蛋白,小鼠); Adenylosuccinate lyase deficiency(腺苷酸琥珀酸裂解酶缺乏);GoPro49 protein, human(GoPro49 蛋白,人类),以OR并列构建其检索式,共收集到自闭症相关的研究文献29 458篇(检索时间为2019年5月13日)。

1.2  研究方法

①词频分析法。词频分析法是一种文献计量方法,其中关键词或主题词是文献的主要核心内容。因此通过统计关键词、主题词等核心词汇在某一领域文献中所出现的频次, 进而揭示该领域的研究热点及发展趋势[5]。通过词频的高低可以反映出一定的社会现象[6]。该文从PubMed数据库中下载XML题录数据,利用Kettle软件进行解析,从中抽取出Title、Year、Keywords关键字段。对其进行数据归一化处理,删除重复无关数据,从中截取出频次>10的关键词共769个,根据关键词在自闭症相关文献中的词频情况,预测自闭症研究的发展方向及趋势。

②中心性分析法。中心性分析方法可以反映出节点在网络中的重要程度。该文选用3种中心性分析方法,分别为点度中心性(degree centrality)、中介中心性(betweenness centrality) 和亲近中心性(closeness centrality)。其中点度中心性代表与该关键词节点的连线数量。中介中心性是指节点对网络的控制能力。亲近中心性是指与其他关键词节点的最短距离的大小。

③共词分析法。共词分析法是一种基于关键词的共现分析方法,表示某一领域中关键词共同在同一篇文献中出现的次数,并且次数越多越说明它们关系紧密、距离越短。运用共词分析方法构建共现矩阵,从而反映关键词之间的紧密程度并进一步分析其领域结构[7]。该文利用关键词共现建立共现矩阵,并以此为依据构建共现网络。

④社会网络分析法。社会网络分析法(social network analysis,SNA)是一种科学的计量方法,主要是对社会关系网络结构及其属性进行分析研究从而发现其内在联系的一种学科交叉的方法[8]。社会网络由图中的节点和连线构成,其中节点表示事件中的行动者,连线代表行动者之间的关系纽带。社会网络分析的优势在于可根据网络结构与网络位置对多个节点和多个主体网络进行合理分析并加以预测[9]。该文通过共现关系自建网络,反映关键词节点之间的关联关系,并通过VOSviewer软件进行可视化。

2  结果与分析

2.1  发文量分析

由图1可以看出自闭症研究相关文献总体上呈现逐年上涨趋势,且增长幅度较大呈指数增长趋势。自闭症文献数量从1946年开始缓慢增长,初期较为平稳。从2001年开始持续增长迅速到2008年达到一个小高峰,2008年联合国将每年的4月2日定为“世界自闭症日”[10],以提高人们对自闭症患者的关注度以及对自闭症早期干预的研究。在2010—2014年间研究人员对于自闭症的关注度稍有下降,但在2016年迅速上升达到高点,说明近几年来,随着自闭症患者的不断增长,研究人员对自闭症研究的关注度越来越高。

2.2  高频关键词分析

从自闭症相关文献中截取频次>10的关键词共769个,通过WordArt在线词云制作工具绘制关键词词云,见图2,频次排名前10的关键词主要有Autism Spectrum Disorder(自闭症)、Intellectual Disability(智力障碍)、Children(儿童)、anxiety(焦虑)、Schizophrenia(精神分裂症)、ADHD(注意缺陷多动障碍)、Diagnosis(诊断)、adult(成人)、Development(发展)、Social Cognition(社会认知),可以看出自闭症多发生于儿童,然而随着自闭症患者年龄的增长,研究人员对成人自闭症患者的关注也逐年增长。同时对自闭症患者与注意缺陷多动障碍、精神分裂症、焦虑等的共患病情况也受到了更多关注。

2.3  研究主题分析

通过自建网络并采用关联强度进行主题聚类,同时采用VOSviewer软件对其进行可视化,图中节点大小表示关键词频次的高低,连线代表关键词之间的关联程度,见图3,整个研究主题以“Autism Spectrum Disorder自闭症谱系障碍”为中心构成一个基于关键词共现形成的知识图谱,并根据关联强度自闭症知识图谱被聚为6个研究主题,分别为如下几方面。

①自闭症的相关基础理论研究。随着自闭症患者数量逐年增加,研究人员对自闭症的关注度不断上升,在自闭症的相关基础理论研究主题下,研究人员主要对自闭症不同年龄段的患者包括儿童、青少年、成人的患病率、性别差异等基础信息进行统计学分析,并对患者的心理健康、生活质量和睡眠压力、情绪调节方面进行评估。根据词频和中心性分析可以看出图中的高频关键词有“children(儿童)”“diagnosis(诊断)”“adult(成人)”“intervention(干预)”“assessment(评估)“epidemiology(流行病学)”等。其中3种中心性在整个网络中都处于靠前位置,说明该主题为自闭症的基础理论研究,且对其他主题都有支撑作用。主要针对不同年龄段的人群包括儿童、成人及患者的兄弟姐妹的患病情况、诊断情况及生活情况进行宏观描述,并根据患者的心理健康、社会技巧、睡眠质量。常用的分析方法有Meta分析、随机对照实验、流行病学研究等。见表1。

②自闭症致病因素研究。自闭症是一種神经发育障碍疾病,目前自闭症的致病因素尚不明确,可能与多种因素有关,包括遗传因素、免疫因素、炎症、环境因素等因素相关。根据词频和中心性分析可以看出高频词有“intellectual disability(智力障碍)”“neurodevelopmental disorders(神经发育障碍)”“genetics(遗传学)”“fragile x syndrome(脆性X综合征)”“inflammation(炎症)”“environment(环境)”“gut microbiota(肠道菌群)”等。近几年对于自闭症的遗传因素研究较为关注,主要集中基因突变、基因异常、染色体异常等,包括基因的单核苷酸变异和基因拷贝数变异,如脆性X染色体综合征或结节性硬化症。肠道菌群是目前的研究热点,有研究[11]表明肠道菌群与自闭症有很大关联,肠道菌群可以通过脑-肠轴影响免疫、代谢、神经及行为,间接地调控大脑功能,影响中枢神经系统,进而影响人的情感、认知和行为。在研究自闭症致病因素时,科研人员通常采用动物模型和动物实验方法来用于遗传因素、生理因素等致病因素研究。见表2。

③自闭症表型症状研究。自闭症的表现症状主要有言语障碍、社交障碍和重复刻板行为。根据词频和中心性分析可以看出高频词有“anxiety(焦虑)”“social cognition(社会认知)”“attention(注意力)”“social interaction(社交)”“emotion(情绪)”“sensory processing(感觉信息处理)”“eye-tracking(目光接触)”“face perception(人脸认知)”等。在该主题中焦虑频次最高,是自闭症患者的主要症状之一,其次表现为社会认知能力下降、注意力不集中、沟通障碍及情绪问题,然而社会交往障碍为自闭症的特异性症状[12],因此,研究人员聚焦于社会交往障碍症状来寻找自闭症患者的病因。社会交往障碍是最典型、最核心的临床表现,自闭症患者在社会交往方面存在质的缺陷,表现为回避目光接触,缺乏与人交往的兴趣,正常的交往方式和技巧。见表3。

④自闭症的临床诊断研究。自闭症的诊断主要包括自闭症的相关量表和影像学的辅助检查。根据词频和中心性分析可以看出高频词有“development(发展)”“theory of mind(心智理论)”“FMRI(功能性磁共振成像)”“functional connectivity(功能连接)”“EEG(脑电图描记器)”“cerebellum(小脑)”“neuroimaging(神经影像)”“MRI(核磁共振成像)”“amygdala(杏仁核)”“diffusion tensor imaging(弥散张量成像)”等。常用的自闭症心理评估筛查量表有自闭症行为量表(autism behavior checklist,ABC),共57个项目;常用诊断量表有自闭症诊断观察量表第2版(ADOS-2)、自闭症诊断访谈量表修订版(ADI-R)和儿童自闭症评定量表(childhood autism rating scale)。脑发育与自闭症的关系是目前的研究热点,科研人员多从大脑的影像学方面进行自闭症的辅助检查,其中包括脑电图、神经影像、功能性磁共振成像等发现自闭症患者的脑部结构异常[13]。见表4。

⑤自闭症干预措施研究。目前自闭症的干预措施包括行为干预治疗和药物治疗,其中主要采用行为干预治疗,药物治疗是一种辅助措施。根据词频和中心性分析可以看出高频词有“language(语言)”“communication(交流)”“social communication(社会交流)”“parent training(家长训练)”“functional analysis(功能分析)”“augmentative and alternative communication(辅助沟通系统)”“video modeling(录像示范)”等。行为干预一直是自闭症研究的热点,常用的行为干预措施有应用行为分析、辅助沟通系统、录像示范等,研究人员主要通过此类干预措施提升自闭症患者的语言沟通能力和社会交往能力。同时药物治疗也可以改善患者的情绪症状,如情绪不稳、动行为、攻击行为等[1]。见表5。

⑥自闭症共病研究。在自闭症的共病研究中,注意力不集中、抑郁症、强迫症、精神病等此类疾病与自闭症的共病较为常见。根据词频和中心性分析可以看出高频词有“ADHD(注意缺陷多动障碍)”“depression(抑郁症)”“comorbidity(共病)”“(treatment)治疗”“bipolar disorder(躁郁症)”“psychosis(精神病)”“obsessive-compulsive disorder(强迫症)”。科研人员在自闭症的共病研究中,对注意缺陷多动障碍尤为关注,并且在自我抑制行为方面,共患ADHD的自闭症患者比自闭症患者表现出更严重的问题。自闭症合并注意缺陷多动障碍与单纯的自闭症在神经病理学功能方面有着显著性差异,共患病患者表现出较高的焦虑症状和攻击行为[14]。见表6。

3  讨论

自闭症作为一种神经发育障碍疾病,以社交障碍、刻板行为、语言障碍等症状为主。近些年来,自闭症患者的数量不断增加,但其病因尚不明确,可能由多种因素导致[15]。目前的治疗方式主要为行为干预,药物干预相对较少。从发文量统计中可以看出,自闭症相关研究呈指数增长趋势,初期发展较为平稳,研究人员对自闭症领域的研究相对较少;但之后呈现缓慢增长趋势,并在2018年达到一个小高峰。随着自闭症患者的不断增多,研究人员对自闭症领域的关注度不断增加。从词云图中可以看出,研究人员对于自闭症患者的共病问题研究较为普遍,自闭症与焦虑、精神分裂症、多动症等疾病的频次相对较高,自闭症与此类疾病的相关研究更为广泛。该文利用共现分析和中心性分析,并基于知识图谱对自闭症谱系障碍进行主题分析,从自闭症相关文献中提取关键词,构建共现网络并聚为6个自闭症研究主题分别为自闭症基础理论研究、自闭症致病因素研究、自闭症表型症状研究、自闭症的临床诊断研究、自闭症干预措施研究、自闭症共病研究。对这6个主题进行剖析研究,首先发现自闭症多发于儿童,而随着年龄增长成人自闭症也逐渐增多,研究人员对于自闭症的患病情况及患者的心理、情绪问题研究较多;同时自闭症的致病因素尚不明确,可能与多种因素相关包括遗传、免疫、炎症等,其中遗传因素研究是当前研究热点,主要有基因突变、染色体异常等。其次对于自闭症的表型症状主要表现为焦虑、认知能力下降、注意力不集中等。对于自闭症的诊断治疗方面,研究人员多从自闭症相关量表和大脑影像学的辅助检查出发发现自闭症患者的脑部结构的相关异常信息,同时运用行为干预措施进行自闭症治疗,主要采取行为分析、辅助沟通系统等干预方法。最后自闭症与注意力障碍缺陷等疾病的共病问题也是当前研究热点,在此领域中研究人员对于自闭症与注意力缺陷多动障碍的共病问题研究较为关注。因此,建议研究人员从多角度出发,对自闭症的成因、诊断治疗、干预措施及共病问题等方面做进一步的深入研究,推进自闭症的临床诊断与治疗。

[参考文献]

[1]  鄧明昱,劳世艳.自闭症谱系障碍的临床研究新进展(DSM-5新标准)[J].中国健康心理学杂志,2016,24(4):481-490.

[2]  段云峰,吴晓丽,金锋.自闭症的病因和治疗方法研究进展[J].中国科学:生命科学,2015,45(9):820-844.

[3]  李胜,江鸿,费安兴,等.孤独症谱系障碍的遗传学研究进展[J/OL].中国儿童保健杂志:1-4[2019-07-26].http://kns.cnki.net/kcms/detail/61.1346.R.20190618.0931.020.html.

[4]  马敬东,张学高,李岳峰,等.国内外健康医疗大数据资源标准体系研究进展[J].中国卫生信息管理杂志,2019,16(3):257-262.

[5]  刘奕杉,王玉琳,李明鑫.词频分析法中高频词阈值界定方法适用性的实证分析[J].数字图书馆论坛,2017(9):42-49.

[6]  田丹,刘奕杉,王玉琳.热点分析类文章的文献计量分析—以词频分析方法为例[J].情报科学,2017,35(8):164-169.

[7]  李炯.基于共现分析的图书情报领域可视化研究[D].济南:山东大学,2014.

[8]  陈云伟.社会网络分析方法在情报分析中的应用研究[J].情报学报,2019,38(1):21-28.

[9]  祁凯,张子墨.基于社会网络分析的虚拟学术社区知识共享研究[J].知识管理论坛,2018,3(6):335-344.

[10]  联合国.世界自闭症日[EB/OL].[2019-3-10].http://www.un.org/zh/events/autismday/background.shtml.

[11]  刘天浩,张晓梅,程羽,等.初探肠道菌群与自闭症的关系[J].辽宁中医杂志,2018,45(9):1854-1858.

[12]  吴彦.我国自闭症儿童干预研究的可视化知识图谱分析[J].南京晓庄学院学报,2018,34(5):66-70.

[13]  何瑜玢.儿童孤独症的研究进展[J].中国妇幼保健,2016,31(6):1343-1346.

[14]  郑毅.孤独症的共病问题及其对诊疗的影响[J].中国儿童保健杂志,2018,26(4):349-351.

[15]  南洁,崔军武,董效军,等.自闭症研究动向综述[J].系统医学,2018,3(11):187-189.

(收稿日期:2020-04-12)

[基金项目] 山西省重点研发计划项目(201803D31099)。

[作者简介] 张靓(1993-),女,硕士,研究方向:医学知识发现。

[通信作者] 齐昊(1975-),男,硕士,主任医师,研究方向:糖尿病大数据,E-mail:qi-h@163.com。

猜你喜欢
知识图谱
国内外智库研究态势知识图谱对比分析
国内信息素养研究的知识图谱分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的智慧教育研究热点与趋势分析
国内酒店品牌管理研究进展的可视化分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
专家知识图谱构建研究