影像组学在前列腺癌中的研究热点和趋势的可视化分析

2024-02-02 12:13王文昊张添辉谢周洲张桂豪陈南辉
广东医学 2024年1期
关键词:组学发文领域

王文昊, 张添辉, 谢周洲, 张桂豪, 陈南辉

1广东医科大学第一临床医学院(广东湛江 524023); 梅州市人民医院 2磁共振二科, 4泌尿外二科(广东梅州 514031); 3汕头大学医学院梅州临床学院(广东梅州 514031); 5广东医科大学梅州临床医学院(广东梅州 514031)

前列腺癌(prostate cancer,PCa)是男性第二大常见恶性肿瘤,每年新增病例约为140万例[1]。随着PCa筛查的普及和人口老龄化的趋势,我国PCa的发病率呈持续增长趋势,严重危害我国男性健康[2]。PCa起病隐匿,大部分患者首发即为中晚期,这使得很多患者错过最佳的治疗时机。研究表明,PCa早诊早治有助于提高患者的生存率,延长患者寿命[3],因此实现PCa的早诊早治显得尤为重要。目前,PCa最常用的筛查手段是前列腺特异性抗原(prostate specific antigen,PSA)。但PSA易受到年龄、炎症、射精等多种因素干扰,其敏感度和特异度方面均有限[4]。与之相比,影像组学可将传统影像学图像转换为医学数据,反映肿瘤内部异质性,其可以弥补常规检查方法的不足,实现对疾病的诊断和疗效评估[5]。近年来,随着计算机技术的不断发展,研究者在PCa影像组学方面的研究不断深入[6-8],相关文献量迅速攀升,但缺少对该领域当前研究趋势和研究热点的相关研究。文献计量学是一种对文献资料进行定量分析的研究方法。它通过统计学方法分析文献相关资料,了解研究质量,探索当前研究热点和发展趋势,预测未来研究方向[9-11]。本研究利用Citespace、VOSviewer和R语言对PCa影像组学相关文献进行可视化分析,总结影像组学在PCa中的应用和发展情况,揭示影像组学在PCa当前发展趋势,探索该领域研究热点,为PCa影像组学的研究者提供研究方向。

1 资料与方法

1.1 研究对象 本研究通过医院伦理委员会审核(梅市伦审2023-C-89)。以Web of Science(WOS)核心合集数据库中1980年至2023年7月17日发表的与PCa影像组学相关的所有文献,检索词为TS=(“radiomics”or “radiogenomics” or “texture analysis”) and ts=((“prostate” or “prostatic”) near/1(“cancer” or “tumor”))。

1.2 文献检索策略 按上述检索式搜索,初步获取文献,再剔除非英语文献、会议摘要(meeting abstract)、社论材料(editorial material)、勘误(correction)、撤回论文(retraction)。数据分别由两名研究人员进行提取并交叉核对,以确保数据的准确性和研究的可重复性。见图1。

图1 文献检索策略图

1.3 数据分析 将在WOS上检索出来的结果,导出为“完整记录和引用的参考文献”的纯文本文件,里面包括出版年份、文献类型、作者、隶属关系、出版物标题、出版商、研究领域和国家/地区等属性。利用WOS数据库的“引文报告创建”功能获取了按年份的被引频次和出版物分布图。随后,使用RStudio(版本4.2.3)的“Bibliometrix”包,将数据文件导入到Biblioshiny中。

1.3.1 合作网络分析 使用VOSviewer 1.6.19[12-13]检测不同国家/地区或机构之间的合作模式,揭示相互之间的合作关系

1.3.2 共被引分析 使用VOSviewer 1.6.19对期刊、作者和文章进行共被引分析,以评估相互之间的关系强度。以总链接强度(total link strength,TLS)来衡量与其他国家/地区或机构的联系紧密程度,其数值越大表明相互之间的合作越紧密。将共同引用次数不少于50次的97种期刊纳入分析对象。节点越大,期刊的重要性越高;节点之间的连线越粗,两种期刊的研究内容相似度越高。被引次数会受到发表时间的影响,本研究还增加年平均被引数(TC per year)以综合评估。

1.3.3 共现分析 对关键词进行共现分析,揭示出该领域鲜明的研究方向和热点。有部分论文没有被添加Author Keywords(DE),本研究额外加入了WOS自动生成的Keywords Plus(ID),合并为All Keywords (DE+ID)。将时间属性赋予到关键词,对关键词进行时间叠加可视化分析,可揭示潜在的研究热点。

1.3.4 聚类分析 使用CiteSpace 6.2.4[14-15]对不同作者的研究方向、文章主体和关键词进行聚类分析。以Q值衡量网络聚类效果,Q值>0.3时表示聚类效果好,S值是测量网络同质性的指标,S值越接近1,其网络同质性越好[16-17]。

2 结果

2.1 检索结果 根据搜索式搜索初步获取文献607篇。排除非英语文献5篇,剔除会议摘要58篇、社论材料21篇、勘误3篇、撤回论文1篇,最终纳入文献519篇,其中论著420篇,综述99篇。通过WOS引文分析功能分析了“相关领域的发表和被引趋势”,近5年来,PCa影像组学相关领域的研究呈爆发式增长,发文量(370篇)和总被引次数(5 584)分别占全年的71.3%和34.3%(图2)。

图2 1996—2023年总发文量及被引频次

2.2 国家/地区、机构分布及合作网络视图 1980—2023年,共有52个国家/地区为PCa影像组学相关研究作出了贡献,在国家/地区中,来自美国的作者在该领域最活跃,发文160篇,其次是中国(n=119)和意大利(n=80)。而在发文量前10的研究机构中,Icahn School of Medicine at Mount Sinai的贡献最为突出(n=27),其次是The University of Manchester(n=21)和University of Cambridge(n=20),见表1。有27个国家在相关领域发表了5篇以上论文,美国占据了中心位置(TLS=186),其次是英国(TLS=1118)、德国(TLS=186)、意大利(TLS=182)和荷兰(TLS=174),国家之间的共同合作见图3。在机构合作方面,Icahn School of Medicine at Mount Sinai(TSL=134)在该领域具有重要地位,其次是The University of Manchester(TSL=121)和University of Cambridge(TSL=111),见图4。

表1 发文量前10的国家/地区及机构

图3 国家/地区间的合著化分析图谱

图4 机构间的合著化分析图谱

2.3 期刊分析 PCa影像组学研究共被发表在168种期刊。报道最多和被引用次数最多的10本期刊见表2,其中《Frontiers in oncology》(n=36)、《Cancers》(n=32)、《European radiology》(n=25)是刊登文章最多的3个期刊,占所有文章的18%。被引用次数最多的期刊是《European radiology》(n=1 256)、其次是《Journal of magnetic resonance》(n=877)和《Cancers》(n=398)。根据2022年期刊引文报告,发文量前10的期刊中,位于Q1、Q2的期刊各有4本;被引用次数前10的期刊中,有4本期刊为Q1,5本期刊为Q2。《Radiology》在该领域尤为重要,其次是《European radiology》和《International Journal of Radiation Oncology Biology Physics》。见图5。

2.4 作者分析 Rosenstein教授的产出最高(20篇),其次是Kerns教授(14篇)和West教授(14篇);Lambin教授(2 947)的TLS最高,紧随其后的是Chaddad教授(2 669),Gillies教授(2 644),Turkbey教授(2 236)和Wibmer教授(2 050);而总被引次数最高的是Gillies(4 954次),见表3。为Madabhushi教授早在2005年开始了这一领域的研究,而Rosenstein教授自2007年就开始了这一领域的研究,并持续保持大量的产出。此外,大多数作者在2014年开始发表与该领域相关的文章。近年来,Tian教授开始在PCa影像组学研究领域崭露头角,发文量前10的作者随着时间推移在该领域的影响力见图6。Rrosenstein教授与来自美国的研究人员合作最多,其次是West教授和Vega教授与来自英国的研究人员合作较多。在机构合作方面,Rosenstein 教授和Kems教授与Icahn School of Medicine at Mount Sinai合作最紧密。国家、作者和隶属机构的关系见图7。

表2 发文量及被引用次数前10的期刊

图5 Z期刊间的共引分析图谱

表3 发文量、总被引次数及总链接强度前10的作者

图6 发文量前10的作者随时间推移在该领域的发文量

图7 国家、作者和隶属机构之间关系的桑基图

2.5 文献共被引分析 该领域被引频次排名前十的文献如表4所示。Gills等[18]发表在Radiology上的“Radiomics:Images are more than pictures,they are data”的论文以最高的被引次数(4 045)位居榜首,显著超过排名第二的文章(613);年平均被引数505.63,以该指标衡量,该论文依然排名第一,其在研究领域的影响深远。PCa影像组学领域文献共被引分析图谱见图8,共有78篇参考文献至少被共同引用20次。Gills(2016)发表的论文在图中的节点最大,为研究者进行影像组学研究提供了方法。在此基础上,聚类效果和网络同质性均较好,Q值为0.5959,S值为0.8987,参考文献的主题主要被聚类为PI-RADS、Normal tissue toxicity、mp-MRI、PET。见图9。

表4 被引用次数前10的文献

图8 文献共被引分析图谱

图9 文献共被引聚类分析图谱

2.6 关键词分析 总共记录了1 890个All Keywords,其中,有194个关键词出现了至少5次,使用频率最高的5个关键词分别是radiomics(放射组学)、prostate cancer(前列腺癌)、MRI、prostate-cancer(前列腺癌)、texture analysis,见表5。TLS排名前5的关键词也是该5个,其中“radiomics”位居首位。

结果显示,近年来研究聚焦在artificial intelligence(人工智能)(Avg.Pub.year=2021.40)、deep learning(深度学习)(2020.88)、nomogram(列线图)(2021.47)、clinically significant(临床变量)(2021.88)。见图10。

表5 出现频率最高及总链接强度最大的5个关键词

图10 关键词共现分析的时间叠加可视化

3 讨论

PCa是泌尿系统最常见的肿瘤之一,其发病率逐年攀升。PCa筛查主要依靠PSA水平的检测,但其诊断的准确率存在局限性。为了更深入地了解这一问题,文献计量分析以文献体系和文献计量特征为研究对象,利用定量研究方法分析某一领域的文献分布、关系、变化和进展,从而为该领域的研究者当前研究热点及发展趋势[28-29]。本研究显示,自2015年以来PCa影像组学相关研究呈现快速增长,特别是近5年来,该领域的研究呈爆发式增长,发文量和被引频次均占所有相关研究的50%以上,这一数据反映出科学界对PCa影像组学研究的日益关注以及这一领域在诊断和治疗PCa方面潜在的重大价值。

被引分析是评估学术论文或作者相关性的一个常用工具[30],并且经常用作衡量作者学术影响力的指标[12,31]。例如,Lammbin教授的论文共同被引用次数最多,与其他作者之间的联系最紧密,特别是其发表的“Radiomics:extracting more information from medical images using advanced feature analysis”系统地总结了影像组学的工作流程,为研究者提供了规范化的研究方法。此外,Gills等[18]发表在《Radiology》上的“Radiomics:images are more than pictures,they are data”一文的文献共被引分析节点最大,该文从影像组学的研究步骤、影像组学操作实例以及现有挑战等进行了详尽的阐述,是众多PCa影像组学研究者参考的核心文献。以上两位作者都为该领域作出了突出的贡献。通过对被引文献进行聚类分析,该领域被引较多的文献主题为PI-RADS、mpMRI、PET,这表明,既往该领域在PCa影像组学的研究中多关注MRI影像组学与PI-RADS评分在PCa中的研究[33-35]。对关键词进行共现分析,该领域的主要关键词为Radiomics、prostate cancer、MRI、texture analysis。进一步将时间赋予关键词显示,近年来该领域的热点为artificial intelligence、deep learning、nomogram、clinically significant。

目前,越来越多的研究集中于将人工智能、深度学习、列线图和临床变量运用于PCa影像组学的研究。在PCa的诊断方面,Li等[36]基于深度学习开发了一种影像组学模型用于区分前列腺良恶性,取得了良好的预测效能(AUC=0.985),并将其转化为列线图用于临床使用。He等[37]研究表明,将临床变量加入影像组学模型后,模型诊断PCa的特异度从0.781提高至0.827,准确度从0.8提高至0.86。Zhang等[38]将年龄、PI-RADS评分和影像组学特征相结合,构建新型列线图模型用以预测PCa,结果表明该模型可以提高PSA灰区诊断准确率,减少不必要的穿刺活检。Zheng等[39]研究表明,临床变量可使影像组学模型诊断淋巴结转移的AUC从0.843提高至0.915。Makowski等[40]将图像增强技术运用于影像组学诊断PCa Gleason评分中,结果显示,图像增强技术能使支持向量机模型的准确率提升48%。因此,影像组学和人工智能、深度学习、临床因素、列线图相结合比传统影像组学诊断PCa的诊断效能更好,而且为临床医生提供了更加准确的诊断决策工具,进而为患者提供更精确的个性化治疗方案。

在PCa的疗效预测方面,相关研究显示融合先进技术的影像组学模型在疾病进展方面优于传统方法。Sushentsev等[41]基于循环神经网络构建的时间序列影像组学模型与PSA密度相结合(AUC=0.86)在预测疾病进展方面明显优于传统的Delta影像组学和PSA密度结合的模型(AUC=0.75)。此外,时间序列影像组学模型的诊断性能(AUC=0.86)与影像医生使用PRECISE评分系统连续分析MRI的诊断性(AUC=0.84)相当。Zhong等[42]在影像组学中应用了自动化工作流程来识别MRI图像中的客观特征,在预测生化复发方面,影像组学模型(AUC=0.99)展现出了优秀的预测能力,同时,该模型对非生化复发的预测准确率高达86.1%。此外,深度学习在病变自动分割方面也展现出了较好的效果。Bleker等[43]开发的基于深度学习掩码的自动分割方法(AUC=0.76)比专家手工分割方法(AUC=0.67)具有更高的准确率和更少的时间,平均可节省97%的时间。因此,在影像组学中运用人工智能、深度学习的方法比传统影像组学方法预测能力更强,效率更高,可以节省更多的医疗资源。这些技术的集成对于PCa的诊断和治疗提供了更精确、更高效的方法。

本研究仍存在一定的局限性,首先,我们只对WOS数据库进行文献检索,没有在PubMed或Scopus等数据库进行检索,可能会遗漏部分相关文献。此外,我们检索的语言是英语,论文筛选标准存在一定的主观性和差异性。这意味着非英文文献和那些未被广泛引用或仅有自我引用的文献被排除在外,可能影响了研究的全面性。最后,文献检索时间点是2023年7月17日。但由于2023年尚未结束,因此2023年的数据并不完整。尽管有这些局限性,研究结果仍显示PCa影像组学领域的快速发展,特别是美国在该领域的领先地位。相比之下,中国虽然在发文量上表现出色,但在国际交流方面较为薄弱,缺乏高被引用的作者和高发文量的作者,因此其在全球范围内的影响力有限。未来,加强国际交流和合作将是推动中国在PCa影像组学领域发展的关键。

总的来说,随着计算机技术的发展,人工智能将更多地应用于PCa。未来,基于深度学习的影像组学列线图用于PCa诊断和治疗将成为研究热点,有望进一步提高诊断准确性和治疗效果,为患者提供更加精准的医疗服务。

利益相关声明:所有作者声明无利益冲突。

作者贡献说明:王文昊参与研究设计、数据收集与分析、撰写及修改论文;张添辉、张桂豪指导研究设计、指导修改论文;谢周洲参与数据收集与分析;陈南辉指导选题、指导及修改论文。

猜你喜欢
组学发文领域
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
领域·对峙
口腔代谢组学研究
校园拾趣
爷孙趣事
基于UHPLC-Q-TOF/MS的归身和归尾补血机制的代谢组学初步研究
以牙还牙
代谢组学在多囊卵巢综合征中的应用
新常态下推动多层次多领域依法治理初探
肯定与质疑:“慕课”在基础教育领域的应用