人工智能在胸部CT 肺结节检测与诊断中的研究进展

2023-08-28 02:50黄原义通信作者
影像研究与医学应用 2023年11期
关键词:放射科实性恶性

陈 静,黄原义(通信作者)

(长江大学附属荆州医院放射科 湖北 荆州 434020)

肺癌是发病率和死亡率增长最快的恶性肿瘤之一,也是癌症相关死亡的主要原因[1-2]。由于大多数肺癌确诊时已处于疾病的中晚期,当时可用的治疗选择很少,因此在大多数国家,个体的5年生存率仅为10%~20%[3]。而早期肺癌经过治疗治疗后5年生存率可达90%以上[4],由此可见,提高肺癌患者的治愈率和预后有赖于早期筛查和早期治疗。肺结节是肺癌早期最常见的影像学表现,早期阶段检测和诊断肺结节成为肺癌筛查的关键问题。计算机断层扫描(computed tomography,CT)具有高密度分辨率,被认为是筛查中最成熟、最有效的影像学技术之一。为了保证筛查计划的有效性,应仔细分析每个数据集,识别所有肺结节并检查其边界、形状、位置和大小,以及判断其类型(实性、部分实性或磨玻璃结节)。在医学图像分析中,放射科医生必须在有限的时间内分析单个患者的大量图像,这样的程序极具挑战性和耗时,解决这个问题的方案之一是使用人工智能。

AI 擅长处理大量的计算和重复劳动,目前应用于医学的许多领域,包括医学诊断、医学统计、机器人技术和人类生物学。在肺癌筛查中,人工智能技术的使用可以帮助放射科医师减少阅读时间、识别候选结节和检索尽可能多的与诊断相关的信息,提高肺癌筛查的检测与诊断效率。近年来,随着计算机系统领域的快速发展,人工智能在肺结节的检测与诊断方面的应用越来越广泛。

1 人工智能概述

人工智能是一个通用术语,是指使用计算机在有或没有轻微的人为干预下模拟智能行为[5]。主要组件包括用于训练的数据集,预处理方法,用于生成预测模型的算法,以及预训练模型,以加快构建模型的速度并继承以前的经验。机器学习(machine learning,ML)是人工智能的一个子类,是一门在没有明确编程的情况下获得解决问题的算法的科学,其算法可以识别和学习复杂数据集内的模式,以产生智能预测[6],包括决策树(decision trees,DT),支持向量机(support vector machines,SVM)和贝叶斯网络(bayesian networks,BN),然而大多数传统的ML 算法仍然需要人工输入,并且这种算法能够评估的模式仍然相当简单。深度学习(deep learning,DL)是ML 的另一个子类,其算法被组织成基于人工神经网络的许多处理层,可以同时实现特征选择和模型拟合[7]。

医学成像最常用的DL 模型是卷积神经网络(convolutional neural network,CNN),它最初由福岛在1980年描述[8]。LECUN 等[9]在1989年首次描述了使用反向传播来训练CNN 进行图像识别。2012年,Krizhevsky 等[10]率先使用图形处理单元(graphics processing unit,GPU)训练CNN 对物体进行分类,并因此赢得了ImageNet 大规模视觉识别挑战赛。CNN 不需要人工干预进行复杂的数据分析,它以人脑为模型,神经元被组织成多层[11],包含输入层和输出层,网络的计算能力在于将多个“神经元”集成到输入层和输出层之间的多个深层隐藏层中,其中一层的输出作为下一层的输入。

对于医学图像分析,DL 的应用在2015年和2016年开始并迅速增长[12]。深度学习已应用于超声,X 射线,计算机断层扫描和磁共振成像,现在被认为是医学图像分析中最先进的方法,已被证明在许多应用中优于传统的机器学习方法和放射组学,但它需要更多的数据进行训练,这可能是一个限制因素。计算机辅助诊断(computer-aided detection and diagnosis,CAD)工具由软件组成,该软件使用源自AI 的算法来提供指标并协助放射科医生。CAD 系统被细分为对医学图像进行检测并发现病灶的计算机辅助检测(computer-aided detection,CADe)工具以及对已检测的病灶进行诊断和鉴别的计算机辅助诊断(computer-aided diagnosis,CADx)工具[13]。

2 AI与肺结节检测

肺癌诊断工作流程的第一步是检测所有肺结节。众所周知,放射科医生并不能发现所有的结节,并且对于什么构成肺结节存在相当大的分歧。在杂乱的血管和气道图像中搜索特定的东西对于人类来说是一项艰巨的任务,特别是在时间压力下以及当存在的结节数量未知时。许多评估放射科医师在肺结节检测中表现的研究显示,观察者间一致性较低,灵敏度为30% ~97%[14]。在美国国立肺筛查试验(National Lung Screening Trial,NLST)中多达8.9%的癌症被遗漏[15]。尽管两名放射科医生同时读取扫描结果提高了检测灵敏度,但由于其耗时且效率低下的性质,这在日常实践中是不切实际的[16]。人工智能的开发与应用很大程度上解决了这一问题。

CADe 系统的最大优势之一是可以检测到容易被放射科医生错过的较小的肺结节。刘晓鹏等[17]研究发现,AI 和放射科医生分别对5 mm 层厚的相同肺部CT 进行阅片时,AI 对肺结节的检出率优于人工阅片。李欣菱等[18]发现,与人工阅片相比,AI 对肺恶性结节的检出具有更高灵敏度。蔡强等[19]发现低年资的医师在采用了CADe 系统之后,肺结节检测的灵敏度由41%提高到76%,而对于高年资的专科医师,则是由80%增加为93%,由此可知,CADe 系统在辅助低年资医生检测肺小结节方面的成效十分显著。Rubin 等[20]发现,与传统的双人读数相比,使用CAD 之后肺结节检测的平均灵敏度得到了显著提高,从63%(范围:56%~67%)提高到76%(范围:73%~78%)。

然而随着CADe 系统灵敏度的提高,假阳性率也将有可能相应增加,这也是影像科医师比较关注的问题,为此,探索了一系列新型算法。Xie 等[21]提出了一种基于Faster R-CNN 的2D 结节检测框架,用于降低假阳性率。Tang 等[22]训练了一个3D Faster R-CNN 用于结节检测,然后结合了一个3D 分类器以获得更好的肺结节检测性能。Sakamoto 等[23]引入了一种融合分类器,结合级联CNN,以每个结节的概率形式逐渐将结节与非结节分类。Dou 等[24]提出了一种用于结节检测的两阶段3D CNN,其中在第一阶段使用在线样本过滤方案训练网络进行候选筛选,然后使用混合损失3D 残差网络将真实结节与建议的候选者区分开来。Wang 等[25]提出了一种中央聚焦CNN,可捕获3D 和2D CT 图像特征以分割肺结节。Dobbins 等[26]首先开发了自动肺分割方法和结节检测技术,实现了肺分割的高准确性,并正确识别了所有结节。

此外,AI 还可以测量检测到的肺结节体积,并估计肺结节的体积倍增时间,以3 个月计算的基于体积的倍增时间超过400 d、体积<50 mm3与50 ~500 mm3之间的结节为阴性筛选[27]。在荷兰-比利时肺癌筛查随机试验(Nederlands-Leuvens Longkanker Screenings Onderzoek,NELSON)研究中[28],阳性筛选(真阳性和假阳性)的比率为6.6%,相比之下,在NSLT 中为24.1%,其中手动测量结节直径,且≥4 mm 的结节被认为是阳性筛选。基于软件的体积测量具有高度可重复性[29],对于实性结节,倍增时间超过500 d 对恶性肿瘤的诊断具有98%的阴性预测价值[30]。然而,对于部分实性结节,即使可以分别估计某些亚实性结节的实性成分和非实性成分的倍增时间,体积软件的可靠性仍然很低[30]。

3 AI与肺结节诊断

肺结节分类和恶性预测是结节诊断中的重要任务。放射科医师可以通过CT 影像呈现的病灶大小、形态、密度,纹理等一系列特征来区分结节良恶性[31]。然而,良性和恶性结节的影像学表现可能有相当大的重叠,导致放射科医生之间的观察者间差异很大,这可能导致漏诊恶性肿瘤、不必要的介入程序,例如活检和/或切除并伴有潜在并发症,和/或不必要的影像学监测。在临床实践过程中,AI 可以向放射科医生突出并呈现可疑的影像特征区域,快速确定肺结节的良恶性性质,预测肺癌风险,减少放射科医师的工作量,降低肺结节分类的误诊率,提高诊断效率[32]。

对于肺结节分类,基于手工特征和基于深度学习特征是两个主要的线索。Liu 等[33]提取了24 个放射学特征,并训练了一个线性分类器来预测结节的恶性状态。Shewaye 等[34]通过使用不同的线性和非线性判别分类器组合几何和直方图肺结节图像特征,在看不见的测试数据上正确分类了82% 的恶性结节和93% 的良性结节。对于深度学习方法,Ren 等[35]开发了流形正则化分类深度神经网络(MRC-DNN),自动判断良性恶性肿瘤,准确率达90.00%。Hussein 等[36]使用标准的3D CNN 架构评估不同结节的特征,包括钙化、分叶、球形、推测、边缘和纹理,然后生成结节的恶性评分,准确率为91.26%。Kang 等[37]设计了基于3D Inception 和3D Inception-ResNet 架构的3D 多视图CNN(MV-CNN),该系统将结节分为良性和恶性组;并在LIDC-IDRI 数据集上进行的10 倍交叉验证实验表明准确率为95.25%。

对于肺癌风险预测,2019年,Ardila 等[38]开发了一种DL 网络,该网络使用患者之前和当前的CT 体积来帮助预测肺癌的风险。该模型在6 716 例美国国立肺筛查试验病例中表现出优异的性能,曲线下面积(area under the curve,AUC)为94.4%,并在1 139 例病例的独立临床验证集上表现出相似的性能。在这个项目中,他们进行了两项读者研究。当先前的CT 成像可用时,模型性能与放射科医师相当。然而,当先前的CT 成像不可用时,该模型的表现优于所有6 名放射科医生,假阳性的绝对减少了11%,假阴性的绝对减少了5%。

然而,计算机辅助诊断决策系统需要通过经验丰富的放射科医生建立大型标记数据集,这非常昂贵、耗时且不可靠。基于监督学习方案的少量训练样本会导致过度拟合、缺乏可解释性、注释数据不足等问题。此外,有学者[39]发现,在对肺结节进行分类时,放射科医生组的AUC 要高于AI 组(0.70 ~0.85 vs 0.50 ~0.68),且3 名放射科医生的表现均要优于计算机系统方法,表明AI 技术目前还无法代替人工,其鉴别肺结节的准确度尚需进一步提高。

4 小结

近年来,人工智能已经成为放射科医生日常生活的一部分。目前越来越多的人工智能模型被用于监测各种数据,包括电子健康记录数据、成像模式、组织病理学和分子生物标志物,以提高疾病风险预测、治疗反应检测和预测的准确性等。这些发展不应被视为威胁,而应更多地被视为机遇。放射科医生可以从工作流程优化中受益,并提高检测、表征和量化任务的性能,特别是在胸部成像领域。然而,人工智能目前仍处于起步阶段,此时无法考虑成像任务的完全自动化,人工验证仍然是必要的。

猜你喜欢
放射科实性恶性
放射科住院医师职业倦怠研究进展
我国放射科住院医师规范化培训现状的调查与思考
胰腺实性浆液性囊腺瘤1例
恶性胸膜间皮瘤、肺鳞癌重复癌一例
放射科专业基地入科教育的实践探讨
卵巢恶性Brenner瘤CT表现3例
实时超声弹性成像诊断甲状腺实性结节的价值
甲状腺结节内钙化回声与病变良恶性的相关性
胰腺实性假乳头状瘤14例临床诊治分析
放射科安全管理