影像组学在肺腺癌基因突变预测中的应用进展

2023-08-16 12:38孟习文王广丽

国际医学放射学杂志 2023年3期

孟习文，王广丽

肺腺癌是肺癌最常见的亚型，也最易发生基因突变[1]。肺腺癌常见的驱动基因主要包括表皮生长因子受体（epidermal growth factor receptor,EGFR）、间变性淋巴瘤激酶（anaplastic lymphoma kinase,ALK）和克尔斯滕大鼠肉瘤病毒癌基因（kirsten rat sarcoma viral oncogene,KRAS）等。针对不同的驱动基因制定相应的靶向治疗策略，有利于改善肺腺癌病人的疗效和预后[2]。目前，驱动基因的检测主要依靠手术病理或组织活检等有创性方法。但由于肿瘤异质性的存在，有时通过有创性方法获得的组织样本并不能代表整体肿瘤的情况，且会增加病人的痛苦。因此，无创且高效地检测驱动基因十分重要。影像组学方法能够通过提取并分析医学图像中无法被人眼所识别的定量图像特征，从而评估肿瘤的生物学行为，使无创预测肺腺癌的基因突变成为可能，对个性化医疗及精准医疗至关重要[3]。本文就影像组学在肺腺癌常见及罕见基因突变中的应用进展予以综述。

1 影像组学在预测肺腺癌EGFR 基因突变中的应用

目前，肺腺癌中最常见且研究最多的突变基因为EGFR。EGFR 是一种具有酪氨酸激酶活性的糖蛋白，可调控正常细胞的增殖、分化和凋亡，但突变或扩增的基因可将该蛋白转化为癌蛋白[4]。携带突变基因EGFR 的肺腺癌病人对EGFR 酪氨酸激酶抑制剂（tyrosine kinase inhibitors，TKI）表现出明显的临床反应，但并非所有EGFR 突变的肺腺癌病人都受益于EGFR TKI[5]，因此尽早识别EGFR 突变状态及突变位点对病人预后具有重要作用。EGFR 突变位点主要发生在18、19、20、21 号外显子，最常见的突变位点为外显子19 缺失（19del）突变及外显子21 L858R 点突变。

1.1 区分EGFR 突变型与野生型多项研究[6，8-10]表明，影像组学预测EGFR 突变状态（突变型与野生型）的诊断效能较高，受试者操作特征（ROC）曲线下面积（AUC）可达0.7 以上，其中Lu 等[6]的研究在测试集中的AUC 值达到了0.894。与EGFR 突变有关的影像组学特征主要包括：（1）语义特征，如磨玻璃密度、空气支气管征、胸膜牵拉以及支气管血管束增粗等；（2）非语义特征，如偏度、峰度、熵值、灰度游程矩阵特征等。亚实性结节是早期肺腺癌最常见的表现，研究[7]表明亚实性结节在EGFR 突变的肺腺癌病人中出现的频率更高。Yang 等[8]分析了467 例亚实性结节表现的肺腺癌病人，从CT 平扫影像中共提取1 063 个影像组学特征，通过随机森林算法选择了43 个特征构建影像组学模型，该模型在预测亚实性结节的EGFR 突变方面表现出良好的效能，在训练组和验证组的AUC 分别为0.831 和0.789。目前，关于肺癌基因突变影像组学的研究通常基于CT 平扫影像，使用增强CT 影像的研究较少。Hong 等[9]在201 例晚期肺腺癌病人的增强和平扫CT 影像中，分别筛选出10 个和11 个影像组学特征，采用6 种不同的机器学习方法评价2 种影像提取的影像组学特征识别晚期肺腺癌EGFR 突变的效能，结果显示增强影像的效能优于平扫影像。该研究使用基于增强CT 成像的逻辑回归方法构建的影像组学模型诊断效能最佳，在验证队列中的AUC 为0.851。Yang 等[10]纳入253 例晚期肺腺癌病人，评价CT 扫描不同期相预测EGFR 突变状态的效能。分别从平扫期、动脉期和静脉期CT 影像中提取影像组学特征并构建模型，AUC 值分别为0.671 3、0.819 4 和0.846 4。该研究表明影像组学可以预测EGFR 突变状态，以静脉期模型效能最佳。与CT平扫相比，增强CT 可以更好地反映与周围结构相关的肿瘤区域，并且可以显示恶性肿瘤中血供情况，提供更多与肿瘤相关的信息。上述2 项研究均显示基于增强CT 构建的模型效能要优于平扫CT，且基于静脉期影像建立的模型效能最佳，但由于此方面研究目前较少，未来仍需要更多研究评价不同期相模型诊断效能的优劣。

研究[6，11-12]表明，结合临床特征、传统形态学影像特征或病理学特征构建的联合影像组学模型较单一特征构建的模型对EGFR 突变状态的预测效能更好，可能是由于联合模型中纳入的因素包括EGFR 突变的独立危险因素（性别、吸烟史、胸膜牵拉或病理亚型等）。Lu 等[6]分析了103 例肺腺癌病人的CT 影像和临床病理资料，构建了基于CT 影像的单独影像组学模型、结合临床病理学特征与形态学影像特征的组合模型、结合影像组学特征与临床病理学特征的组合模型，最终结果显示结合影像组学特征与临床病理学特征的组合模型预测EGFR 突变状态优于另外2 种模型，训练集和验证集的AUC分别为0.90±0.02、0.88±0.11，测试集AUC 值为0.894。Zhang 等[11]在由294 例肺腺癌病人组成的训练集中构建了影像组学模型、临床-影像学（clinical-radiology，C-R）模型及临床-影像-影像组学（clinical-radiological-radiomics，C-R-R）模型，并在验证集（129 例病人）中评估，C-R-R 模型在训练集和验证集中的AUC 值分别为0.849 和0.835，优于其他模型；另外，此研究还表明影像组学模型的诊断效能优于C-R 模型。Lu 等[12]首次使用过滤法进行特征选择，并构建基于CT 影像的机器学习模型预测EGFR 突变，影像组学模型在结合临床特征后诊断效能进一步提高，组合模型和单独影像组学模型的AUC 值分别为0.86、0.79。但也有研究[8,13]在添加临床特征后所建立的联合模型诊断效能并没有优于单独的影像组学模型。因此，将来仍需要更多的研究来证实。

1.2 区分EGFR 突变亚型影像组学不仅能够预测EGFR 的突变状态，在预测EGFR 突变亚型方面也具有一定的价值[14-16]。Liu 等[14]在263 例肺腺癌病人的CT 影像中提取并筛选影像组学特征，并添加临床特征一起建立模型，结果证实影像组学可以敏感地识别EGFR 突变（AUC=0.76），并且在预测肺腺癌病人（19del）和外显子21 L858R 突变方面也显示出较好的效能，AUC 值分别为0.69、0.66。Zhao 等[15]筛选出11 个基于CT 影像的影像组学特征并计算了影像组学分数（R 分数），整合R 分数、传统形态学影像特征和临床特征，构建基于影像组学的列线图，以无创地预测EGFR 突变状态及区分19del、L858R 突变，列线图在2 个验证数据集中的AUC 分别为0.734 和0.757。Zhang 等[16]纳入了728 例肺腺癌病人，分别构建临床模型、基于CT 影像的影像组学模型及联合模型识别19del 和L858R 突变，AUC值分别为0.813、0.852、0.875，联合模型的预测效能最高。不同的EGFR 突变亚型对于TKI 治疗的敏感性不同，因此应用影像组学预测EGFR 突变亚型，尤其是对TKI 治疗有反应的亚型，可能为其制定更精细的治疗方案提供重要信息。

1.3 基于不同成像的影像组学预测EGFR 突变基于PET/CT、双能CT 以及MRI 影像的影像组学都可以对肺腺癌病人的基因突变状态及突变亚型做出较准确的预测。杨等[17]回顾性收集了114 例肺腺癌病人，从PET、CT、PET+CT 影像中筛选出3、3、7 个特征分别建立回归模型，得到的AUC 分别为0.730、0.752、0.866，其中PET+CT 模型预测效能最高。Zhao 等[18]分别构建了基于CT 影像和基于18FFDG PET/CT 影像的影像组学模型，预测EGFR 突变的AUC 分别为0.715、0.727，后者的效能要优于前者。由此可见，基于PET/CT 的模型不仅可以预测EGFR 的突变状态，而且预测效能优于CT，这可能是由于EGFR 基因可影响肿瘤的葡萄糖代谢，而PET/CT 恰恰可以捕获到肿瘤的葡萄糖代谢水平。Liu 等[19]在148 例肺腺癌病人的18F-FDG PET/CT 影像中提取影像组学特征构建有关EGFR 突变亚型的预测模型，验证集中对19del 突变和L858R 突变预测的AUC 值分别为0.77 和0.92，但此研究仅分析了PET/CT 模型对于EGFR 突变亚型的诊断效能，并没有进行常规CT 模型和PET/CT 模型诊断效能的比较。王等[20]对CT、PET 和PET/CT 融合组学特征进行学习,探究18F-FDG PET/CT 影像结合机器学习算法对肺腺癌EGFR 突变亚型的预测价值，融合组学特征通过用特征拼接和特征平均的方法对PET 和CT 影像学特征进行融合获得，结果显示PET/CT 平均融合特征模型的预测效能（AUC=0.87）高于PET 特征模型（AUC=0.64）、CT 特征模型（AUC=0.64）。双能CT 通过使用2 种不同能量的X 射线采集数据，可以区分不同成分（如钙和碘等），而常规CT 无法实现。基于双能CT 的影像组学在预测EGFR 突变状态方面也显示出较好的效能，周等[21]在103 例肺腺癌病人的静脉期40、100 keV 单能量影像中提取了396 个影像组学特征，将影像组学特征、临床特征及双能CT 碘参数相结合构建模型预测EGFR 突变状态，此模型在训练集和验证集的AUC分别为0.871 和0.827。Wang 等[13]的研究是第一次使用MRI 影像组学预测肺腺癌病人EGFR 突变，构建了ADC 模型、DWI 模型、T2WI 模型、多序列模型和包括性别、吸烟状况及影像组学特征的联合模型，AUC 值分别为0.805、0.692、0.695、0.838、0.727，与单序列模型相比，多序列影像组学模型的预测效能进一步提高，但是联合模型并没有优于单独的影像组学模型。该研究提示对于辐射敏感、有活检禁忌或者需要连续随访的病人，基于MRI 的影像组学可以提供一种相对准确、方便且无创的EGFR 突变检测方法。

1.4 深度学习模型预测EGFR 突变目前，使用机器学习方法对EGFR 突变状态及亚型进行预测是研究的主流，近年的一些研究[22-25]发现深度学习对EGFR 突变状态的预测效能要优于机器学习。Wang等[22]使用844 例肺腺癌病人的CT 影像构建了一个端到端的深度学习模型预测EGFR 突变状态，该模型在训练和验证队列中的AUC 分别为0.85 和0.81。Xiong 等[23]基于503 例肺腺癌病人的CT 影像，构建了三维卷积神经网络（convolutional neural networks，CNN）来预测EGFR 突变状态。CNN 在独立验证集中AUC 值为0.776，CNN 和临床特征的融合模型AUC 值为0.838。Song 等[24]纳入了665 例肺腺癌病人，探讨基于CT 影像的深度学习模型对肺腺癌病人EGFR 突变亚型的预测能力，分别构建了机器学习模型和CNN 模型，结果表明CNN 模型的预测效能优于机器学习模型。Zhang 等[25]从CT 影像中提取影像组学特征，构建了3 种不同的机器学习模型以及挤压和激发CNN （squeeze-and-excitation-CNN，SE-CNN），以从影像组学特征映射中识别EGFR 突变状态，结果表明SE-CNN 可以精确识别肺腺癌病人的EGFR 突变状态（AUC=0.841），且优于机器学习方法。与传统的影像组学方法相比，深度学习更易于实施，不需要手动勾画兴趣区，直接从原始数据中进行自动学习，从而挖掘出更深层次和潜在的信息，具有较高的准确性。但深度学习要求大量的样本量，当样本量较小时，选择机器学习方法可能更加合适。

2 影像组学在预测肺腺癌ALK 重排中的应用

ALK 基因重排是非小细胞肺癌发展的驱动突变，ALK 蛋白是一种跨膜受体酪氨酸激酶，属于胰岛素受体超家族[26]。ALK 基因突变于2007 年首次在非小细胞肺癌中被报道，当时在一部分日本病人(7%) 中发现了棘皮动物微管相关蛋白样4（echinodern microtubule-associated protein-like 4,EML4）-ALK 融合基因[27]，EML4-ALK 融合基因能够促进肿瘤的生长和增殖，代表了一个新的分子靶点，为非小细胞肺癌的治疗提供了新的选择。与常规化疗相比，ALK 抑制剂在ALK 阳性非小细胞肺癌的治疗中显示出明显的优势[28]。因此，通过影像组学无创地识别ALK 重排将有益于病人预后。

在临床工作中，影像组学可以精确、无创地识别肺腺癌ALK 重排状态，具有较好的临床应用前景。Song 等[29]在335 例肺腺癌病人的CT 平扫影像中提取并筛选影像组学特征，分别构建了影像组学模型、传统影像模型，以及结合了影像组学特征、临床数据和传统影像特征的联合模型，用于区分肺腺癌中的ALK 重排病人，AUC 值分别为0.80、0.86、0.88。Ma 等[30]基于140 例肺腺癌病人的CT 平扫和CT 增强影像，筛选出25 个平扫特征和19 个增强特征，构建2 种ALK 重排影像基因组学模型，与基于平扫影像的模型（AUC=0.801 0）相比，增强后影像基因组学模型（AUC=0.828 5）具有更优的效能。Choe 等[31]从503 例肺腺癌病人CT 影像中提取原发灶的瘤内和瘤周影像组学特征，分别构建了临床模型、瘤内影像组学模型、瘤内及瘤周影像组学模型以及联合模型来诊断ALK 和EGFR 突变状态，对于ALK 重排的预测，肿瘤内影像组学模型的AUC 值为0.68，优于临床模型（AUC=0.64），且增加临床特征后的模型诊断效能进一步提高（AUC=0.72），但增加瘤周特征并没有提高模型效能（AUC=0.67）。Chang 等[32]进行基于PET/CT 的影像组学分析，应用临床模型、影像组学模型和联合模型来预测肺腺癌病人的ALK 突变，研究显示联合模型（AUC=0.88）和影像组学模型（AUC=0.86）预测效能均优于临床模型（AUC=0.74），但联合模型与影像组学模型之间没有显著差异。在上述研究中，无论是基于增强CT影像，还是CT 平扫影像构建的影像组学模型均表现出较稳定的效能，联合模型的诊断效能优于单独的临床模型，但联合模型是否优于影像组学模型还需要进一步的研究来证明。

3 影像组学在预测肺腺癌KRAS 突变中的应用

大鼠肉瘤病毒（RAS）基因是人类癌症中最常发生突变的癌基因，其中KRAS 是最常见的RAS 突变亚型，存在于35%的肺腺癌中。尽管近年来靶向治疗和免疫检查点抑制剂的使用极大地改变了晚期非小细胞肺癌的治疗前景，但由于缺乏经典的药物结合位点，一直认为KRAS 突变是不可治愈的[33]。最近，KRAS 的直接靶向药物取得了重大进展，尤其是KRAS（G12C）抑制剂，如AMG510 和MRTX849，在临床试验中取得了令人满意的结果。2021 年，美国食品和药物监督管理局批准了AMG510 治疗有KRAS（G12C）突变的非小细胞肺癌病人，这是首个直接针对KRAS 突变的药物[34]。

通过影像组学预测肺腺癌病人中KRAS 突变的研究目前很少，Wang 等[35]研究了79 例Ⅰ期肺腺癌病人CT 影像特征与KRAS 突变之间的关系及其预后价值，结果表明毛刺征与KRAS 突变显著相关（比值比=2.99），胸膜附着与生存率相关（风险比=2.46）。Rios Velazquez 等[36]尝试应用基于CT 影像的影像组学模型预测肺腺癌病人KRAS 突变，建立了影像组学模型、临床模型及联合模型，结果表明临床模型识别KRAS 突变效能（AUC=0.75）高于影像组学模型（AUC=0.63）及联合模型（AUC=0.69）。此外，研究还发现影像组学模型能够区分EGFR+和KRAS+肿瘤（AUC=0.80），并且当与临床模型（AUC=0.81）结合时，可显著提高预测效能（AUC=0.86）。随着KRAS 靶向治疗药物的发现，使用影像组学预测肺腺癌KRAS 突变状态将具有光明的前景。

4 影像组学在预测肺腺癌罕见基因突变中的应用

目前，利用影像组学预测肺腺癌基因突变的研究主要集中于EGFR 突变以及ALK 重排，但肺腺癌仍存在其他多种类型的突变，例如ROS1、RET、BRAF、MET ex14 突变等。由于这些基因突变的发生率较低或目前尚未有靶向药物问世，所以此类基因突变的研究较匮乏。Yoon 等[37]的一项研究发现，基于PET 的影像组学模型结合肿瘤分期和年龄能够区分ALK/ROS1/RET 融合阳性和融合阴性肿瘤（敏感度=0.73，特异度=0.70），但这项研究并没有对具体的基因突变类型进行区分。在未来仍需要有大量样本作为支撑的更深层次研究。

5 小结与展望

尽管多数研究证实了影像组学在预测肺腺癌常见基因突变中的价值，但其作为一种新兴技术，仍处在初步探索阶段，具有一定的局限性。首先，在临床实施之前要满足可重复性，这也是临床使用的基本要求。目前影像组学的可重复性得不到认可。产生不可重复性的原因有很多，包括异构影像采集、兴趣区（即肿瘤实质或瘤周区域）分割以及统计方法的使用不当。另外，影像组学还需要大量、多样化、多中心和高质量的数据来概括影像组学研究的结果和结论，因此样本量是当前研究中的一个关键缺陷，大多数研究涵盖的病人数量有限。再者，目前关于影像组学的研究大多为回顾性研究，未来需要大规模前瞻性临床研究来进一步证实影像组学的价值。相信随着影像组学的不断发展和进步，精准预测肺腺癌基因突变并应用于临床实践将成为可能，从而为实现精准医疗做出巨大贡献。