基于神经网络模型预测宫颈癌淋巴结转移

2021-03-04 09:27凌人男杨若峰易芹芹饶梓彬杨熠金洪涛程立新
磁共振成像 2021年10期
关键词:淋巴结宫颈癌准确率

凌人男 ,杨若峰,易芹芹,饶梓彬 ,杨熠,金洪涛 ,程立新

宫颈癌是妇科第二位恶性肿瘤,是女性癌症相关死亡的一个重要原因[1],最近的一份报告预测2021年新发宫颈癌患者14 480例,其中4290人将死亡[2]。淋巴结转移(lymph node metastasis,LNM)是影响宫颈癌复发或死亡的最重要的独立不良预后因素,FIGO 2018 (International Federation of Gynecology and Obstetrics,FIGO)分期系统首次将淋巴结纳入分期,盆腔淋巴结转移和主动脉旁淋巴结转移分期分别为ⅢC1和ⅢC2,并需要同步放化疗[3]。腹腔镜淋巴结切除术是诊断LNM的金标准[3],但由于其侵入性、操作费用高及并发症风险而不能作为常规方法。前哨淋巴结活检的安全性和有效性仍有争议[4]。MRI对淋巴结评估主要依据淋巴结的大小(短轴>1 cm)和形态,即使应用功能技术亦难以鉴别炎性或结核性淋巴结与转移性淋巴结。PET-CT(positron emission tomography-computed tomography,PET-CT)对LNM的诊断优于MRI,但当淋巴结较小时,其诊断准确性降低。目前基于磁共振图像的机器学习研究仍不足够满足临床需求[5-9],本研究旨在通过多参数磁共振的放射组学模型,利用神经网络模型预测宫颈癌LNM,并评价不同模型的预测效能。

1 材料与方法

1.1 研究对象

本文为回顾性研究,收集深圳市人民医院2018年11月至2020年9月经病理证实的宫颈癌病例。本研究经深圳市人民医院伦理委员会批准(批准文号:LL-KY-2019519),免除受试者知情同意。

纳入标准:①行子宫全切+盆腔淋巴结清扫手术;②术前2周内进行3.0 T磁共振成像检查;③宫颈肿瘤最大径大于1 cm。排除标准:①MRI检查前行放化疗和/或免疫抑制治疗;②曾行LEEP手术;③临床及病理特征不完整;④同期患有其他恶性肿瘤;⑤MRI序列不完整,图像质量有缺陷;⑥失访。

患者入组:共纳入178例宫颈癌,经病理组织学或PET-CT证实盆腔LNM 68例。两位放射科医师同时对70例患者进行了肿瘤分割,进行观察者间一致性评估,余下108例由一位放射科医师单独分割,并对其中18例进行了2次分割评价可重复性。共纳入研究样本248个,按2∶1比例随机分为训练集和测试集。训练集:165个样本,发病年龄28~84(53.21±11.31)岁,LNM组41个样本,非LNM组124个样本;测试集:83个样本,发病年龄28~75(50.36±11.47)岁,LNM组27个样本,非LNM组56个样本。

1.2 检查方法

所有病例均行腹部和盆腔平扫加增强扫描。扫描仪为Siemens Magnetom Skyra 3.0 T。检查前患者禁食约6~8 h,适度充盈膀胱。研究序列包括:(1)快速自旋回波序列T2WI矢状位,扫描参数TR:4000 ms,TE:109 ms,翻转角:176°,矩阵:448×448,层厚:3 mm,层间距:0.6 mm,FOV:230 mm×230 mm;(2)扩散加权成像序列轴位,扫描参数B值分别为0、500和1000 s/mm2,TR:3000 ms,TE:84 ms,翻转角:180°,矩阵:118×118,层厚:4 mm,层间距:0.8 mm,FOV:220 mm×220 mm;(3)三维容积内插增强T1WI矢状位,扫描参数TR:5.8 ms,TE:2.7 ms,翻转角:180°,矩阵:448×448,层厚:3 mm,层间距:0.6 mm,FOV:320 mm×260 mm;(4)三维容积内插增强T1WI轴位,扫描参数TR:5.8 ms,TE:2.7 ms,翻转角:180°,矩阵:320×320,层厚:4 mm,层间距:0.8 mm,FOV:220 mm×220 mm。

1.3 临床及病理特征

7个临床特征包括年龄、妊娠次数、分娩次数、流产次数、首次性交年龄、月经状态、癌症家族史。2个病理特征包括病理分型、病理分化程度。临床分期依据FIGO 2018分期系统。

1.4 图像处理及特征提取、数据集划分

两位放射科医生(观察者1和2,分别有10年和20年影像诊断经验)利用3D-slicer软件对4个MRI序列宫颈原发肿瘤进行逐层勾画分割,分割前浏览每个序列并进行比对。每个序列感兴趣区(the volume of interest,VOI)提取107个放射组学特征,分为7组:①一阶统计量特征(first-order statistics features,n=18),②基于形状的特征(shape-based features,n=14),③灰度共生矩阵的特征(gray level co-occurrence matrix,GLCM,n=24),④灰度游程长度矩阵特征(gray level run length matrix features,GLRLM,n=16),⑤灰度大小区域矩阵特征(gray level size zone matrix features,GLSZM,n=16),⑥相邻灰度差分矩阵特征(neighboring gray tone difference matrix features,NGTDM,n=5),⑦灰度相关矩阵特征(gray level dependence matrix,GLDM,n=14)。因此,每个肿瘤共获得428个放射组学特征,将其融合为428维初始特征向量。

1.5 特征分析及建立模型

1.5.1 临床及病理特征筛选、模型建立

通过方差分析在9个临床及病理特征(即:年龄、妊娠次数、分娩次数、流产次数、首次性交年龄、月经状态、癌症家族史、病理分型、病理分化)中筛选出方差大的3个特征进入模型,分别组成428维模型(即:428维初始特征向量)、437维模型(即:428维初始特征向量+9个临床及病理特征)和431维模型(即:428维初始特征向量+3个临床及病理特征)。

1.5.2 神经网络结构建立

Python库的torch和sklearn建立三层神经网络模型。由一个输入层、一个输出层和一个隐藏层组成,详见图1。输入层中的神经元数(维数)分别为428、437、431。隐藏层神经元大小为300,该模型输出一个二维向量,为了防止过度拟合,我们还在输入层和隐藏层之间执行了一个随机dropout操作。训练集中全部样本的学习率和训练次数(epoch,轮数)分别为2.05×10-4和200。

图1 神经网络模型。LNM:淋巴结转移;non-LNM:非淋巴结转移Fig.1 Structure of the neural network model.LNM:Lymph node metastasis.non-LNM:non-lymph node metastasis.

为了比较评估模型的性能,我们分别采用神经网络(neural network,NN)、支持向量机算法(support vector machine,SVM)进行建模。

1.6 统计学分析

本研究的统计分析使用IBM SPSS 25.0软件。采用Mann-WhitneyU检验评估年龄、妊娠次数、分娩次数、流产、首次性交年龄、月经状态、癌症家族史之间的差异。采用Chi-square检验分析病理类型、分化程度及FIGO分期之间的差异。P<0.05表示差异有统计学意义。组内相关系数(intraclass correlation coefficient,ICC)来评估观察者(观察者1和观察者2)的信度和观察者两次测量值的重复性,ICC>0.75时,认为两者具有较好的一致性。使用分类准确率、敏感度、特异度和受试者特征曲线下面积(area under the receiver operating characteristics curve,AUC)用来衡量检测模型性能。使用sklearn中的metrics.roc_curve函数绘制ROC曲线,通过最大约登指数确定最佳界值评估诊断效能。

2 结果

临床特征基线如表1所示,LNM组和非LNM组临床及病理特征差异没有统计学意义(P>0.05)。两位观察者ICC为0.819,观察者内ICC为0.796,一致性较好。

表1 训练集和测试集患者临床及病理特征(n=248)Tab.1 Characteristics of patients in the training set and test set(n=248)

通过方差分析,从9个临床及病理特征(即:年龄、妊娠次数、分娩次数、流产次数、首次性交年龄、月经状态、癌症家族史、病理分型、病理分化)中筛选出3个特征,即月经状态、癌症家族史、病理类型(F=0.2490,0.1080和0.0999)进入模型,分别组成428维模型、437维模型和431维模型。

428维NN模型和428维SVM模型的分类准确率、AUC分别为0.747、0.834和0.710、0.783;437维NN模型和437维SVM模型的分类准确率、AUC分别为0.831、0.871和0.735、0.788;431维NN模型和431维SVM模型的分类准确率、AUC分别为0.810、0.882和0.723、0.779,详见图2。

图2 测试集中428维、437维、431维神经网络模型和支持向量机模型的ROC曲线。NN:神经网络;SVM:支持向量机Fig.2 The ROC curves of NN and SVM models including features of 428-dimension,437-dimension,and 431-dimension,respectively,in the test set.NN:neural network.SVM:support vector machine.

NN模型训练集和测试集的敏感度和特异度见表2和表3。在测试集中,428维NN模型的AUC为0.834(95%CI:0.748~0.919),437维 NN模型的 AUC为0.871(95%CI:0.793~0.949),431维 NN 模型的AUC为 0.882(95%CI:0.810~0.954)。结果显示,431维NN模型的敏感度和特异度分别为0.840和0.741,性能最好。

表2 训练集中不同维度神经网络模型ROC曲线分析结果Tab.2 The result of ROC curve analysis in neural network with different dimension in training set

表3 测试集中不同维度神经网络模型ROC曲线分析结果Tab.3 The result of ROC curve analysis in neural network with different dimension in test set

3 讨论

3.1 研究背景和目的

早期宫颈癌仅15%~20%患者伴有LNM[10],术前通过磁共振成像对盆腔及腹膜后的LNM进行准确定性是具有挑战性的,这就使得部分炎性或小淋巴结但并不是转移性淋巴结的患者也经历了淋巴结清扫手术。本研究以多模态MRI包括矢状位T2WI、轴位扩散加权、增强矢状位和轴位T1WI四个序列为基础,分析了放射组学特征和神经网络模型对于区分LNM的效能。

3.2 多特征建模

支持向量机是一种基于结构风险最小化准则的传统学习方法,具有较好的鲁棒性,逼近能力和泛化能力较强,广泛应用在影像组学机器学习中[6,9,11-13],然而由于传统的机器学习方法和有限的变量而难以取得临床实用价值。

神经网络基于经验风险最小化为优化目标,更多应用于复杂的特征分析中,直接由原始数据建立层级结构[14],可以合并更多不同类型的变量,更适用于大样本,模型训练过程中可以自动调节权重,其算法优于支持向量机。目前神经网络模型已经在疾病诊断[15-17]、疗效评估和预后预测[18-19]等方面有所应用,获得了一定经验。有研究已成功应用到临床,缩短检验时间到3分钟[20]。然而,相关的研究仍不足够,且如何构建最优的放射组学神经网络模型尚不清楚,尤其宫颈癌LNM的预测,故本研究构建了一个诊断效能较好的神经网络模型,以期探索更优的建模方式并对临床决策有所帮助。

3.3 结果比较及分析

本研究对比了神经网络模型和支持向量机模型,在428维、437维、431维模型中,神经网络模型的效能均高于支持向量机模型,预测LNM效能更高。437维神经网络模型的分类准确率、敏感度、特异度均高于428维神经网络模型。431维神经网络模型分类准确率、敏感度、特异度略逊于437维神经网络模型,但亦高于428维神经网络模型,且其AUC较437维神经网络模型有所提高,相对于437维中的9个临床及病理特征,431维神经网络模型的3个临床及病理特征更易获得,使得模型更稳定、易被推广,故本研究认为431神经网络模型为最佳模型。

之前有学者[6]建立基于磁共振多参数成像,包括矢状位T2WI、轴位T1WI和动态增强T1WI等的序列,并采集7个临床及病理特征(年龄、妊娠次数、分娩次数、流产次数、首次性交年龄、月经状态、癌症家族史),建立支持向量机模型预测宫颈癌转移。本研究建立的431维神经网络模型在敏感度、特异度、分类准确率均较Kan等[6]的研究结果(分别为0.714、0.379、0.488)有明显提高。Dong[15]等构建了一个4层神经网络模型预测宫颈癌LNM(每层10个神经元,训练集AUC和准确率为0.99和0.97),本研究采用3层神经网络并随机执行了dropout操作更进一步避免过拟合。

本研究结果较好,原因之一为本研究中的两位观察者具有丰富的影像诊断经验,对肿瘤的分割一致性较高。而且本研究将病理分型及分级纳入模型,并且将临床及病理特征进行了筛选,筛选出的3个临床特征即月经状态、癌症家族史、病理类型较9个临床特征较易获得且准确,进而使得模型分类准确率、敏感度、特异度明显提高。动态增强扫描采用不同的模型其诊断效能不尽相同[21-22],目前缺乏统一的标准,故本研究采用常规增强进行建模,进入模型的四个磁共振序列重复性强且稳定,且在模型过程中增加了防止过拟合操作。因此本研究构建的神经网络模型分类准确率较高,更易推广,如图3。

图3 放射组学模型示例,47岁女,宫颈鳞癌,分化程度中等,FIGO 2018Ⅱb。A~C:轴位T2WI显示右侧闭孔淋巴结,最大径为8 mm,ADC值为1.081×10-3mm2/s,增强T1WI呈不均质强化;D:矢状位T2WI显示宫颈肿瘤大小为26 mm×32 mm×43 mm;E:手工分割ROI;F:提取3D-VOL 431维神经网络模型预测为淋巴结转移(-),与病理相符Fig.3 Radiomics model used in this study.A 47-year-old woman with cervical squamous cell carcinoma,moderately differentiated,FIGO 2018 Ⅱ b.A-C:The right obturator node was round and the size of 8 mm.The ADC value was 1.081×10-3mm2/s,and heterogeneous on contrast enhanced T1WI.D-E:The segmentation of three-dimensional volume of interest(3D-VOI)was based on sagittal T2WI.The size of cervical cancer tumor was 26 mm×32 mm×43 mm.F:The neural network model predicted lymph node was non-metastatic consistent with pathological results.

3.4 存在的不足

本研究为单中心、回顾性研究,样本不可避免地存在选择性偏倚,今后将尝试多中心研究扩大样本量降低偏倚。

综上,基于多参数磁共振成像的宫颈癌神经网络模型,可以有效地预测宫颈癌LNM,有助于肿瘤分期和治疗决策。以往经验认为支持向量机模型在预测方面具有优越性,而本研究结果表明神经网络模型在分类准确率和AUC方面都有一定的提高,因此该模型具有较高的临床应用推广价值。

作者利益冲突声明:全体作者均声明无利益冲突。

猜你喜欢
淋巴结宫颈癌准确率
硫利达嗪抗宫颈癌的潜在作用机制
中老年女性的宫颈癌预防
喉前淋巴结与甲状腺乳头状癌颈部淋巴结转移的相关性研究
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
淋巴结肿大不一定是癌
如何选择不同效价的宫颈癌疫苗?
按摩淋巴结真的能排毒?