基于增强CT影像组学模型鉴别肾透明细胞癌与非透明细胞癌

2019-11-21 07:21殷小平任嘉梁郭建党赵珍珍赵莹佳
中国医学影像技术 2019年11期
关键词:勾画组学亚型

王 平,裴 旭,殷小平,任嘉梁,郭建党,赵珍珍,赵莹佳

[1.河北大学附属医院CT-MRI室,河北 保定 071000;2.河北大学(医学院),河北 保定 071000;3.河北省肿瘤放化疗机制与研究重点实验室,河北 保定 071000;4.通用电气药业(上海)有限公司,上海 210000]

肾细胞癌(renal cell carcinoma, RCC)占成人恶性肿瘤的2%~3%,致死率较高[1],其病理分型包括肾透明细胞癌(clear cell RCC, ccRCC)和非透明细胞癌(non-clear cell RCC, non-ccRCC),后者又分为嫌色细胞癌(chromophobe renal cell carcinoma, chRCC)、乳头状细胞癌(papillary renal cell carcinoma, pRCC)、集合管癌(collecting duct carcinoma, CDC)及未分类癌。RCC的亚型[2-3]及病理分期[4]均会影响临床治疗及预后。肾穿刺活检是诊断RCC亚型的金标准,但穿刺可能导致癌细胞转移、肿瘤出血等并发症,且存在抽样误差,故对于RCC活检一直存在争议[5-6]。尽管影像学上ccRCC与non-ccRCC表现出不同的强化方式,但临床误判率仍较高[7]。联合应用不同影像学检查可提高诊断RCC亚型的正确率,但增加患者经济负担,且耗时长。影像组学是从医学图像中高通量提取定量特征(纹理特征、形状特征、强度特征及高阶特征等信息),转化为可采集的组学数据,并对这些数据进行分析,从而达到判断病变性质的目的[8]。本研究探讨基于增强CT的影像组学模型鉴别ccRCC与non-ccRCC的价值。

1 资料与方法

1.1 一般资料 回顾性分析2017年1月—2019年9月河北大学附属医院收治的179例RCC患者的影像学资料,男93例,女86例,年龄27~88岁,平均(58.4±10.6)岁;肿瘤最大径2~11 cm,平均(6.48±3.46)cm;术后病理诊断ccRCC 147例,non-ccRCC 32例(pRCC 20例、chRCC 9例、CDC 3例)。纳入标准:①病理检查明确诊断RCC及其分型;②术前3周接受增强CT皮质期扫描。排除标准:①病灶内存在直径超过4~5 cm的坏死、囊变;②肿瘤已发生转移;③图像质量不佳。将患者随机分为训练集和测试集。训练集125例,男64例,女61例,年龄27~87岁,平均(58.4±9.9)岁,64例≤60岁;non-ccRCC 22例(pRCC 15例、chRCC 6例、CDC 1例),ccRCC 103例。测试集54例,男29例,女25例,年龄30~88岁,平均(59.7±9.1)岁;其中non-ccRCC 10例(pRCC 5例、chRCC 3例、CDC 2例),ccRCC 44例。

1.2 仪器与方法 采用GE Discovery HD750 64排CT扫描仪。嘱患者禁食6~8 h后,行肾脏平扫及增强扫描。扫描参数:层厚5 mm,螺距0.984:1,扫描视野36 cm×43 cm,矩阵512×512,管电压100~120 kV,管电流134~409 mA,窗宽250~450 HU,窗位30~50 HU。对比剂为非离子型碘佛醇,经肘静脉注射,流率3.0~3.5 ml/s,剂量1.0~1.2 ml/kg体质量。皮质期、髓质期、排泄期扫描时间分别为注射对比剂后30~35 s、50~60 s和180 s。

1.3 图像分割、特征提取与建模 将CT增强图像(皮质期)导入ITK-SNAP(www.itk-snap.org)软件,由2名具有8~10年工作经验的影像学医师分别独立勾画ROI(图1~3)。ROI勾画原则:①选取PACS系统上DICOM格式的图像;②距病灶皮质期边缘内侧0~1 mm;③逐层勾画,获得病灶的ROI容积(volume of interest, VOI);④包含小范围坏死囊变及强化血管;⑤避开肾静脉内的瘤栓;⑥对于non-ccRCC皮质期,参考髓质期图像勾画ROI。

将所有原始图像文件及勾画好的ROI文件导入A.K软件(GE Artificial Intelligence Kit)进行特征提取,包括直方图特征、形态学特征及二阶纹理特征(灰度共生矩阵、游程矩阵等),共生成396个特征;釆用单因素方差分析及秩和检验、一般线性模型和前10%互信息(mutual information, MI)3种方法依次进行特征降维,最终选取16个具有统计学意义的特征,即LargeAreaEmphasis、 OneVoxelVolume HaralickCorrelation_angle0_offset7、ClusterProminence_angle135_offset7、ShortRunEmphasis_angle0_offset4、LowGreyLevelRunEmphasis_AllDirection_offset1_SD、HaralickCorrelation_angle135_offset4、LeastAxisLength、LowIntensityLargeAreaEmphasis、最大像素值(MaxIntensity)、直方图熵(histogramEntropy)、方差(variance)、直方图能量(histogramEnergy)、平均像素值(MeanValue)、直方图标准差(stdDeviation)和hara熵(haraEntroy)。分别建立线性逻辑回归(logistic regression, LR)模型及非线性随机森林(random forest,RF)模型,保留AUC最大且特异度较高的模型,釆用测试数据进行模型评估。

表1 训练集、测试集中RF、LR模型诊断ccRCC的效能

图1 患者男,59岁,pRCC 皮质期CT增强图像(虚线为ROI) 图2 患者女,62岁,ccRCC 皮质期CT增强图像(虚线为ROI) 图3 患者男,71岁,chRCC 皮质期CT增强图像(虚线为ROI)

图4 RF、LR模型诊断ccRCC的ROC曲线 A. RF模型的训练集和测试集ROC曲线; B. LR模型的训练集和测试集ROC曲线。

1.4 统计学分析 釆用SPSS 24.0统计分析软件,以独立样本t检验比较训练集和测试集患者年龄,χ2检验比较性别和ccRCC在的训练集和测试集之间的分布。采用ROC曲线评价LR、RF模型鉴别ccRCC与non-ccRCC的效能。P<0.05为差异有统计学意义。

2 结果

训练集和测试集患者年龄(t=2.13,P=0.05)、性别(χ2=0.41,P=0.05)、ccRCC在的训练集和测试集之间的分布(χ2=0.02,P=0.90)差异均无统计学意义。

ROC曲线结果显示,训练集RF模型诊断ccRCC的AUC为0.96(P<0.05),特异度为1.00,敏感度0.83;LR模型诊断ccRCC的AUC为0.96(P<0.05),特异度为1.00,敏感度为0.83。测试集RF模型诊断ccRCC的AUC为0.96(P<0.05),特异度为1.00,敏感度为0.89;LR诊断ccRCC的AUC为0.88(P<0.05),特异度为0.90,敏感度为0.77。见表1、图4。

将RF预测模型带入原始数据中进行预测,结果显示训练集中ccRCC真阳性85例,non-ccRCC真阴性22例,测试集中ccRCC真阳性39例,non-ccRCC真阴性10例。将LR预测模型带入原始数据中进行预测,训练集中ccRCC真阳性85例,non-ccRCC真阴性22例;测试集中ccRCC真阳性34例,non-ccRCC真阴性9例。

3 讨论

RCC是肾脏最常见的恶性肿瘤,约20% RCC患者就诊时已发生转移,早期诊断RCC对于指导临床治疗意义重大[2-3]。尽管多期增强CT可用于鉴别RCC亚型[3],但在临床工作中仍有很高的误诊率。目前采用影像组学特征鉴别RCC亚型的研究[9]较少,且缺乏研究RCC亚型之间潜在的分子基础。既往有研究[3,5-6]评估增强CT模式、2D纹理和其他定量参数对RCC亚型的诊断效能,发现其各有不足[10]。放射组学具有可重复性,已逐渐应用于临床。本研究提取RCC皮质期CT增强图像特征建立模型,可更直观地反映肿瘤的整体特征[10],即使选择一期进行分析,模型对鉴别ccRCC与non-ccRCC的敏感度和特异度仍较高,为传统CT增强所不及;尽管本组non-ccRCC病例数较少,但两种模型的特异度均较高,提示模型未过拟合,泛化能力较好。

Zhu等[11]认为低强化是高级别ccRCC的特征。本研究于肾脏肿瘤CT增强皮质期勾画ROI,利用A.K软件提取其影像特征(灰度分布、小波特征及纹理特征等),以反映肿瘤内部的异质性[12]。异质性是恶性肿瘤的重要特征,与其恶性生物学行为关联密切[13],能够反映相关生长因子变化及肿瘤生长微环境的变化,而这些变化可导致肿瘤局部区域发生细胞增殖或凋亡、内部代谢活跃或抑制、肿瘤血管增加或减少等[14];肿瘤血管生成的异质性可能导致局部有效血流灌注减少,引起该区域缺氧,导致间质静水压增高等独特的肿瘤微环境变化,最终增加肿瘤侵袭和转移的风险[15-16]。

由于本组non-ccRCC例数较少,可能存在建模偏差,故分别采用线性的LR模型和非线性的RF模型进行建模并对比;ROC曲线结果显示,测试集RF模型诊断ccRCC的AUC达0.96,LR模型为0.88。LR模型的诊断效能不及RF模型,原因可能在于RCC亚型与特征之间呈非线性关系,而LR模型为线性模型,故诊断效能相对差;RF为非线性,可更加稳定地预测非线性数据。此外,RF模型可处理高维度数据,且毋须进行特征选择(特征子集随机),训练速度快,易采用并行化方法。Li等[17]联合von Hippel-Lindau(VHL)基因分别建立影像组学模型Boruta、mRMRe,结果显示测试集在两种模型中鉴别诊断ccRCC与non-ccRCC的AUC分别为0.969、0.900,与本研究的RF模型(AUC=0.96)相当但高于该组LR模型(AUC=0.88)。

本研究的局限性:样本量较小,且non-ccRCC样本量更少;临床资料中无家族病史,未做组合模型;non-ccRCC样本仅纳入pRCC、chRCC、CDC病例,未涉及其他病理类型non-ccRCC;勾画ROI时,受部分肿块边缘不清晰或部分容积效应的影响,导致准确率降低,且病灶坏死囊变会在一定程度上影响影像组学分析结果。

总之,基于增强CT的影像组学模型可用于鉴别ccRCC与non-ccRCC,其中RF模型的诊断价值更高。

猜你喜欢
勾画组学亚型
影像组学在肾上腺肿瘤中的研究进展
放疗中CT管电流值对放疗胸部患者勾画靶区的影响
尖锐湿疣患者感染HPV亚型的研究及临床分析
东莨菪碱中毒大鼠的代谢组学
影像组学在核医学影像中的应用进展
蛋白质组学技术在胃癌研究中的应用
Acknowledgment to reviewers—November 2018 to September 2019
定量评价Atlas模板库病例数目对宫颈癌危及器官自动勾画的影响
H10亚型和N8亚型禽流感病毒三重RT-PCR检测方法的建立
找一找