基于CA125的机器学习在CT预测浆液性卵巢癌腹腔复发中的应用

2021-05-21 06:26刘春艳郑佳连
国际医药卫生导报 2021年8期
关键词:变化率卵巢癌机器

刘春艳 郑佳连

1辽宁中医药大学附属医院医学影像中心,沈阳 110032;2辽宁中医药大学附属医院感染科,沈阳 110032

卵巢癌是女性三大恶性肿瘤之一,占女性所有恶性肿瘤的2.5%,但因生存率低而占女性癌症死亡的5%,全世界卵巢癌年龄标准化发病率为3.0/10 万~11.4/10 万,近十年间,亚洲发病率呈增长趋势,其是一组具有极大病因、组织病理学和临床特征异质性的恶性肿瘤,90%的卵巢癌是上皮来源的,其中最常见的是浆液性肿瘤[1-2]。我国是卵巢癌发病率最高的国家之一,卵巢癌也是我国妇科肿瘤死亡的首要原因,这是因为大多数卵巢癌在确诊时已是晚期[3]。目前肿瘤减灭术是提高晚期患者生存期的首选治疗方法[4]。在术后随访中,糖类抗原(carbohydrate antigen,CA)125是最常用的生物标志物,尽管其仅在约8 成的卵巢癌患者中升高,且会受到其他疾病如子宫内膜异位症、肝硬化或腹膜炎的影响,但它仍然是卵巢癌目前应用最广泛的生物标记物[5-6]。尽管现在PET-CT 在卵巢癌患者腹腔复发的检测上更为准确,但CT 仍然是目前对卵巢癌患者进行随访最常用的影像学检查[7]。然而,近年来的研究发现 CA125 和 CT 的诊断效能有极大的不稳定性,尚存在很大提升空间[8-9]。因此,有必要改进成像策略,使其更为简便并且提高诊断效能,同时避免过度医疗和由此产生的额外成本和射线暴露。我们将这项研究集中在腹部疾病上。本研究的目的是利用机器学习,在监测晚期卵巢癌患者CA125 水平的基础上,通过CT预测腹部复发。

1 资料与方法

1.1 临床资料 本研究为回顾性队列研究,回顾分析本院 2018 年 1 月至 2020 年 1 月接受 CT 检查的卵巢癌患者。纳入标准:年龄18 岁以上;诊断为Ⅲ期和Ⅳ期高级别浆液性卵巢癌;初治接受肿瘤减灭术治疗;术后接受NCCN 指南建议的规范化随访:在初始治疗之后最初2 年每2~4 个月随访1 次,接下来的3 年中每6 个月随访1 次,随访包括CT检查和对应的CA125水平。排除妊娠、有子宫内膜异位症、肝硬化或腹膜炎等影响CA125的情况、严重脏器功能损害、临床资料不全者。

1.2 研究方法

1.2.1 CT 评估患者腹腔复发 由两位高年资医师阅读患者CT 影像评估是否腹腔复发,其中一位为影像科副主任医师,另一位为本科专科主治医师,两人分别对每位患者每一次随访CT 影像进行评估,两人结论相同则采纳结果,如出现分歧则由本科进行病例讨论得到最终判读结果,直至出现复发为终点。

1.2.2 CA125 采用CA125 ELISA 检测试剂盒(上海翊圣生物科技有限公司CA125T)以酶联免疫吸附法检测患者血清CA125水平,计算以下4个测量指标:①与CT检查同步的实际CA125水平(绝对值),②当前CT 检查时CA125水平与前一次检查时CA125 的差值(绝对变化量),③当前与前一次检查时CA125 差值和前一次检查时CA125 的比值(相对变化量),④当前与前一次检查时CA125 差值的随访间隔内变化率(相对变化率)。

1.3 统计方法 应用SPSS 26.0 及R3.4.1 软件进行统计学处理,其中计数资料以百分率(%)表示,计量资料均呈正态分布,使用均数±标准差()表示,使用e1071软件包构建机器学习支持向量机来预测主要结果。对CA125绝对值、绝对变化量、相对变化量、相对变化率分别使用多项式模型、线性模型和径向基核建模,总共建立12 个支持向量机模型。采用了基于精度的10×交叉验证选择最佳的拟合模型。通过机器学习使用Wilcoxon 检验比较CT 诊断的复发和无复发病例最佳的CA125阈值。采用对数秩检验和二元变量的Kaplan-Meier 曲线构建单因素Cox 回归进行单变量分析。采用Cox 比例风险模型进行多变量分析。P<0.05为差异有统计学意义。

2 结 果

2.1 患者基线资料 共纳入78 例患者,年龄(65.3±3.8)岁,原发肿瘤(5.5±2.7)cm,Ⅲ期患者54 例,Ⅳ期患者24例,完全肿瘤减灭术者66例,次全者12例,手术至首次随访间隔(3.2±1.1)个月,其中50 例出现腹腔复发,无腹腔复发生存期(21.2±4.5)个月。

2.2 机器学习评估4种不同CA125算法的准确性 对CA125 绝对值、绝对变化量、相对变化量、相对变化率分别使用多项式模型、线性模型和径向基核建模,总共建立12 个支持向量机模型。为了选择最佳的拟合模型,我们采用了基于精度的10×交叉验证,最佳拟合模型为线性模型,其CA125 绝对值、绝对变化量、相对变化量、相对变化率分别为0.54、0.55、0.57、0.61;多项式模型CA125 绝对值、绝对变化量、相对变化量、相对变化率分别为0.53、0.51、0.55、0.59;径向基核模型CA125 绝对值、绝对变化量、相对变化量、相对变化率分别为0.49、0.44、0.51、0.53。CA125相对变化率准确度最高,见表1。

表1 机器学习评估4种不同CA125算法的准确性

2.3 患者腹腔复发的相关因素的单因素回归分析单因素回归显示年龄、原发肿瘤大小、肿瘤减灭术程度、CA125 相对变化率均与患者腹腔复发相关,且OR由高至低依次为CA125 相对变化率、肿瘤减灭术程度、原发肿瘤大小、年龄,差异均有统计学意义(均P<0.01),见表2。

表2 78例浆液性卵巢癌患者腹腔复发的相关因素的单因素回归分析

2.4 患者腹腔复发的相关因素的多因素回归分析多因素回归显示年龄、原发肿瘤大小、肿瘤减灭术程度、CA125 相对变化率均与患者腹腔复发相关,且OR由高至低依次为CA125 相对变化率、肿瘤减灭术程度、原发肿瘤大小、年龄,差异均有统计学意义(均P<0.05),见表3。

表3 78例浆液性卵巢癌患者腹腔复发的相关因素的多因素回归分析

3 讨 论

CA125 和盆腔CT 是卵巢癌患者肿瘤减灭术后的常规复查手段[10]。CA125 在 CT 显示腹腔复发之前就可升高,然而,研究表明,CA125 水平在检测肿瘤复发时并不准确[11-12]。之前的研究根据CA125 水平确定了肿瘤复发或进展的定义,但CA125水平的变化与CT 对肿瘤的监测之间的关系并未得到充分的研究,在治疗决策中单独使用CA125 并没有改善患者的预后[13]。我们发现患者在接受CT 监测的过程中,CA125 的变化与肿瘤复发的检出密切相关。这些线索可能有助于临床医师确定进行CT 检查的最佳间隔时间。

机器学习是人工智能的核心过程之一,许多不同的统计、概率和数学算法可以作为学习方法来实现,如logistic回归、人工神经网络、森林决策树和朴素贝叶斯等等[14]。最大似然学习主要有两种类型:有监督学习和无监督学习。有监督学习通过从已知类别学习来构建模型。相比之下,无监督学习方法从未知别中学习共同特征[15]。机器学习算法已经被用于关键特征的训练和识别以及群体分类,其优点是能够从大批量的、有混杂的或复杂的数据集中检测出难以识别的模式。这种能力特别适合复杂的数据比如肿瘤研究,肿瘤是一种基因疾病,其基因组特征模式或特征功能模式代表不同癌症亚型、预后、肿瘤发生驱动因素或肿瘤特异性生物学过程[16-17]。因此,机器学习可以帮助我们在各种应用中识别这些模式。机器学习也被应用于肿瘤的预后和术后随访,特别是基于影像学的肿瘤随访过程非常适合使用机器学习来识别既定的参数[18-19]。有研究阐述了机器学习在头颈部肿瘤放射治疗的各个步骤中的应用,然后对头颈部肿瘤的放射学和机器学习预后预测模型进行了系统的回顾,报道称机器学习在头颈部肿瘤治疗计划中有着很好的应用前景,其可以提高高危靶器官的描记能力,并适应放疗工作流程的自动化,放射组学与机器学习预测模型相结合可以获得大量肿瘤预后数据,包括其生存率、远处转移的风险、局部复发和淋巴结转移等[20]。William 等[21]报道了在CHAMP 数字图像软件上使用机器学习算法阅读宫颈细胞涂片来诊断宫颈癌的准确率接近93.78%,其中K 近邻算法和支持向量机算法是区分肿瘤与正常组织的较佳分类算法,分类准确率分别在99.27%和98.5%以上。而且现有的大多数算法都适用于单个或多个宫颈涂片图像,通过改变待提取特征等参数,提高混杂去除率,采用多层次分类器等混合分割和分类技术,可以提高分类精度;将K 近邻算法与支持向量机等算法相结合可以进一步提高诊断效能。

我们的研究共纳入78 例患者,年龄(65.3±3.8)岁,可见卵巢癌主要发生在老年女性,原发肿瘤大小为(5.5±2.7)cm,Ⅲ期患者54 例,Ⅳ期患者24 例,完全肿瘤减灭术者66 例,次全者12 例,可见大部分患者手术效果良好,手术至首次随访间隔(3.2±1.1)个月,其中50 例出现腹腔复发,无腹腔复发生存期(21.2±4.5)个月。对CA125 预测患者腹腔复发使用机器学习算法,发现最佳拟合模型为线性模型,其CA125 绝对值、绝对变化量、相对变化量、相对变化率分别为0.54、0.55、0.57、0.61;多项式模型CA125 绝对值、绝对变化量、相对变化量、相对变化率分别为0.53、0.51、0.55、0.59;径向基核模型CA125 绝对值、绝对变化量、相对变化量、相对变化率分别为0.49、0.44、0.51、0.53。在机器学习模型中,CA125 的相对变化率最能预测腹部复发并且其与腹腔复发相关,因此,CA125 的相对变化率可能有助于优化卵巢癌患者盆腔CT监测策略。接下来,我们构建了单因素COX回归模型,结果显示年龄、原发肿瘤大小、肿瘤减灭术程度、CA125 相对变化率均与患者腹腔复发相关,且OR由高至低依次为CA125 相对变化率、肿瘤减灭术程度、原发肿瘤大小、年龄,差异均有统计学意义(均P<0.01)。在单因素模型基础上进一步构建多因素回归模型显示年龄(OR=1.48,95%CI:1.35~1.88)、原发肿瘤大小(OR=1.58,95%CI:1.46~1.79)、肿瘤减灭术程度(OR=1.61,95%CI:1.53~1.82)、CA125 相对变化率(OR=1.75,95%CI:1.59~1.90)均与患者腹腔复发相关,差异均有统计学意义(均P<0.05)。基于CA125 的机器学习能较好预测CT 监测的浆液性卵巢癌腹腔复发,相关因素危险程度由高及低为CA125 相对变化率、肿瘤减灭术程度、原发肿瘤大小、年龄。

利益冲突:作者已申明文章无相关利益冲突。

猜你喜欢
变化率卵巢癌机器
机器狗
机器狗
miR-181a在卵巢癌细胞中对顺铂的耐药作用
基于电流变化率的交流滤波器失谐元件在线辨识方法
例谈中考题中的变化率问题
未来机器城
Wnt3 a和TCF4在人卵巢癌中的表达及临床意义
利用基波相量变化率的快速选相方法
川滇地区地壳应变能密度变化率与强震复发间隔的数值模拟
microRNA与卵巢癌转移的研究进展