基于UNet网络的乳腺癌肿瘤细胞图像分割

2022-06-29 06:08徐思则
电子设计工程 2022年12期
关键词:准确率卷积函数

徐思则,刘 威

(1.武汉大学物理科学与技术学院,湖北武汉 430072;2.武汉大学深圳研究院,广东深圳 518057)

据世界癌症统计组织2020 年发表的相关报告[1]显示,2020 年确诊患癌的病人数量高达1 930 万,而死于患癌的病人超过1 000 万。其中,乳腺癌依然是女性中最常见的癌症,在女性患癌种类中居于榜首(30%)。癌细胞的检测对癌症的前期诊疗具有重要临床价值[2-3],而细胞图像的自动化分析则是医疗辅助诊断的重要方法[4-5]。由于人工智能科技近年来取得了飞跃式的进步,目前已有许多团队使用深度学习方法对癌细胞进行分辨[6-8]。

该文以乳腺癌肿瘤细胞(MCF-7)为例,基于Python3.7 平台,利用数字图像处理技术,结合深度学习,将采集到的乳腺癌肿瘤细胞显微图像在UNet 深度网络中进行学习并得到用于肿瘤细胞图像分割的模型。该模型可大量节省工作人员在肿瘤细胞识别和分割中的时间。

1 深度学习介绍

1.1 卷积神经网络介绍

卷积神经网络(CNN)不同于机器学习早期的SVM 等算法,其独特的卷积操作发挥着至关重要的作用,不仅能够削减网络层数过多导致的大量内存,还大量降低了模型中权重和偏置的数量,从而达到减轻过拟合的目的。CNN 的设计理念最早由LeCun团队发表,其设计的LeNet-5[9]包含5 个隐藏层,分别为2 个卷积层、2 个池化层和1 个全连接层。而CNN蓬勃发展的转折点在2012 年,在该年的ImageNet 比赛中,AlexNet[10]凭借着超高的物体识别正确率赢得冠军。该模型取得巨大进步的原因,一是李飞飞团队制作的超大数据的、带标注的数据集ImageNet,二是计算机设备的保障,特别是GPU 的发展,给高强度的数学运算带来了有力的支撑[11-12],以及更为重要的算法的提升,包括网络深层优化、数据集增加、ReLU 激活函数和Dropout 等。AlexNet 之后,深度学习进入爆炸式发展阶段,目前部分模型的准确率已经高于人类识别的准确率。

单层的CNN 结构一般包括3 个部分,分别是卷积层、激活函数和池化层。

卷积层:卷积层的主要作用是卷积运算,其运算方式与数字图像中的滤波器运算类似。如图1 所示,n1个h1*w1的输入数据,经过n2个h2*w2的卷积核运算,得到n3个h3*w3的输出数据。

图1 图像卷积

式(1)中,xi代表第i层输入数据,yj代表第j层输出数据,wij和bj则分别代表该层的权值和偏移。

激活函数:在CNN 发展前期,激活函数经常使用Sigmoid 和tanh 等非线性函数,而近年来,ReLU 逐渐被更加广泛地应用。ReLU 可以把参数小于0 的神经元置为0,从而达到稀疏模型的目的。相较之下,Sigmoid 或tanh 激活函数不具备单侧抑制的功能,而ReLU 使得神经网络层中大约50%的神经节点处于休眠状态,具有更好的稀疏性。在训练梯度下降时ReLU 比传统的饱和非线性函数有更快的收敛速度,因此在训练整个网络时,训练速度也比传统的方法快很多。

池化层:最大池化(Max pooling)是最常用的池化方式。如图2 所示,最大池化可以把经过卷积操作后的特征数据均分为若干个区域,并逐个区域计算最大值。池化层会提取出最关键的空间信息,减少数据冗余,因此参数的数量和计算量也会下降,这在一定程度上也控制了过拟合。

图2 最大池化

1.2 Batch Normalization

Batch Normalization 在2015 年被提 出[13],其 思路是调整各层的激活值分布使其拥有适当的广度,简而言之,就是对数据进行整合,将其调整为N(0,1)的高斯分布。Batch Normalization 操作一般被插入到激活层之前,用来对数据分布进行正则化处理。总地来说,Batch Normalization 具有加快训练速度、降低对初始权重的依赖以及抑制过拟合的优点,因此Batch Normalization 是目前深度网络中经常用到的加速神经网络训练、加速收敛速度及提高稳定性的算法。

1.3 UNet网络模型

由于医学图像语义较为简单、结构较为固定、边界较为模糊以及数据量较少的特点,自2015 年以来,在生物医学影像语义分割领域,UNet被广泛应用[14-15]。

如图3[16]所示,UNet 网络结构包括两部分,第一部分为左侧特征提取部分,第二部分为右侧上采样部分。由于其网络结构类似字母U,所以被称作UNet 网络。在左侧特征提取部分,每经过一个池化层,便会产生一个新尺度的特征图,加上原图共有5种尺度。在右侧上采样部分,每经过一次上采样,便会产生一个和左侧部分尺度相对应的特征图,并和左侧特征图相拼接。最后输出两层,分别为前景和背景。

图3 UNet网络结构图

2 实验流程

实验流程图如图4 所示。

图4 实验流程图

2.1 细胞图像采集

由USB 接口和CMOS 传感器构成的拍摄设备具有高传输速率、兼容性好等特点[17]。该实验的图像采集系统由CMOS 工业相机和三目螺纹接口显微镜摄像头(40X)组成,通过USB2.0 与计算机建立通信,用其采集混有人体红细胞的MCF-7 肿瘤细胞显微图像,共200 张,图像如图5 所示。

图5 MCF-7肿瘤细胞图像

2.2 图像处理与标注

通过几何变换、颜色空间变换等方法,对采集到的图像进行数据增强后,使用图像标注软件labelme,标记采集到的MCF-7肿瘤细胞轮廓,标注后的MCF-7肿瘤细胞图像如图6 所示。

图6 标注后的MCF-7肿瘤细胞图像

2.3 模型设计

UNet网络模型和参数如图3所示,并在每次卷积操作后和ReLU激活函数之前加入Batch Normalization。Batch Normalization 的作用是将卷积后的结果归一化,突出不同数据间的相对区别,减小绝对区别,提升学习效率。此外,由于深层网络模型具有非常强的学习能力,如果没有大量的样本,会出现过拟合现象,使得学习后的模型难以应用。在图像传入UNet模型前,首先随机旋转图像以增强样本,进而达到抑制过拟合的目的。

2.4 UNet模型训练

该研究使用200 张MCF-7 细胞显微图像作为样本,对UNet 网络模型进行训练,实现了对肿瘤细胞的语义分割。将训练样本按照8∶1∶1 的比例随机划分为训练集、验证集和测试集3 部分,每部分图像数量分别是160、20 和20。输入数据为显微镜采集到的原始图片,经过5 层下采样与5 层上采样,最后经过一层1×1 的卷积层输出。

3 实验结果与分析

3.1 模型训练结果

使用200张MCF-7肿瘤细胞显微图像对网络进行训练,得到的结果如表1 所示,其中准确率(Accuracy,AC)、召回率(Recall,RE)、特异性(Specificity,SP)、精准率(Precision,PR)和F1 值(F1-score,F1)为评价网络结构的5 个重要指标,其定义分别为:

表1 UNet网络分割结果

式中,TP 为真正类(True Positive),TN 为真负类(True Negative),FP 为假正类(False Positive),FN 为假负类(False Negative)。从上式可得,准确率是正确预测与所有预测的比例,召回率是正确预测与所有实际正确样本的比例,精准率是正确预测与所有预测为正的比例,而F1 值则为准确率与召回率的综合加权。

由表1 可知,UNet 神经网络在训练集、验证集和测试集的图像分割准确率均高达90%以上,并且测试集的精准率高达89%,说明该网络可以较好地在图像中定位与分割MCF-7 癌细胞。而相比训练集和验证集,测试集的召回率较低,只有80%,分析其原因如下:

一方面是UNet 神经网络的深度较深、参数较多,虽然该模型在训练前对输入的图像进行了增强处理,并且加入了Batch Norm alization 层来抑制过拟合,但还是在一定程度上产生了过拟合现象;另一方面,显微图像中肿瘤细胞数目较少,导致标注区域只占背景的一小部分,也在一定程度上导致了网络模型训练的难度。

3.2 图像测试结果

将训练好的网络模型自动保存,并将新的MCF-7肿瘤细胞图像输入网络进行分割,得到的结果如图7所示,可以看到该网络模型能够较好地识别和分割显微图像中的MCF-7 肿瘤细胞。

图7 模型分割结果对比

4 结论

该文使用UNet网络,实现了对显微图像中MCF-7肿瘤细胞的识别与分割。实验结果表明,该网络模型的分割准确率达到91%,能够满足实际需求,具有一定应用价值。该网络相比传统的细胞识别算法,可以更精细地分割出细胞轮廓,并且分割后的显微图像还可用于细胞计数等应用。

该文的不足之处在于肿瘤细胞分割的准确率和召回率还可以进一步提升。下一步的研究重点可就分割不同种类的肿瘤细胞和分割不同时期的同一细胞进行探讨,并将其与细胞计数相结合。

猜你喜欢
准确率卷积函数
基于全卷积神经网络的猪背膘厚快速准确测定
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
关于函数的一些补充知识
高中数学中二次函数应用举隅オ