基于改进YOLOV4的肺结节检测方法

2022-09-01 07:07黄冕刘顺有杨林海

科技创新导报 2022年11期

黄冕刘顺有杨林海

（云南国土资源职业学院云南昆明 652501）

根据2020年全球癌症统计数据，肺癌的死亡率（18.0%）高居第一，发病率（11.4%）位居第二，仅次于乳癌（11.7%），肺癌已严重威胁人类的身体健康。随着近年来深度学习的兴起，在计算机辅助诊断这一领域，深度学习同样有着突出的贡献。在这一大背景下，近年来的肺结节检测方法均采用深度学习有关的网络。宋尚玲［1］等人在提出一种大样本条件下的基于Faster-RCNN 的肺结节检测算法，给出一种通用的随着样本数量增加肺结节检测率持续提升的策略。Zhu［2］等人提出了一个3Dfaster-RCNN 算法，使用双路径模块和基于语义的编码解码结构学习肺结节特征。李新征［3］等人提出一种基于非对称卷积核YOLO V2 网络的CT影像肺结节检测方法。席孝倩［4］等人提出一套将阈值分割算法和数字形态学处理相结合的肺实质CT 影像处理流程。王波等人［5］提出一个以YOLO 算法为基础，结合Darknet-53网络和Densenet网络的思想，在多尺度间具有紧密连接的深度卷积神经网络。王乾梁［6］等人提出基于改进YOLO V3的肺结节检测方法，首先进行重采样和肺实质分割等预处理操作，然后修改YOLO V3的基础网络结构。

1 本文方法

本文方法主要聚焦在有效性和肺结节检测效率上，为此，选择YOLOV4作为本方法的主干网络。方法分为两步：第一步，在模型设计阶段，为了提示肺结节的检测的有效性，在YOLOV4主干网络的基础上，结合了CT图像的特性和现在一些先进的方法，设计一个高精度的模型，称为YOLO-DCF，结构如图1所示。第二步，为了提升检测器的效率，把YOLO-DCF 模型的一些多余的通道裁剪了，减少了模型的参数，提升了检测器的效率。

图1 改进YOLOV4网络结构图

1.1 DO-Conv层

深度学习方法对图像特征的提取主要源自卷积操作，如果对卷积层进行改进，可以大幅提升检测性能。DO-Conv 层（Depthwiseover-parameterizedconvolutional layer）结合了传统卷积和深度卷积，提升了整个卷积层的性能。在深度卷积过程中，对每个输入通道都使用不同的二维深度卷积核进行操作，并且两种卷积的结合使用提升了参数的可学习性，因此，对整个网络的特征提取能力和语义代表性都有着重要的意义。在主干网络残差块中加入DO-Conv，不仅可以很好地表现真肺结节特性，还可以降低错误率。DO-Conv 如式（1）所示：

1.2 多尺度特征图融合

在深度学习网络中，现在很多方法都将不同大小的特征图进行融合以提升网络的性能。随着网络越来越深，肺结节的位置和语义信息也越容易丢失，造成不同大小特征图融合效果不理想。为了解决上述问题，在主干网络中加入了3 种卷积注意模块（convolutional block attention module），其中，通道注意模块和空间注意模块增加了网络中肺结节的空间信息和语义信息。不同于一般的特征图融合方法，本文的方法更加集中在提升肺结节信息的注意力机制。

通道注意模块如式（2）所示：

空间注意模块如式（3）所示：

1.3 损失函数

在CT图像中，由于肺结节在图像中非常的小而且数量也很少，会导致正样本中有一个致命的缺点。在YOLOV4 网络训练时，大部分的候选边界框会被分为负样本，这样极度不平衡的正负样本分布会使置信度损失的梯度更新方向总是为负样本，从而导致网络很难学习到肺结节的信息。YOLOV4中使用的交叉熵损失函数很难避免这个问题，所以在交叉熵损失函数基础上加入focal loss。新的损失函数如式（4）、式（5）所示。

在实验过程中，设置λ=0.5，α=0.25，ϓ=1.5。

1.4 网络精简

本文方法合理减少了通道数，以保证网络的有效性和效率达到平衡。本网络会通过权重和η评估通道的重要性（importance of the channels），然后设置不同的修剪通道比例，获得更加有效率的网络。

2 分析与讨论

2.1 实验环境

整个实验的训练和测试都是使用NVIDIA Tesla K80 GPU。数据集使用的是LIDC-IDRI 数据集。网络输入图像大小为512 × 512，批大小为4，梯度优化函数为momentum-SGD。FPS用于评价网络速度，precision、recall 和AP用于评价网络性能，如式（6）、式（7）、式（8）所示：

2.2 实验结果

本网络precision 为0.936，recall 为0.954，ap 为0.937。实验结果表明，DO-Conv 增强了特征提取和整个网络的代表性，多尺度特征图融合增强了网络的肺结节语义和位置信息。focal loss使得网络了解更多肺结节信息通过调整肺结节图像正、负样本比例。上述3个对YOLOV4网络的改进以获得性能最好的网络，与YOLOv4相比，AP 总增加了4.9%。为了平衡有效性和效率，选择对网络的冗余通道进行修剪。当修剪比率为0.7 时，AP 为90.5%，参数为6.318M，最后结果表明网络的性能没有受到减少通道数的影响。

3 结语

针对在实际场景中可能数据有限且硬件有限，本文提出了一种平衡有效性和效率的实用肺结节方法。首先，基于YOLOv4算法和根据肺结节在CT图像中的特点，逐步采用DO Conv、CBAM 和focal loss 这3 个改进方法，以获得高精度的肺结节检测网络。然后，设置一个合适的修剪比率来减少网络中冗余通道，并获得更高性。实验证明，此方法在保证了性能的情况下也有很好的检测速度，比其他方法更适合实际场景，如在医院部署。