基于深度学习的高压输电线路防振锤检测

2022-09-15 05:12贾雁飞陈广大杨淼邢砾云赵立权李帅洋
机床与液压 2022年13期
关键词:阈值动态分数

贾雁飞 ,陈广大 ,杨淼 ,邢砾云 ,赵立权 ,李帅洋

(1.北华大学电气与信息工程学院,吉林吉林 132013;2.东北电力大学电气工程学院,吉林吉林 132012)

0 前言

随着人工智能技术的发展,基于无人机的输电线路巡检已经成为线路巡检的重要手段。常规无人机输电线路巡检需要将数据实时传输给服务器或者巡检后将数据传输给服务器,服务器采用深度学习方法实现线路设备图像目标检测以及故障识别等。基于深度学习的目标检测方法不需要人工设计特征提取方法,相对传统目标检测方法精度更高。现有基于深度学习的目标检测方法大致可以分为基于候选区域的两阶段图像目标检测方法和基于回归的单阶段图像目标检测方法。前者最具有代表性的方法是由GIRSHICK等提出的R-CNN方法,后来在此基础上人们提出了Fast R-CNN、Faster R-CNN、Mask R-CNN、MS-RCNN等其他改进方法。此类方法追求较高精度的目标检测性能,但是忽略了检测速度,适用于实时性不高或者服务器运算能力较强的应用环境。

基于回归的单阶段图像目标检测方法更多关注的是在检测精度满足实际需求的前提下,尽可能地提高检测速度,因此它更适用于对实时性要求较高或者需要快速检测的应用场合。代表性的方法有SSD系列方法和YOLO系列方法,其中YOLO系列方法更具有代表性。2016年,REDMON等提出了经典的YOLOv1目标检测方法,该作者在此基础上于2017年提出了YOLOv2,2018年提出了YOLOv3目标检测方法。此后因REDMON不满YOLO算法应用于军事和隐私窥探等方面,退出了人工智能领域的研究,YOLOv3成为YOLO系列的最后一个版本。虽然后续人们提出了许多改进的YOLOv3方法,但都没有被称为新的YOLO版本,直到2020年BOCHKOVSKIY等在YOLOv3的基础上提出了YOLOv4方法,此方法也是到目前为止REDMON唯一承认的YOLO方法新版本。YOLO系列方法是单阶段图像目标检测方法中最常用的方法,目前已经被广泛应用于电力系统、交通以及安全监督等领域。

由于输电线路巡检图像数据量大,若采用复杂度较高的基于深度学习的目标检测方法,很难在服务器运算能力有限的前提下,实现输电设备图像目标快速检测和分析。若采用复杂度非常低的基于轻量化深度学习网络的目标检测方法,又很难保证输电设备目标检测精度。综合考虑输电线路防振锤检测的精度要求和巡检实际需求,本文作者采用基于YOLOv4的线路防振锤检测方法。

由于防振锤发生移位时,很容易形成高度重合的现象,导致检测过程中出现漏检和检测误差较大的问题。为此,本文作者提出动态非极大值抑制(NMS)方法,并用该方法确定YOLOv4方法中防振锤检测目标边界框,提高边界框选择的准确性,降低防振锤漏检概率,提高防振锤的检测精度。此外,本文作者还提出采用分段线性函数作为激活函数,增强模型的非线性表达能力,进一步提高防振锤的检测精度。

1 基于YOLOv4的防振锤检测

基于YOLOv4的防振锤检测过程如图1所示。首先,采用CSPDarkNet-53网络作为YOLOv4算法的主干网络,对采集到的输电线路图像进行特征提取,得到浅层特征;其次,采用特征金字塔网络,对主干网络提取到的浅层特征进行处理和增强,从而使模型学习到更高层次的防振锤特征;然后,利用3个检测分支,从特征金字塔网络的输出特征中检测出不同尺度大小的防振锤,同时在防振锤目标周围产生多个检测框;最后,利用非极大值抑制方法从同一目标周围多个检测框中选择出一个最优的边界框,实现防振锤目标定位。

在YOLOv4检测算法中使用的训练技巧包括自对抗训练、权重残差连接、交叉小批量标准化、Mosaic数据增强、Mish激活函数、DropBlock正则化、CIoU损失等,它将这些技巧进行有效的组合,以达到最好的检测效果。与YOLOv3算法相比,在检测速度基本没有变化的前提下,YOLOv4的检测精度提高了近10%,因此也成为YOLO系列最新版本。

图1 基于YOLOv4防振锤检测

2 改进的YOLOv4图像目标检测方法

2.1 非极大值抑制方法改进

YOLOv4算法为每个网格分配3个预设的锚框尺度。因此,会出现多个检测框对应于同1个目标,但是每1个目标有且仅有1个正确的检测框,其余的检测框应该被删除以避免影响算法的检测性能。在YOLOv4算法中使用了NMS方法来抑制重复的检测框。在NMS方法中,如果低分数检测框与高分数检测框的重叠率大于1个固定阈值,则低分数的检测框将被抑制。因此,该算法可以减少检测框的数量,提高检测速度。但是,在目标密集且有遮挡的情况下,NMS方法会遇到问题:如果1个目标出现在另1个目标的重叠区域,当2个目标的检测框非常接近时,NMS方法会抑制低分数检测框,这将导致有1个目标检测不到,造成漏检现象。在NMS方法中,只是用1个固定的阈值来处理检测框,如果在NMS方法中使用1个较小的阈值,当2个目标高度重叠时,则会导致漏检另1个目标,如果使用大的阈值,则会导致误报。

为解决这个问题,应该考虑以下条件:当目标周围有多个密集的检测框时,需要提高NMS的阈值,以保留具有较高重叠的相邻检测框;相反,当目标周围存在较稀疏的检测框时,应使用较小的NMS阈值来抑制重叠度较高的检测框,因为这些高度重叠的检测框有很大的概率变成误报。因此,应该对它们进行抑制。

为满足这些条件,本文作者提出一个改进的非极大值抑制方法,命名为动态非极大值抑制(DNMS)方法。它根据目标周围检测框的统计特性确定出一个动态阈值来代替NMS方法中的固定阈值。假设检测框的集合为,相应的检测分数集合为。首先,对检测框按分数进行降序排列,选择分数最高的检测框记为,并将它从集合移动到集合中;然后,计算检测框与集合中每个检测框之间的交并比(IOU)值,并利用得到的IOU值的统计特性(均值)来表示检测框周围检测框的密度。IOU均值的表达式如下:

(1)

式中:为集合中检测框的数目。越大,则周围的检测框的密度越大。因此,表示周围检测框的密度,可以用来控制检测框的数量。将与(一个固定阈值)进行比较,选择最大值作为最终的动态抑制阈值,其数学表达式为

=max(,)

(2)

如果检测框与检测框之间的IOU值小于动态阈值,则的分数保留下来,即检测框被保留,否则的分数置为0。的数学表达式为

(3)

式中:为检测框的检测分数,如果框的分数是0,意味着这个检测框将被抑制。重复以上过程直到框集合是空集为止,将每次循环选择的检测框形成最终检测框集合。

本文作者提出的动态非极大值抑制方法中,如果检测框周围有很多密集的检测框,则大于,动态阈值等于。因此,提出的动态非极大值抑制方法比原始NMS方法有更高的抑制阈值,所以它能够在有检测目标遮挡的情况下,保留更多的检测框,避免漏检。反之,当相邻检测框远离检测框时,动态阈值等于,抑制过程与传统的NMS方法相同。

在所提出的动态非极大值抑制方法中,使用一个动态阈值(根据目标周围检测框的统计特性确定)来代替传统NMS方法中的单一固定阈值。因此,动态非极大值抑制方法的计算复杂度与NMS方法相同。与NMS方法相比,所提方法不增加任何超参数。动态非极大值抑制方法中使用一个动态阈值解决了NMS方法的单一固定阈值问题,从而使得检测算法能够选择出更好的检测框以完成目标检测任务。

2.2 激活函数改进

在YOLOv4模型中的检测部分使用的激活函数是Leaky ReLU函数,它是ReLU函数的变体。Leaky ReLU函数赋予负值一个小的梯度,使得处于负值的神经元也能够学习,从而解决ReLU函数负半轴神经元不学习的问题,但是Leaky ReLU函数对负值的处理不是很好,并且函数曲线不是平滑曲线。通常好的激活函数的曲线应当是平滑曲线,且对于负值处理得更好。因此,在一些检测算法中使用Swish函数作为激活函数。Swish函数的数学表达式为

()=/(1+e-)

(4)

Swish函数在深层网络模型中的性能优于ReLU及其继承者,并且它的函数曲线是一个平滑曲线。虽然Swish函数可以显著提高卷积神经网络的准确性,但由于该函数存在幂值计算,导致计算过程较为复杂,影响了检测模型的速度。因此,本文作者提出使用分段线性函数hardswish来逼近Swish函数。hardswish函数的数学表达式为

(5)

相对于Leaky ReLU函数,hardswish函数的曲线是相对平滑的,且对负值有更好的处理效果,因此,在YOLOv4模型的检测部分使用hardswish函数作为新的激活函数来改进YOLOv4算法的网络结构。两个函数的曲线对比如图2所示。

图2 Leaky ReLU函数和hardswish函数曲线

3 实验结果与分析

实验计算机软件平台配置如下:操作系统Ubuntu 18.04,两颗CPU的型号均为Intel Xeon E5-2678 v3,GPU采用英伟达GTX1080Ti,内存为128 GB。由于输入图像大小不一致,通过预处理方式将它转换成大小为416像素×416像素的图像,并作为YOLOv4原方法以及文中改进方法的输入。所有方法的初始学习率都是0.001,采用阶梯型的学习率策略,利用动量为0.9的随机梯度下降优化器来调整网络参数。权重衰减设定为0.000 5,以防止模型过拟合,非极大值抑制阈值为0.5,每个批次训练8张图像。

实验数据来源于某供电公司无人机巡检图像数据,经过筛选得到4 852幅含有防振锤的无人机巡检图像,其中防振锤发生位移后,部分重合和接触的图像有1 732幅。由于无人机巡检拍摄画面较大,防振锤相对较小,为便于训练和测试,采用截图的方式将含有防振锤的图像从巡检图像中截取出来,作为训练和测试图像。文中采用Labeling 数据标注软件对处理后的4 852幅图像进行标注,并直接生成YOLO数据标签格式。数据集中训练集图像有3 500幅,其中包含2个防振锤移位部分重叠或者接触的图像有1 200幅;剩下的图像作为测试集样本。

为验证算法的性能,文中采用准确率、召回率和分数来衡量算法的性能。其中准确率的计算公式如下:

(6)

式中:为检测框与真值框之间IOU值大于等于阈值的检测框数量,即正确检测框数量;是检测框与真值框之间IOU值小于阈值的检测框的数量,即错误检测框数量。召回率的计算公式如下:

(7)

式中:为没有检测到的真值框数量。为准确率与召回率的调和平均值,其计算公式如下:

(8)

从测试集中选取3张具有代表性的图片,用来测试算法对不同重叠程度的防振锤的检测效果,结果如图3所示。由图(a1)和(b1)可以看出:2种方法都成功地检测出这两个防振锤,并且检测结果差别很小,也就是对没有重叠的防振锤,2种检测方法的性能基本一致。图(a2)和(b2)是两个防振锤的锤头部分重合的情况,可以看出:2种方法都检测出2个防振锤,但是图(b2)中右侧防振锤的置信度为0.86,比(a1)中对应的置信度0.97小,也就是图(b2)的检测误差更大。图(a3)和(b3)中包含有4个防振锤,其中最上面的2个防振锤没有任何重叠,下面的2个防振锤几乎完全重叠在一起。可以看出:采用改进后的方法可成功检测出4个防振锤;采用原YOLOv4方法仅检测出3个防振锤,将重叠后的2个防振锤检测成为1个防振锤,发生了漏检现象。而文中所提出的方法成功地将2个重叠的防振锤正确检出,没有发生漏检现象。

图3 不同情况下的防振锤检测结果

表1所示为基于文中改进方法的防振锤检测性能和基于原YOLOv4方法的防振锤检测性能。基于改进后的YOLOv4方法防振锤检测准确率为91.7%,召回率为74.8%,分数为82.39。基于原YOLOv4方法防振锤检测准确率82.3%,召回率63.9%,分数为71.94。无论是在防振锤检测准确率、召回率还是分数方面,改进后方法的数值都高于原方法,即性能更好。

表1 防振锤检测性能比较

综上所述,改进后的方法相对原方法能够很好地检测出重叠度较大的防振锤,而且具有较高的准确率、召回率和分数,整体性能更好。

4 结论

针对输电线路巡检中防振锤重叠程度较大时检测误差较大的问题,提出一种动态非极大值抑制方法。从候选框中选择合适的边界框,提高边界框选择的准确性、降低漏检概率。此外,为了进一步提高检测性能,提出采用平滑性更好的hardswish函数作为YOLOv4算法的激活函数,相对于基于原YOLOv4的防振锤检测方法,基于改进的YOLOv4的防振锤检测方法具有更高的准确率、召回率和分数,防振锤检测性能更好。

本文作者仅实现了防振锤目标检测,没有利用检测结果计算防振锤是否发生了移位。未来,可以在此检测结果的基础上,进一步检测防振锤所在导线走向,进而根据防振锤中心位置以及导线走向,判断防振锤是否发生了移位等。

猜你喜欢
阈值动态分数
国内动态
非平稳声信号下的小波变换去噪方法研究
国内动态
国内动态
非均匀光照下文本图像分割算法研究
一种快速比较分数大小的方法
把握物理难点,分数更上一步
利用迭代软阈值方法抑制恒时演化类核磁共振实验中的采样截断伪峰
……的近似分数的若干美妙性质
奇妙分数与特殊数列自动生成