基于YOLO 网络的无酸除鳞带钢表面缺陷实时检测①

2022-05-12 05:44宋紫棋毛桂庭
矿冶工程 2022年2期
关键词:水射流钢带卷积

宋紫棋, 毛桂庭, 侯 奔

(长沙矿冶研究院有限责任公司深海矿产资源开发利用技术国家重点实验室,湖南 长沙 410012)

磨料水射流[1]是一种用于难加工材料的非传统加工工艺,借助计算机数控技术,磨料水射流可完成切割、铣削、钻削、磨削等多种功能。 在钢铁产业中,磨料水射流技术常被用于热轧钢带的表面处理[2-3],即钢材除鳞。

基于磨料水射流技术的无酸除鳞技术发展迅速,与传统酸洗除鳞工艺相比互有优势。 无酸除鳞无废酸排放,无粉尘污染,且清洗成本低于酸洗技术,但无酸除鳞面临着与酸洗完全不同的表面质量控制问题。 钢板在磨料水射流除鳞前往往已经进行了剥壳等操作,经除鳞后钢带缺陷大大减少,但由于钢带本身质量问题或磨料水射流喷头参数问题,钢带表面仍存在火烧纹、暗带和划痕等缺陷,会影响热轧板带的质量,降低热轧板带产品的经济效益,并对后续冷轧过程产生一定影响,因此需要对经除鳞的热轧板带表面缺陷进行检测,对除鳞设备进行实时监控,及时发现问题,以提高热轧板带产品质量。

近年来,卷积神经网络方法快速发展,并在计算机视觉领域取得了很好效果,如Fast R-CNN,Faster R-CNN采用proposal & classification 的两阶段检测架构,具有较好的检测精度,但其检测速度不能满足带钢除磷生产实时监控的要求。 本文采用轻量化的YOLOv3[4]网络,结合Focal loss 算法改进损失函数,在保证精度条件下提升了检测速度,有望用于工业现场实时检测表面缺陷,提高带钢质量。

1 表面缺陷检测网络结构设计

1.1 YOLO 算法

YOLO(You Only Look Once)算法是目前目标检测领域最有效的算法之一,它使用单个网络同时实现目标区域和类别的预测,速度相较于R-CNN 类算法有了较大提升。

YOLO 首先通过特征提取网络对输入图像进行特征提取,得到S×S的特征图谱,然后将输入图像分成S×S个网格,每个网格预测B个检测框的位置信息和置信度信息,由图像中目标中心所在的网格预测对应目标。 对于C类的检测问题,最终的特征图谱输出尺寸为:S×S×(5×B+C)。

YOLOv3 结合残差网络Resnet 搭建了Darknet-53网络,舍弃了池化层和全连接层;结合多尺度预测FPN[5]采用3个尺度特征图进行预测目标类别和位置,在速率和准确率之间达到了平衡。 YOLO 网络结构如图1 所示。 对于4 类目标的检测,YOLOv3 输出了3个不同尺度的特征图谱。

图1 YOLO 网络结构

截至目前YOLO 已经发展到V5 版本,但工业界仍普遍应用V3 版本,出于稳定性和可维护性考虑,本项目在YOLOv3 算法的基础上进行改进。

YOLOv3-tiny 是YOLOv3 的简化版本,其主干网络采用一个7 层conv+max 网络提取特征(与darknet19类似),并添加了一个13×13、26×26 的分辨率探测网络,YOLO-tiny 网络结构见图2。 由于主干网络比较浅,精度相对较低。

图2 YOLO-tiny 网络结构

1.2 深度可分离卷积

标准卷积与深度可分离卷积见图3。 深度可分离卷积(Depthwise Separable Convolution,DSC)[6]常用于轻量级网络中,由深度卷积(如图3(b)所示)和点卷积(如图3(c)所示)2 部分结合而成,用来提取特征图谱,相比常规的卷积操作,其参数数量和运算成本较低。标准卷积结构是将输入数据的每个通道与对应的一个卷积核进行卷积操作,并将各通道的卷积结果相加。 在深度可分离卷积结构中,输入数据的各通道进行深度卷积操作,再使用点卷积将其输出组合得到新的特征图谱。 该网络结构能够极大降低模型参数量以及计算量,从而在检测精度没有明显变化的情况下,提高检测速率。

图3 标准卷积与深度可分离卷积

对于DF×DF×M的输入数据,经卷积核尺寸为DK×DK×M的卷积层,输出DF×DF×N特征图。

如图3(a)所示,标准卷积层的参数量WSC为:

如图3(b) ~(c)所示,深度可分离卷积参数量WDSC为深度卷积与点卷积参数量之和:

2种方法参数量比值F为:

YOLO 模型中卷积核尺寸主要为3×3,将标准卷积替换为深度可分离卷积后,参数量接近原来的。

MobileNetv2 改进了深度可分离卷积模块[7],使用线性激活函数替代原本点卷积后的relu 非线性激活,这样可以更多地保留局部特征。

1.3 FocalLoss

相比Faster RCNN 一类的two-stage detector 算法,YOLO 类算法使用单个网络同时实现目标区域和类别的预测,准确率不如前者,这种情况往往是样本类别不均衡所致[8]。

对于二分类问题,常用的交叉熵损失为同样权重的各样本交叉熵直接求和:

式中y∈{-1,+1}为该样本的类别;p为样本y=1 的概率。

在交叉熵损失函数的基础上改进得到FocalLoss:

式中αt为样本系数,用来调整正负样本的权重;γ≥0是损失函数的集中参数;pt为样本属于正样本的概率,(1-pt)γ即为调制系数,可以减少易分类样本的权重,使模型在训练时更专注于难分类样本。

本文中数据集取自工业现场,钢带表面各类缺陷分布不均匀,对模型效果产生了较大影响。 通过将交叉熵损失替换为FocalLoss 有利于缓解这类问题。

1.4 DF-YOLO 结构

YOLO 算法每一代的提升主要来自于backbone 网络的提升,得益于YOLO 的灵活性,对其backbone 网络进行合适的替换即可获得良好效果。

YOLOv3 的DarkNet-53 网络采用1×1 加上3×3卷积核的形式,加深了网络深度和特征抽象,通过添加深度可分离卷积,可以减少卷积层参数,减少模型训练时间,加快检测速度。

本文中使用的DF-YOLO 网络结构如图4 所示,其中DPBL 即深度可分卷积+Batch normalization +Leaky relu,保留点卷积层,使用DPBL 替代除点卷积层外残差模块中的卷积层;网络使用FocalLoss 进行训练。

图4 DF-YOLO 网络

2 实 验

2.1 数据集

实验图像采集自某厂无酸除鳞车间监控摄像头,该车间使用长沙矿冶研究院有限责任公司自主研发的金属板(带)材无酸除鳞技术与成套设备进行无酸除鳞。

由于磨料水射流具有较强的切割能力,经除鳞后钢材表面麻点、夹杂和较浅划痕会被去除;而在钢厂工艺相对成熟的情况下,轧钢出现折叠、裂纹、结疤等钢材常见缺陷的概率会大大减少。 不同于其他热轧钢带缺陷的识别,经磨料水射流除鳞后,金属表面主要缺陷为火烧纹、暗带和划痕,如图5 所示。

图5 缺陷检测数据集

为了便于检测,减少缺陷误检,首先对已完成无酸除鳞且正在收卷的钢带进行检测,如图5(d)所示,后续检测框应处于钢带检测框中。

暗带缺陷类似于酸洗过程中产生的欠洗缺陷,是除鳞喷头压强不够的情况下钢带表面残留的氧化皮[9];火烧纹表现为年轮状的纹路,其产生于钢带轧制过程中,往往是带钢在辊缝中不均匀延展所致[10];划痕沿轧制方向呈线状分布,当轧钢过程中带钢与尖锐物体划擦时产生[11]。

数据集使用labelimg 软件标注,按照PASCAL VOC 格式制作,将缺陷以XML 文件形式存储。 为了防止模型训练过程中过拟合,提高模型泛化能力,本文采用了图像旋转、平移、重采样、随机裁剪、添加高斯噪声、添加高斯模糊图像增强法等方法来对图像进行增强。 数据集组成如表1 所示。

表1 缺陷数据集组成

2.2 基于DF-YOLO 模型的缺陷检测

实验过程中在上述缺陷数据集上分别训练了YOLOv3 网络和DF-YOLO 网络。 训练过程中,使用FocalLoss 损失函数,样本系数αt取0.25,集中参数γ取2,以416×416 的固定输入训练200 轮,初始学习率为0.001,并根据训练情况进行衰减。

检测过程中先确定交并比(Intersection over Union,IoU),用于测量真实值和预测值之间的相关度,相关度越高,该值越高。 实验中IoU 取0.45。

设P为模型的精确率,等于被预测正确的正样本数量TP与被预测的正样本总数(TP+FP)之比,在本问题中,即IoU>0.45 的检测框数量与检测框总数之比。

以平均精度均值(mean Average Precision,mAP)和每秒处理帧数为指标,其计算式为:

式中Pij为第i张图片属于第j类的准确率;N为测试集图片总数;m为标签种类数。

经预处理后的测试集图像尺寸为416×416,车间摄像头实时采集的图像尺寸为1 920×1 080,先后对两类图像进行检测,网络训练过程如图6 所示,先冻结YOLO 网络的全连接层进行10 轮训练,以加快网络骨架训练速度,然后解冻全连接层,对整个网络进行训练。

图6 网络训练过程

由图6可看出,由于FocalLoss 损失函数改善了数据集分布,DF-YOLO 网络损失函数有着更快的收敛速度,并收敛于数值更低处。

网络训练结果如表2 所示。

表2 网络训练结果

部分检测结果如图7 所示。 由图7可以看出,本文算法能够对钢带表面缺陷进行更为精确的识别和定位,通过使用深度可分离卷积和FocalLoss 损失函数对YOLO 模型网络进行改进,本文算法对该数据集具有很好的检测效果。

图7 不同模型检测结果

使用DF-YOLO 模型对缺陷图像进行检测,结果如图8 所示,对于文中3种缺陷都能进行较好的识别。

图8 DF-YOLO 模型对不同缺陷的检测结果

使用DF-YOLO 模型对生产现场视频进行检测,在保证一定帧率的前提下,能对钢带缺陷进行准确检测,如图9 所示。

图9 DF-YOLO 模型生产现场检测结果

3 结 论

1) 在相关数据集缺乏的情况下,率先建立了基于无酸除鳞的金属表面缺陷数据集,为金属表面缺陷检测奠定了基础。

2) 提出了用于该数据集的DF-YOLO 检测网络,在缺陷检测任务中可以在测试帧率50 FPS 时保持平均精度均值75.44 的准确率。

3) 本研究为经无酸除鳞的金属表面提供了数据集和相应的检测算法,实现了金属表面缺陷的实时检测,对热轧钢带的生产具有重要的指导意义。

猜你喜欢
水射流钢带卷积
CVT钢带轴向偏斜机理及对钢带失效的影响
有限转角钢带的传动特性及预紧张力对输出特性的影响
基于3D-Winograd的快速卷积算法设计及FPGA实现
卷积神经网络的分析与设计
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法
基于Solidworks钢带快速修复形变的研究
卡帝仕·至尊钢带手表
高压水射流冲击煤体的力学特征*
水刀坊的前世今生——记河北锐迅水射流技术开发有限公司总经理纪新刚