基于改进GWO-SVM的金属产品表面缺陷分类研究

2022-11-25 12:49杨益服李文磊李俊杰
组合机床与自动化加工技术 2022年11期
关键词:灰狼分类器样本

杨益服,李文磊,李俊杰,问 轲,张 炜

(1.浙江希望机械有限公司,温州 325003;2.哈尔滨商业大学轻工学院,哈尔滨 150028;3.浙江大学宁波理工学院,宁波 315100)

0 引言

随着金属制造业的迅猛发展,人们对于金属产品的需求量越来越大。其中金属机械作为产品包装过程中的核心设备在机械行业发挥着重要的作用[1]。因此,人们对于金属产品零件表面缺陷的识别方法和精度也提出了越来越高的要求。表面缺陷的存在不仅对设备的外观造成影响,同时也对其使用寿命,机械性能起决定性作用。因此对金属产品设备的缺陷识别具有重要的研究意义。目前常用的零件缺陷检测方法包括传统的人工目视检测方法,通过物理或化学方法为手段的无损检测方法,机器视觉检测方法。随着人工智能技术的发展,传统人工目视检测方法效率低、易疲劳等问题,已无法满足生产线的需求。近年来机器视觉自动检测技术发展迅速,在产品质量检测,人工智能、医学等领域发挥着重大作用。LUO等[2]针对包装印刷品上的缺陷,通过神经网络对缺陷图像的特征进行分类识别。杨小艳[3]针对包装机械零件表面缺陷检测效率低等问题,通过图像处理算法完成缺陷特征信息提取,并设计新的缺陷分类器模型实现缺陷分类。但两种方法的训练时间较长,且并不适用于样本集比较少的机械产品中。王峰等[4]为缩短缺陷识别时间,通过动态阈值的设定,对一些像素点实现免检。由此,对于机械产品的检测主要体现在运行时间,精度等问题上。尽管目前的检测技术发展迅速,但针对金属产品上的缺陷在分类识别过程中仍存在一些问题。如分类效率低、运行时间长等问题。目前,对于缺陷图像分类的方法主要有聚类算法、决策树算法、支持向量机(SVM)和神经网络等[5-6]。其中支持向量机在解决小样本、高维图像中具备很大的优势。

本文针对解决金属产品表面缺陷分类率较低等问题,首先,提出了一种改进灰狼优化算法。该算法分别引入Cat混沌策略、动态非线性控制参数和双权重因子策略、基于权值的位置更新策略来提高算法的寻优性能。其次,以所提的改进灰狼算法为新机制,进行SVM核参数优化,缺陷类型定义、缺陷分类等工作。最后,通过与传统的分类器模型相比较,进一步验证本文方法的有效性。

1 金属产品零件表面缺陷分类相关理论

1.1 SVM理论基础

原始的支持向量机(SVM)主要是针对2分类问题提出的。SVM学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面[7-8]。对于二分类线性可分问题,超平面的数学模型可表示为:

ωTx+b=0

(1)

式中,x表示输入的数据,即缺陷样本中的向量集合;ω表示权值向量,即超平面的法向量;b表示超平面相对于坐标原点的偏移量;ωT表示ω的转置。决策分类函数可表示为:

f(x)=sgn[ωTx+b]

(2)

相比与经验最小化的神经网络和最小二乘法,SVM的学习泛化能力较强。对于线性不可分问题,引入了一个新的核函数代替原始的内积。核函数的数学模型为:

K(x,z)=φ(x)·φ(z)

(3)

式中,x表示样本数据中的向量集合。此时对应的决策函数数学模型为:

f(x)=sgn[ωTxK(x,z)+b]

(4)

应用支持向量机实现缺陷分类时,惩罚参数c和核参数g的选取对SVM的性能有很大的影响,这两个数值的选取直接影响缺陷分类的准确率与分类器模型的可靠性[9]。因此需要寻找有效地智能优化算法应用于SVM参数寻优上,以提高分类准确率。经过实验对比,本课题采用改进的灰狼优化算法寻找最优的惩罚参数c和核参数g,这样就将对分类器优化转化为参数优化问题。

1.2 灰狼优化算法理论

灰狼优化算法(GWO)是受自然现象启发提出的算法[10],通过狼群狩猎的行为进行寻找最优的猎物,主要通过跟踪、包围和攻击三个步骤完成狩猎。即寻找金属产品上的缺陷分类模型系统的最优惩罚参数c和核参数g。该算法可以有效地达到参数寻优目的。

2 改进灰狼算法对分类器模型参数改进

2.1 Cat混沌反向学习策略

传统的GWO是随机产生初始狼群,不具备多样性,容易导致狼群种类不稳定。为了使狼群在初始阶段分布均匀,增强狼群的多样性,本文提出了Cat混沌映射[11]和反向学习策略相结合的思想,以丰富狼群的多样性,促进算法的收敛速度。在大多数传统的优化算法中,混沌映射方法都被应用其中,并取得了较好的效果。这些算法大部分采用的是Logistic混沌映射,该映射方法的不足在于易受初始值的影响,且算法的遍历性和寻优速度较差,这些特性将直接影响混沌映射过程的搜索性能。该算法的数学模型为:

(5)

该算法的具备结构简单,遍历性好以及搜索性能好等特点,且在[0,1]之间产生的混沌序列分布较均匀。

反向学习数学模型为:

(6)

2.2 动态非线性控制参数和双权重因子策略

为增强算法的收敛速度和收敛精度,分别从收敛因子a和权重c着手,采用新的动态非线性收敛因子a对GWO优化搜索操作。其数学模型为:

(7)

b1=1-2(2r1-1)

(8)

式中,Amin、Amax分别表示控制收敛因子a的最大值和最小值;r1表示在区间[0,1]范围内随机产生的数值;Tmax表示最大迭代次数;t表示现阶段的迭代次数。

采用新的正切三角函数权重因子C1和指数权重因子C2。其数学模型为:

(9)

(10)

式中符号的物理含义与式(8)相同。则对应的灰狼位置数学模型为:

Xα,β,δ(t+1)=C1Xp(t)-C2AD

(11)

2.3 基于权值的位置更新策略

传统的灰狼算法在对ω狼的位置进行更新时,主要通过前三头狼(即α、β、δ狼)所在位置的平均值进行决定的,并没有完全的体现出针对ω狼位置更新过程中所占的比值[12]。所以使得算法的收敛速度和收敛性能较差。故本文引入了一种基于权值的位置更新策略,通过前三头狼的权值进行控制ω狼的位置。其数学模型为:

(12)

(13)

(14)

Xα,β,δ(t+1)=ω1Xα(t+1)+ω2Xβ(t+1)+ω3Xδ(t+1)

(15)

2.4 优胜劣汰选择策略

在狼群攻击猎物阶段采用优胜劣汰的选择规律通过一定概率q选择当前最优解。其数学模型为:

(16)

(17)

式中,XB(t+1)表示更新后ω狼的位置;q表示选择概率;r2表示区间[0,1]范围内的随机值;y(·)表示ω狼的适应度值。通过以上3个阶段的计算可以获得金属产品上的缺陷分类模型系统的最佳参数。

3 缺陷特征提取和选择

3.1 特征提取算法

缺陷数据集来自于金属产品零件上常见的缺陷类型,包括划伤缺陷、夹杂缺陷、孔洞类缺陷等。将采集到的缺陷图像通过图像处理算法进行特征提取操作。目前常用的图像特征主要包括形状特征,纹理特征、灰度特征、颜色特征等,其中形状特征和颜色特征可以直观地看出,而纹理特征和灰度特征则需要相关的计算进行提取[13]。考虑本文缺陷图像的特点,提取几何形状特征,灰度特征和纹理特征共3种,其中提取的几何形状特征特征和灰度特征包括缺陷区域的面积、周长、长宽比、圆形度、矩形度、灰度最大值等特征值。

针对缺陷图像的纹理信息,本文通过LBP算子进行提取,LBP算子是一种通过获取像素周围的局部邻域,将邻域的像素阈值设置为中心像素的值,并将得到的二值图像作为局部图像的描述符[14]。该算子定义了3×3的像素窗口,通过中心像素周围的8各像素的到8位二进制数,其数学模型为:

(18)

3.2 特征选择算法

图像特征选择的目的是为了提高后续缺陷图像分类的准确性和鲁棒性。其基本思想是从图像空间到特征空间的转换,针对提取的高维特征进行降维处理。通过上述提取的缺陷图像特征信息较多,本文引进了PCA特征选择算法对上述的特征信息进行降维处理,PCA是一种线性组合方法,它能在尽可能好的代表原始数据的前提下,能过线性变换将高维空间的样本数据投影到低维空间[15]。其数学模型为:

(19)

式中,A·AT表示样本集的协方差矩阵。

随后引入贡献率用φ来选取F个最大的特征值和对应的特征向量,其数学模型为:

(20)

本文提取的缺陷形状特征和灰度特征共计10个,其中包括8个几何形状特征和2个灰度特征;提取了58个基于LBP算子的缺陷纹理特征。其中,几何形状特征属于图像的外部信息维度并不高,灰度特征和纹理特征属于图像的内部信息。因此本文只针对图像的60个内部信息特征降维。由图1可以看出,前6个特征的累计贡献率达到了98.9%,故选取前6个特征构成新的特征空间,与之前的8个几何特征组合共计14个特征来对缺陷图像分类识别。

图1 特征矢量贡献率

4 基于改进灰狼算法优化SVM参数的缺陷分类方法

4.1 分类器模型的建立

对于多种缺陷进行分类的问题,可以通过“一对一”方法进行实现,即通过构造N(N-1)/2个分类器实现多分类。N是正整数,表示几种类别。建立“一对一”数据模型解决金属产品上的缺陷分类问题如表1所示。

表1 缺陷“一对一”分类

通过对3种缺陷进行分类识别,并进行两两组合,故需要设计以上3种两类SVM分类器模型,利用测试集分别对这3个SVM分类器进行预测,记录每一个类别的数值,最终选取得票数最多的作为该测试集的的分类结果。

金属产品表面缺陷识别改进GWO-SVM分类器设计步骤如下:

步骤1:对采集的缺陷图像进行数据处理。针对3种类型缺陷进行特征提取操作,应用主成分分析法(PCA)对提取的高维特征进行降维处理,建立SVM训练样本和测试样本;

步骤2:初始化改进GWO算法中的相关参数。采用混沌策略和反向学习方法对狼群进行初始化操作,随机产生初始狼群;

步骤3:保留最优的狼群位置,并通过计算收敛因子a,获得更好的灰狼个体,对适应度值进行升降排序选择位于前3位中α狼、β狼和δ狼对应的值;

步骤4:计算权重的值,并更新灰狼的位置;

步骤5:不断重复步骤3和步骤4,将得到的解与之前的解进行不断比较,直达寻找到最优解或抵达最大迭代值;

步骤6:保留最优狼群的位置以及SVM分类器中对应的c和g的值,建立分类器模型并输出测试结果。

4.2 SVM相关参数优化

选取径向基函数作为SVM的核函数。同时,在分类过程中核函数的参数选取对分类准确率具有重大的影响,故我们通过本章寻优算法(改进GWO)、灰狼寻优算法(GWO)、遗传算法(GA)和粒子群寻优法(PSO)分别对SVM相关参数进行优化对比。通过上述讲解灰狼寻优算法是将种群随机初始化,确定灰狼优化算法的适应度函数,计算距离目标的距离,依据算法原理,寻找最优的适应度值,得到相应的参数c和g的值,避免陷入局部最优。如表2所示,改进GWO算法的分类准确率最高,耗时相比传统的GWO算法来说略长,但基于准确性和稳定性考虑,本章的寻优算法性能最好。

表2 参数寻优结果对比

5 实验结果与分析

5.1 实验对象

获得分类器模型后,利用模型对数据集样本进行测试。本文的研究对象主要是金属产品表面缺陷图像,如图2所示,主要包括划伤、夹杂和孔洞类3种缺陷类型。实验训练集样本总数为180个,其中划伤、夹杂和孔洞类缺陷各60个;测试集样本120个,不同类别样本各40个。

图2 金属产品零件上的缺陷类型(夹杂、划伤、孔洞)

5.2 误差评定指标

本文引入5个误差评定指标分别为精准率(Precision)、召回率(Recall)、综合评价指标F-Measure,标准差和识别率R,利用标准差验证改进GWO-SVM模型的稳定性。定义缺陷的最高识别率R=120%。本文设计了三个“一对一”分类器。即F1、F2、F3。F1表示“划伤与夹杂缺陷”分类器模型;F2表示“划伤与孔洞缺陷”分类器模型;F3表示“夹杂与孔洞缺陷”分类器模型。其中精准率(precision)、召回率(recall)、综合评价指标F-Measure的数学模型为:

(21)

(22)

(23)

式中,TP表示正样本判定为正样本的个数;FP表示负样本判定为正样本的个数;FN表示正样本判定为负样本的个数。

5.3 改进GWO-SVM模型与其他方法对比

与改进GWO-SVM方法相比较的分类器模型包括GWO-SVM模型、PSO-SVM模型、BP神经网络模型。改进GWO优化参数设置:狼群数量N=20,迭代次数T=200;PSO优化参数设置:种群数量N=20,迭代次数T=200,和分别为1.5和1.7;每组数据分别进行10次实验,3种算法的分类识别率结果如表3所示。

表3 3种缺陷类型的分类识别率结果

续表

通过表3可以看出,采用“一对一”方法分类时,以上3种分类器类型在F2中的分类识别率率均可达到100%,误检率为0%。表明在分类划伤与孔洞类缺陷时,分类器类型的不同以及核函数的选取都对缺陷分类效果没有影响。在F1中,相比与其他分类器,提出的改进GWO-SVM识别率也达到了最高,为100%。在F3中,改进GWO-SVM分类模型在夹杂和孔洞类缺陷中均出现了错误识别,但相比与其他模型,改进GWO-SVM的识别率较好为95%。总的来说,提出的改进GWO-SVM模型分类效果较好,平均识别率可达到98.3%。

5.4 分类准确性能分析

通过上述提到的指标进行误差评定,验证结果如表4所示。

表4 实验误差评定结果

通过4可以看出,在F1和F2分类器中,精准率和召回率均达到了最高,即针对正样本划伤缺陷的查准率和查全率为100%,无错分情况存在。在F3分类器中,精准率和召回率都为97.5%,表明没有将所有的正样本夹杂和负样本孔洞类缺陷分类正确。但总的来说,改进灰狼算法优化SVM核参数的方法应用于金属产品上的表面缺陷分类识别是可行且有效的。

6 结论

为了解决金属产品零件上的缺陷分类识别问题,本文针对传统的灰狼优化算法加以改进,相比于其他传统的优化算法,改进的算法在收敛速度和精确度上都有所提高,通过实验验证,该方法应用在金属产品表面缺陷分类识别上具备良好的效果,可为设备的质量及使用性能提供保障;针对SVM模型中的核参数选取是保证算法提高缺陷识别率的关键一步,利用改进的灰狼优化算法对参数寻优,降低了因个人主观因素设置参数造成分类结果不理想的情况;所采用的方法也为金属产品零件表面缺陷分类识别引入了新思想。

猜你喜欢
灰狼分类器样本
学贯中西(6):阐述ML分类器的工作流程
灰狼和山羊
基于朴素Bayes组合的简易集成分类器①
谷谷鸡和小灰狼
一种自适应子融合集成多分类器方法
灰狼的大大喷嚏
规划·样本
灰狼照相
随机微分方程的样本Lyapunov二次型估计
浅谈多分类器动态集成技术