基于支持向量机的磨削表面烧伤识别研究*

2021-09-15 08:35孙为钊程庐山
计算机与数字工程 2021年8期
关键词:样本量纹理准确率

孙为钊 程庐山 周 俊

(上海工程技术大学机械与汽车工程学院 上海 201620)

1 引言

近年来,随着产业改革的深入进行,以往追求数量的运营方式已经无法适应现代需求,企业纷纷从追求数量模式转变到追求数量和质量并重的模式。为了提高零件的产量以及质量需要精确掌握磨削时的温度,在温度过高时及时采取措施,减少损失。

磨削加工是现代机械制造业实现精密加工和超精密加工的基本工艺技术。由于磨削过程持续的时间较短且加工的金属层较薄,磨削过程中产生的热量大部分会集中在磨削区内,在工件表面形成局部高温,当温度超过临界值,就会引起表面热损伤。在加工时烧伤的零件,内部的金相组织发生氧化,还会产生裂纹,表面材料脱离机体的现象[1],表层硬度下降,影响零件性能。

针对金属磨削烧伤问题,国内外的研究者做了大量的研究。刘晓初[2]等对GCr15轴承钢进行了不同砂轮速度、工件速度下的磨削试验,研究结果表明:烧伤会增加工件表面粗糙度,并分析了合适的加工参数,为避免发生磨削表面烧伤提供了参考依据。黄新春[3]等针对高强度钢AerMet100的磨削烧伤问题,在大量实验的基础上建立了磨削力和磨削温度关于磨削参数的回归经验模型,为Aer-Met100的磨削烧伤测试和控制提供了理论指导。易茜[4]通过对彩色CCD图像的研究将颜色特征用于烧伤等级的判断,取得了比较满意的结果。王延忠[5]等进行了18CrNi4A材料齿轮磨削加工试验,验证了有限元仿真分析的可信性。Lin[6]等对钢轨钢U71Mn进行磨削试验研究,发现钢轨磨削烧伤的实质是磨削温度的升高引起表面氧化的加剧和有色金属氧化物的积累。A.O.Odior[7]提出了一种利用神经网络和模糊技术进行磨削过程的控制系统,使用神经模糊模型来控制磨削过程,使磨削过程在可接受的温度下获得最大的输出功率,最大金属去除率,不会导致工件烧伤。

支持向量机(Support Vector Machine,SVM)是一种经典的机器学习模型,以其处理小样本以及强大的分类能力在人像识别、文本分类、笔迹识别等领域取得了突破性进展,但目前在机械加工方面的应用研究仍然不多。本文提出基于SVM的磨削烧伤识别模型,希望能够准确识别不同的烧伤类型,对SVM识别模型应用到实际生产加工中有一定的理论指导作用。

2 磨削烧伤理论以及判别方法

磨削加工主要有三个阶段:滑擦、耕犁和形成切屑。磨削产生的热量是在这三个阶段由能量转变而成。大多数磨粒以负前角进行切削,因此在非常高的磨速下,磨削区内产生的瞬时高温改变了金相组织,使某些部分出现变色现象,这就是磨削烧伤[8]。烧伤可以根据不同的参照分为很多类型,根据外观不同,可分为斑状烧伤、条状烧伤、全面烧伤;根据表层显微组织的变化可分为回火烧伤、退火烧伤、淬火烧伤[9]。

判别烧伤的方式主要有目测法、酸洗法、显微硬度法等。其中,目测法依据烧伤工件表面所呈现出的颜色深浅来鉴别烧伤程度。酸洗法使用酸性溶液清洗烧伤表面,然后依据显示出的颜色鉴别烧伤程度。显微硬度法根据烧伤后的工件表面显微硬度的变化来评价烧伤程度,烧伤越严重,显微硬度下降越多。

3 磨削烧伤图像特征提取

磨削烧伤后的工件表面除了会显示出不一样的颜色特征还会显示出纹理特征,通过提取这些特征表示不同类型的烧伤,使用支持向量机对提取的特征进行训练进而能够判断出是某种类型的烧伤。

3.1 颜色特征的提取

在图像颜色特征提取的众多方法中,由于颜色矩特征具有维数低和图像颜色信息主要存在于低阶矩中的特点,本文故采用三阶颜色矩法提取烧伤图像颜色特征。其三阶矩公式定义如下[10]:

其中,i为彩色图像颜色通道,共有三个通道,即红绿蓝(RGB)三通道;j为图像的灰度值;μi值为彩色图像i通道下的一阶颜色矩,σi为二阶颜色矩,Si为三阶颜色矩,P为彩色图像第i个颜色通道分量中灰度为j的像素出现的概率,N为图像像素总和值。

3.2 纹理特征的提取

图像中纹理特征实质是反映图像中轮廓线条的粗细、方向、间距等数学统计量,由于灰度共生矩阵计算较简便,并且它可以较完整的保存图像局部纹理特征,故本文将灰度共生矩阵作为纹理特征的特征量。下面是四个有效且最常用的公式来表示灰度共生矩阵[11]。

1)能量:

其中,i与j为图像像素矩阵位置,d为像素的灰度空间距离,θ为图像纹理生成的方向,q为图像上位置关系为d的灰度分别为i,j的两个像素出现的次数。能量代表了图像纹理的粗细程度,图像纹理越粗,ASM较大;反之,ASM较小。

2)熵:

熵代表了图像信息含量的多少,图像中纹理越模糊,则熵值越小;反之,图像含有越多清晰的纹理,则熵值越大。

3)对比度:

对比度代表图像纹理清晰的程度。图像中纹理的沟纹越深,则对比度值CON越大,图像纹理是越清晰。反之,对比度CON越小,图像纹理越模糊。

4)相关性:

将能量、熵、对比度以及相关性作为磨削烧伤的图片纹理特征描述,磨削烧伤图像纹理特征量确定为以下表示:

3.3 全局纹理特征的提取

为增加图像一个全局特征维度,使提取特征能够更准确表达图像纹理特征。将颜色矩提取的三个特征数值与灰度共生矩阵提取的四个特征数值累加,得到一个新的纹理全局描述特征,表达式如下表示:

4 支持向量机理论及模型

磨削加工过程是复杂的非线性过程,充满了变化。简单的线性方法很难判断是否发生烧伤。支持向量机的预测模型具有解决有限样本、非线性及高维识别问题的优势[12],在机械加工方面使用仍然较少。本文探讨支持向量机理论在磨削烧伤方面的应用。

4.1 支持向量机模型

支持向量机是一种广义的线性模型分类器,其主要功能是对数据进行二元线性分类,因其出色的分类能力而被应用于各个领域。SVM模具有较高的分类精度以及很好的泛化性[13]。

4.2 SVM的分类算法步骤

对于分类问题,支持向量机具体的学习算法步骤如图1所示[14]。

图1 SVM算法步骤

4.3 图像数据库的建立

为保证高质量的训练样本库,采用单纯磨削烧伤图像作为样本,即包含未烧伤、斑状烧伤、线条烧伤、全面烧伤四种类型的图像。为此,选取符合条件的图像作为磨削烧伤图像样本建立磨削烧伤图像样本库。

图像样本库包括上述四类样本各1000幅图像,共计5000幅样本。部分图像样本展示如表1所示。展示样本对应特征值如表2所示。

表1 烧伤图像样本库示意图

如表2所示,黄色标记的特征值是未烧伤图的全局纹理特征SUM值,是四类磨削烧伤图SUM值中最大的数值,所以可以通过全局纹理特征SUM将未烧伤图从图像数据库中分类提取出来;绿色标记的特征值是全面烧伤的一阶颜色矩,是四类磨削烧伤图值中最小的数值,所以可以通过一阶颜色矩值将全面烧伤图从图像数据库中分类提取出来;此时还剩下斑状烧伤图和线条烧伤图两类需要进行区分,可根据三阶颜色矩S特征值与对比度CON特征值将剩下的这两类进行区分识别。较好的特征量选取是图像识别准确率的保障,根据表2中的特征数据值可以主观地进行磨削烧伤图像的分类识别,这也进一步证明本文所提取图像纹理特征的有效性。

表2 展示样本对应特征值

5 磨削烧伤图像分类模型建立与分析

在SVM模型中,高斯核函数的作用是将原始数据空间映射到无限维空间,高斯核函数因子g取值越小,模型分类就越细致,但会出现过拟合问题。惩罚因子c的作用是权衡训练风险与模型结构风险,惩罚因子c越大,则训练风险越小,模型结构风险越大,会存在过拟合问题;反之,则存在欠拟合问题[15]。综上所述的模型参数取值问题,采用网格搜索寻优算法寻找最佳的惩罚因子c,高斯核函数因子g。

考虑到模型训练耗时问题,采取随机抽样的方法来寻取最优的参数,即在建立好的磨削烧伤图像库中的四类烧伤图片分别随机抽取100张图像共计400张作为寻优的图像集。网格搜索寻优结果如表3所示。从表3中可以看出,当惩罚因子c=16,高斯核函数因子g=0.6时,模型训练准确率为最高的92.76%。

表3 SVM模型参数网格寻优

其次,基于最佳的惩罚因子c和高斯核函数因子g,在不同数量的样本图片下进行SVM模型训练,可得到多个分类模型,并对这些模型进行训练准确率的测试,分析SVM模型的准确率随着样本量的不同而发生的变化的情况;最后,选择最高训练准确率的模型作为磨削烧伤图识别模型,用于对未训练的烧伤样本的识别分类。具体过程如下:

1)对不同类型的磨削烧伤图像进行标记:未烧伤为1,斑状烧伤为2,线条烧伤为3,全面烧伤为4。将磨削烧伤图像的的不同类别的特征值提取出来形成特征数据值库;

2)利用寻找的最佳惩罚因子c和高斯核函数因子g作为初始训练参数对数目不同的样本烧伤图片进行训练,并建立分类模型。将训练样本分别从四类烧伤图像中随机抽取相同的数目,各训练模型样本量设置为200张、500张、1000张、1500张和2000张烧伤图像五组;

3)五组SVM烧伤图像的SVM模型建立完成后,对其进行训练并测试,得到训练精度。得到的结果如表4所示。

表4 烧伤图像分类模型性能

由表4可知,在2000到500幅时,随着样本数量的减少,识别的准确率却呈上升的趋势。在样本量为2000时总体的识别率最低,而当样本量为500时总体的识别率最高。这是因为当样本量为2000时数据量较大时,训练计算量太大,有较多支持向量,导致数据偏斜,模型决策函数得到的超平面过拟合,影响准确率。而当样本量为500时数据量既不大也不小,计算量也不会太大,不会出现数据偏斜的情况,所以准确率最高。当样本量为200幅时,数据量太小,样本包含的信息过少,模型泛化性较低,在训练时能很好地分类,但在测试时准确率却比较低,因此选择合适的样本量能够提高模型识别准确率。

6 结语

本文提出了基于支持向量机的磨削烧伤图像分类模型,通过不同样本量对模型进行训练及测试。结果表明:

1)建立烧伤类型丰富的图像库是图像精确识别的基础,提取不同类型烧伤的特征构建烧伤图像特征库,可以保证样本库的质量和纯度。

2)四种烧伤图像的纹理特征量值之间有所重叠,经过计算,只需8个特征量可以保证模型识别准确度。

3)利用网格搜索算法得到最佳的初始参数后建立的烧伤图像分类模型性能优越,烧伤图像识准确率有很大的改善。

猜你喜欢
样本量纹理准确率
一种基于进化算法的概化理论最佳样本量估计新方法:兼与三种传统方法比较*
植株样本量对云南松子代苗期遗传力估算的影响
临床研究样本量的估计方法和常见错误
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
肺纹理增多是病吗?
童梦
TEXTURE ON TEXTURE质地上的纹理