基于CPA-OSELM的热轧带钢厚度在线预测

2022-09-29 10:28肖思竹张飞黄学忠肖雄易忠荣
科学技术与工程 2022年22期
关键词:偏置食肉猎物

肖思竹, 张飞*, 黄学忠, 肖雄, 易忠荣

(1.北京科技大学高效轧制及智能制造国家工程研究中心, 北京 102206; 2.广西北港新材料有限公司技术研究院, 北海 536017; 3.广西柳州钢铁集团公司热轧板带厂, 柳州 545002)

随着社会的发展,各行业对带钢轧制成品的需求量越来越大。在当前市场竞争日益激烈的大背景之下,良好的产品质量有利于企业提升市场占有率以及竞争力。带钢出口厚度是带钢产品质量的重要考核标准之一,其精准控制技术也一直是业界讨论的热点和难点。

热轧的工艺流程主要分为加热、粗轧、精轧、层流冷却及卷取等工序。热连轧测厚仪的实测数据存在滞后,用于带钢的厚度反馈控制时易引起较大误差。因此热轧出口带钢厚度的在线实时预测对于提高产品质量具有重大意义。若能实现出口带钢厚度的精确在线预测,便能对各机架进行及时调整,有效提高带钢厚度质量,提高产品竞争力[1]。

轧件厚度受辊缝预设量、轧机刚度、轧件塑性系数、轧制速度、轧件入口厚度、油膜厚度等因素影响。参数间耦合性较强,影响参数难以全面表达,因此难以建立准确的带钢厚度数学模型[2]。当前带钢厚度控制基本上依靠模型自学习和厚度实测值反馈控制。现有技术可以将4 mm以下规格带钢的厚度预测误差控制在40~50 μm,预测时效性以及精度仍有待提高。在当前工业大数据应用背景之下,依靠机器学习预测算法建立准确的带钢厚度预测模型为解决此类问题提供了新思路。

神经网络具有非线性处理能力强等特性,因此,在过程控制中得到了广泛的应用研究。近年来,有学者先后提出利用改进的神经网络算法实现热轧出口带钢厚度预测精度的提升。张笑雄[3]通过深度置信网络优化最小二乘支持向量机,有效提高厚度预测精度;于加学等[4]通过利用深度神经网络的非线性拟合能力预测带钢头部厚度命中准确率在80%以上。但由于两者的预测手段是离线的,随着训练数据的不断增多,会导致模型的训练时间过长。为了解决这一问题,很多学者提出了在线预测的相关理论与方法[5-7]。Mahdi等[8]通过对不同过程参数进行三维有限元模拟,得出人工神经网络模型可用于轧制过程实时控制的结论;魏立新等[9]提出一种改进在线序列极限学习机算法预测带钢厚度,该算法在训练速度方面具有良好的性能,但是预测精度仍然有待提升。因此,后续有很多学者通过采用智能优化算法改进机器学习模型参数以提升模型预测精度。例如,利用改进麻雀搜索算法[10]、改进鲸鱼算法[11]优化最小二乘支持向量机;采用混合蛙跳等算法优化极限学习机提升模型的预测精度[12-13]。但上述优化算法也存在容易陷入局部最优解以及收敛时间较长等问题。因此,实现快速性好的高精度在线预测是目前面临的技术难题。

极限学习机相比反向传播(back propagation,BP)神经网络、支持向量机等算法,其高效快速的新型单隐层前馈神经网络(single-hidden layer feedforward neural network, SFNN)有学习速度快、泛化性能好、能够实现在线预测等特点。因此本文采用在线顺序极限学习机(online sequential extreme learning machine, OSELM)算法在线预测出口带钢厚度。面对OSELM初始训练阶段随机产生权重和偏置导致预测不稳定问题,运用具有较强寻优能力的食肉植物算法(carnivorous plant algorithm, CPA)对OSELM的权重和偏置寻优,并采用自学习方法进一步提升预测模型精度,实现出口带钢的高精度在线预测。

因此,现提出基于CPA-OSELM的预测模型,通过建立精准的在线预测模型,提升自动厚度控制模型的控制精度,可以应对现有技术面临的精准性不高、快速性较差的在线厚度预测的难题。实现产品质量提高的同时,助推我国节能降耗减排进程。

1 基本算法

1.1 OSELM模型

热轧工艺流程如图1所示。在面对系统反馈滞后、耦合强、厚度偏差大等问题时,采用在线的预测算法是满足厚度在线预测要求中最直接有效的手段。

R1为二辊粗轧机;R2为四辊粗轧机图1 热轧工艺流程Fig.1 Hot rolling process

所谓带钢厚度在线预测,就是在热轧过程中训练样本可以实时更新,预测模型能够快速输出预测的出口带钢厚度,随着工况改变,模型预测值也会做出相应变化。

OSELM模型实现在线训练的特点在于把顺序学习的思想引入极限学习机(extreme learning machine, ELM)算法中。在线学习过程中,模型会及时更新样本数据集以及网络参数,有效解决输入数据增多所导致的训练时间长的问题[14]。

OSELM算法网络结构如图2所示。在初始训练阶段可以通过较少的样本初始化SFNN的输出权重β0,然后进入在线顺序学习阶段,通过每个输入样本迭代调整初始阶段学习到的SFNN输出权重β。

X为模型的输入变量;b为隐藏层偏置;wij为第i个 输入层神经元与第j个隐藏层神经元之间的权重;Y为输出矩阵图2 OSELM网络结构Fig.2 Network structure of OSELM

设构造的网络输入层有r个神经元,隐藏层有l个神经元,输出层有m个神经元。在初始训练阶段,有N0个任意训练样本(xi,ti),其中,xi=[xi1,xi2,…,xir]T∈Rr,ti=[ti1,ti2,…,tim]T∈Rm。

利用传统ELM的思想,具有l个隐藏节点和非线性映射作为激活函数g(x)的SFNN的模型为

(1)

式(1)中:wi=[wi1,wi2,…,wir]T为连接第i个隐藏节点与输入层的权重;bi为第i个隐藏节点的偏置,二者随机产生;xj与tj分别为第j个样本的输入与输出;βi=[βi1,βi2,…,βim]T为连接第i个隐藏节点和输出节点的输入权重。

当β=[β1,β2,…,βr]T为训练数据的目标矩阵,i=1,2,…,r,且隐藏层的输出矩阵H0为

(2)

则矩阵关系为

H0β=T0

(3)

式(3)中:T0=[t1,t2,…,tN0]T。SFNN网络学习的目标是使输出的误差值最小,计算出隐藏层输出后,只需要求解输出层的权重。目标函数为

(4)

根据广义逆的方法,求得满足条件的最小的β0。

β0=H+T0

(5)

(6)

式(6)中:I为单位矩阵。

(7)

1.2 OSELM存在的问题及改进方案

OSELM算法是能够有效解决在线预测问题的方法,其在预测精度以及快速性等方面均具有良好的表现。但是由于算法的初始权重和偏置是随机产生的,所以预测结果并不稳定。因此在确定模型网络结构的基础上,寻找出一组合适的初始权重和偏置对于提高预测精度具有重要意义。优化算法的寻优能力以及收敛速度是在线神经网络预测模型参数寻优的重点关注要素。

1.3 食肉植物算法

CPA是一种新的基于种群的元启发式算法[15]。CPA模拟了食肉植物的吸引、捕获、消化和繁殖过程。能够解决高维设计变量、各种约束存在以及具有多个局部最优解的搜索空间等问题。

CPA从随机初始化一组解决方案开始。将个体分类为食肉植物和猎物,然后根据生长和繁殖过程进行分组。它们适应度值的更新,所有解决方案都将合并。该过程持续迭代,直到满足终止条件。

首先,随机初始化由食肉植物和猎物组成的含n个个体的种群。食肉植物和猎物的数量分别表示为nplant和nprey。每个个体位置在矩阵Pop中的表示方式为

(8)

式(8)中:d为维数;n为nplant和nprey的总和。对于每个个体,通过将个体替换为预定义的适应度函数来评估其适应度。获取的适应度值存储在矩阵Fit中,即

(9)

在式(8)中,每个个体表示优化问题的解向量,式(9)中的适应值表示特定解向量的质量。对于最小化情况,适应值越小,解向量的质量就越高。

在算法的分类与分组阶段,如同对待多种群问题。为减少食肉植物生长所需的大量劣质猎物的可能性,这一阶段对于提高食肉植物的生存能力极为重要。式(8)中的个体适应度值进行升序排序,排序的同时也要考虑最小化问题。排序在前的解被认为是食肉植物,而剩余解是猎物。适应度排序矩阵Sorted_Fit与种群排序矩阵Sorted_Pop描述为

(10)

Sorted_Pop=

(11)

分组过程需要模拟每个食肉植物及其猎物的环境。在分组过程中,具有最佳适应值的猎物被分配给排名第一的食肉植物。类似地,第二和第三级猎物分别被分配给第二和第三级食肉植物。重复该过程,直到nplant级的猎物分配给nplant级的肉食植物。然后,将nplant+1级猎物分配给第一级食肉植物,以此类推。

然后进入算法的生长阶段。由于土壤营养贫乏,肉食性植物为了生长而吸引、捕获和消化猎物。猎物被其甜美的气味吸引到植物身上,但考虑到可能会有部分猎物逃脱食肉植物的捕食。这里,引入了吸引率。每组随机选择一个猎物。如果吸引率高于随机生成的数字,则食肉植物会捕获并消化猎物以供自身生长。新的食肉植物的生长模型Newplant为

Newplanti,j=Gplanti,j+(1-G)preyv,j

(12)

G=G_rate×randi,j

(13)

式中:planti,j为第i级第j维食肉植物;preyv,j为第j维中第i个种群中随机选择的猎物;G为生长率;G_rate为生长率预定义的值。式(13)为生长率的计算方式,其中rand是元素在[0,1]范围内选择的随机矩阵。

在CPA中,每组只有一种食肉植物,而猎物的数量必须超过两种。在大多数情况下,CPA中的吸引率被设定为0.8。如果吸引率低于生成的随机值,则猎物成功逃离。此时食肉植物的生长模型Newplant为

Newplanti,j=Gpreyu,j+(1-G)preyv,j

(14)

(15)

式中:preyu,j为第j维中第i个种群内随机选择的另一个猎物;preyu与preyv为同一种群的两个不同的随机猎物,u≠v。食肉植物和猎物的生长过程都是重复的,直到达到设定的迭代值。

式(12)和式(14)用于将新解引导到具有高质量解的搜索空间。为了确保这也适用于猎物的生长,引入式(15),因为preyu的质量可能比preyv差。在式(12)中,可以看出算法受增长率的影响。增长率越高,勘探范围就越广,因此必须选择合适的增长率。

在食肉植物繁殖过程中,食肉植物从猎物身上吸收养分,并利用这些养分进行生长繁殖。只允许排名第一的食肉植物繁殖,即种群中的最佳解决方案。确保了CPA只关注最佳解决方案,节省计算成本。排名第一的食肉植物的繁殖过程表示为

Newplanti,j=plant1,j+breed_rate×randi,j×matei,j

(16)

(17)

式中:plant1,j为最佳解决方案;plantv,j为在j维随机选择第v级的食肉植物;繁殖率breed_rate是预定义值,matei,j用来协调不同情况下的计算参数,planti与plantv分别表示第i级与第v级食肉植物,i≠v≠1。在繁殖过程中,为每个维度j都随机选择一个食肉植物v。在生长过程中,无论第j维度是什么,都会随机重新选择猎物。

最后是食肉植物算法的重组过程,新产生的食肉植物(生长过程与繁殖过程的个体)和猎物与原始种群相结合,形成一个新的种群。随后,根据适应度值按升序对这组新个体进行排序。然后从该组中选择排名前N的个体作为新的候选解决方案。

重复分类、分组、生长和繁殖过程,直到满足停止条件。

2 数据处理及在线预测模型设计

2.1 数据预处理

为实现热轧出口带钢在线测厚,数据的正确选取直接决定预测结果的精准度[16]。通过对热轧工艺原理分析,选定出口厚度相关数据包括:各机架轧制力、辊缝、轧制温度、轧机轧制速度、产品宽度、轧制电流等相关参数。

经分析,需要预先将导出的带钢数据进行时空坐标转换,即将以时间为维度的数据转换成以长度为维度的数据,再取数据放入样本点进行学习预测,此过程也可称作数据的对齐处理。首先将采集到的带钢厚度相关数据按照一定长度分成若干段,段内数据取均值作为预测模型的训练样本数据。值得注意的是,在生成训练样本数据的过程中,需要结合设备间距以及轧件变形状态,通过换算实现相关参数和厚度数据的对齐。

由于提取的特征数据之间存在较大的数量级差异,为了减小量纲带来的误差,需对数据标准化处理。本文利用最小-最大标准化方法进行归一化计算:

(18)

式(18)中:x为原始样本;x′为处理后的样本;mA和MA为特征的最小值和最大值。

样本数据经过线性变换,保持原始数据值之间的联系。同时因为相关特征参数较多且相互耦合,借助降维手段简化模型输入,提升模型效率。经过样本数据预处理,最终确定模型的影响因子共40组。

2.2 OSELM与自学习集成预测模型设计

OSELM为单隐层前馈神经网络,本文结合数据处理结果,在模型输入层设置40个节点,输出层设置1个节点,经调试,设置隐含层25个节点。

利用经验公式先将隐藏层节点数控制在合理的范围内。常用的经验公式为

(19)

l=log2r

(20)

(21)

式中:l为隐藏层节点数;r为输入层节点数;m为输出层节点数;α为常数,取值在1~10范围内。

在获得神经元个数合理范围的基础上,采用删除法进行数值实验,结果表明,当隐藏层神经元数量为25时模型预测性能最好。

单隐层神经网络存在非线性映射能力较差的问题,难以表达影响带钢厚度参数与预测目标之间的复杂非线性关系,加入激活函数可以有效地解决这个问题。参考文献[17]与模型调试,选用Sigmoid函数为隐含层的激活函数,Relu函数为输出层的激活函数,这种组合形式可以使神经网络能够有效地逼近任意连续函数。模型结构如图3所示。

利用测厚仪滞后特性,在建立OSELM预测模型的基础上,采用自学习方法对预测模型不断修正,提高预测精度[18]。若当前样本点的预测值误差较大,那么模型会通过自学习的方式进行及时调整,使下一个预测采样点预测误差适当降低。自学习方法如式(22)所示:

(22)

式(22)中:Yi为第i个采样点的厚度预测值;Ai为第i个采样点的实际厚度值;α为自学习系数,取值范围在0~1。

在轧制过程中,随着采样点真实数据的逐个输出,自学习系数将会被完善,并用于修正预测模型。使模型体现较好学习效果的同时,也提高了预测精度。OSELM与自学习集成模型流程如图4所示。

图3 OSELM模型网络结构设置Fig.3 Structure setting of OSELM model network

图4 集成模型流程Fig.4 Integrated model process

2.3 基于CPA-OSELM与自学习的预测模型设计

由于OSELM算法的初始权重和偏置是随机产生的,因此算法稳定性的提高极为关键[19]。在现有优化算法中,CPA算法收敛能力强,能够解决高维问题与多约束问题。因此利用CPA算法对OSELM的权重和偏置寻优,可实现精准且快速地在线预测。

CPA算法将预测偏差作为目标函数,对OSELM的权重和偏置寻优。CPA优化OSELM权重与偏置流程如图5所示。

图5 权重与偏置的优化流程Fig.5 Optimization process of weight and bias process

3 算法仿真与性能验证

本节数据来源于某钢厂数据库中热轧带钢历史数据,运用ibaAnalyzer软件进行分析。选定影响带钢出口厚度的相关参数共40维,包括各机架轧制力F、辊缝S等。实验环境为Win10系统下CPU为i5-10210U,GPU为MX350,内存16 GB的计算机,所用编程语言为Python 3.7,深度学习框架为Tensorflow 1.14。

3.1 算法评价指标选择

本节的目标是在调试模型参数,预测热轧多规格带钢的出口厚度,属于定量分析,因此在评判指标上本文使用均方根误差(root mean square error, RMSE)、平均绝对百分比误差(mean absolute percentage error, MAPE)及标准差σ。

(23)

(24)

(25)

式中:q为测试集样本数;yp为预测厚度值;ya为厚度实际值。可以通过以上几种指标来评估模型的预测精度,RMSE、MAPE及σ越小,反映预测结果越好。

3.2 实验设计及结果分析

从ibaAnalyzer软件提取出5块4 mm 带钢数据进行实验分析,将训练集和测试集数据比例设置为4∶1。数据预处理实现采样点经过各机架的参数对齐。由于带钢各部分的性能不同,为更直观清楚地评估预测结果,将测试集带钢的尾部数据提取出216个采样点进行预测。OSELM模型预测带钢尾部厚度的结果如图6所示。

图6 OSELM模型的预测效果图Fig.6 Prediction effect diagram of OSELM model

图6为OSELM模型的预测结果,在预测4 mm带钢时,模型误差在75 μm范围内。

但是OSELM初始阶段的权重和偏置是随机产生的,模型预测稳定性较差。针对上述问题,采用CPA、粒子群算法(particle swarm optimization, PSO)及改进的粒子群算法(improved particle swarm optimization, IPSO)分别对OSELM的权重和偏置寻优。比较OSELM、CPA-OSELM、PSO-OSELM及IPSO-OSELM 4种预测模型的预测效果。预测效果对比如图7所示。

由图7可知,利用优化算法求解OSELM的最优权重和偏置,可有效提升模型稳定性问题。为更直观地证明OSELM与优化算法结合的有效性,将多次预测后的评价指标结果的平均值进行对比,对比结果如表1所示。

上述结果证明,基于CPA-OSELM算法的预测精度和稳定性优于其他算法,在预测4 mm带钢尾部厚度时,RMSE可控制在为20 μm以内。

再次将CPA、PSO、IPSO三种优化算法的寻优能力与收敛速度进行对比。将RMSE作为目标函数,三种优化算法对OSELM的收敛效果如图8所示。

由图8可以看出,经过多次参数的调试与收敛结果对比,CPA无论收敛速度还是寻优能力都具有较强优势。基于CPA-OSELM的预测算法可以实现快速性较好的高精度在线预测。

图7 模型预测效果对比图Fig.7 Comparison chart of model prediction effect

表1 预测模型性能对比表Table 1 Performance comparison table of prediction model

通过观察图7的预测效果,学习效果还需进一步提升。通过加入自学习方法,调节自学习参数以应对上述问题,进一步提高预测精度。基于CPA-OSELM与自学习集成的预测结果模型如图9所示。

图9可直观地观察出,加入自学习方法后,模型的预测性能更加稳定,预测精度也有所提升。分别将CPA-OSELM、PSO-OSELM、IPSO-OSELM几种预测模型与自学习方法结合,对4 mm带钢尾部的出口厚度预测,预测效果如图10所示。

为了更直观地检验上述几种综合模型的在线预测效果,对比加入了自学习方法的几种预测模型的各评价指标,效果对比如表2所示。

表2中,CPA-OSELM与自学习方法简写成CPA-OSELM&SL,其他模型名称简写方式同理。

从表2可以看出,基于CPA-OSELM和自学习的集成模型可以快速在线预测出4 mm带钢尾部的出口厚度,RMSE在20 μm以内。预测精度和速度均优于其他预测模型。同时,通过表1和表2的比较,可以更直观地验证自学习方法的有效性。

图8 优化算法收敛效果对比图Fig.8 Comparison of convergence effect of optimization algorithm

图9 集成模型的预测效果图Fig.9 Prediction effect diagram of integrated model

为了验证模型对不同钢种不同规格带钢出口厚度预测的有效性,从ibaAnalyzer软件提取出3 mm和9.2 mm规格的历史带钢数据进行实验分析,训练集和测试集数据比例为4∶1。将预处理后的数据放入建立的CPA-OSELM与自学习预测模型中,并与其他模型对比预测效果。3 mm和9.2 mm带钢尾部出口厚度的预测效果对比结果分别如表3和表4所示。

图10 模型预测效果对比图Fig.10 Comparison chart of model prediction effect

表2 预测模型性能对比表Table 2 Performance comparison table of prediction model

表3 3 mm带钢预测模型性能对比表Table 3 Comparison of prediction effect of 3 mm

表4 9.2 mm带钢预测模型性能对比表

由此,可得出结论,基于CPA-OSELM的预测算法相比其他算法,可实现快速性更好、精度更高的在线预测。同时该方法也适用不同规格的带钢出口厚度预测。

4 结论

针对热轧带钢厚度在线预测问题,提出了一种基于CPA-OSELM的热轧带钢出口厚度在线预测模型,能够实现快速且精准的在线预测,得出如下结论。

(1)OSELM模型能够对带钢出口厚度进行快速精准的在线预测,很好地解决了热轧生产过程中测厚仪滞后的问题。在线预测结果可以作为参考依据对各机架进行即时调整,有助于现场带钢厚度控制精度的提升。

(2)CPA算法在寻优能力和收敛速度上均有很好的表现。经过CPA优化的OSELM预测模型在预测精度、稳定性和快速性方面均有显著提升。预测4 mm带钢尾部出口厚度时,RMSE可控制在20 μm以内。

(3)加入自学习方法,在增强学习效果的同时,进一步提升了在线预测模型的预测精度和稳定性。

综合来看,本文提出的基于CPA-OSELM的在线预测模型,在热轧出口带钢厚度在线预测方面具有快速性好、预测精度高的特点,且适用于不同规格钢种带钢出口厚度的预测。根据在线预测结果可以及时对各机架进行调整,从而有效提高带钢质量,在满足热轧生产需求的同时,具有比较突出的现实意义。

猜你喜欢
偏置食肉猎物
喷锡钢网曲线偏置方法研究
基于40%正面偏置碰撞的某车型仿真及结构优化
基于双向线性插值的车道辅助系统障碍避让研究
蛙类捕食“神器”
三木落
某越野车小偏置碰撞结构优化
Meat-eating plant discovered in Canada加拿大发现食肉植物
可怕的杀手角鼻龙
聪明误
看看你是不是天生“食肉瘦” 解开DNA之谜&重回瘦身正轨!