基于RFE-DNN的烧结矿性能预警模型

2023-10-10 01:52李福民董钰泽刘小杰米舰君
冶金能源 2023年5期
关键词:质量指标数据仓库特征参数

李福民 董钰泽 刘 颂 刘小杰 米舰君 吕 庆

(1.华北理工大学冶金与能源学院,2.唐山学院人工智能学院,3.唐山钢铁集团责任有限公司炼铁事业部)

在铁前生产中,烧结矿成本占总成本的50%以上[1],因此做好烧结矿性能的预警工作对于降低生产成本、提高产品质量和企业效益意义重大。钢铁智能制造是钢铁行业的发展趋势,其核心是通过信息化与智能化等现代计算机技术手段,对钢铁制造流程中的工艺、生产与检测等进行优化与调整,将传统工艺的优势与信息化技术的长处相结合,提高生产效率、协同性与准确率,实现生产管理的标准化、精细化和稳定化[2]。

目前,国内外对烧结矿性能的预测模型研究[3-12]主要是结合大数据技术与烧结工艺理论对烧结矿质量指标与化学成分进行预测,但其中大多数研究只注重算法的精度与单一指标预测,对烧结矿复杂的性能指标评价不够系统,且与实际生产情况联系不够紧密,未能对实际生产起到实质性指导作用。文章提出了一种烧结矿性能预警模型,在提升模型稳定性与准确性的基础上对多个烧结矿重要指标进行系统化预报。

1 数据预处理与烧结数据仓库的搭建

某钢厂铁前数据库中原始数据量庞大且存在大量空值、重复值与异常值,直接使用原始数据建立模型的效果可能并不理想,因此要对原始数据进行预处理,并搭建可直接抽取数据用于建立预测模型的烧结数据仓库。文章基于某钢厂2020年1月至2021年12月铁前数据库搭建烧结数据仓库,首先从钢厂铁前数据库中导出1 800多万条铁前生产数据,将这些数据导入本地SQL Server数据库,并用连接视图的方法将烧结物料所对应的时间、名称、ID号等相关主键关联,然后导出预测模型所需的烧结数据表,整合后得到特征参数68个、数据600万余条。特征参数名称如表1所示。

表1 特征参数名称

由于特征参数之间的数量级相差较大,所以要将数据进行规范化处理,将其缩放入一个特定的区间,有助于图形的比较与分析。文章使用Z-score标准化原理,运用Scikit-Learn中的StandardScaler函数在Python环境中实现。

将数据进行标准化处理后,依据箱线图算法与现场经验对数据中的空值、重复值与异常值进行消除,最后在SPSS中运用线性差值填补法进行填补,降低数据质量对模型精度的影响,完成数据预处理。

在对烧结数据预处理后,针对烧结体系的整体业务将烧结数据仓库模型设计为3层,分别为贴源层(ODS)、整合层(UDM)、应用层(RPT)。

从不同数据源采集对接原始数据,数据缓冲服务将原始数据暂存在本地存储,通过JDBC、API等形式导入贴源层。贴源层保存着全量数据的原始形式或简单处理后的形式,作为所有上层结构的数据源。贴源层结构设计简单,一般以数据来源或业务大模块划分。

整合层直接面向不同分析需求工艺,将数据划分为历史数据查找、相对状态比对、类似结果分析等主题。为用户提供统一数据归集和信息视图,使用户能够全面且精确地触达各个业务线。整合层设计以应用直接驱动为主、数据驱动为辅的原则,多采用反范式化设计,便于业务上的理解以及使用的便捷。

应用层的设计目的是打通数据仓库和烧结体系自建业务系统之间的数据通道,实现数据的可靠存储、高效流转和充分利用。同时设计面向烧结体系内改变工艺条件时历史数据分析的工艺指标,让用户或相关系统、应用能够以最便捷的方式提取指标数据,实现关键数据最高效的分析、应用,完成数据仓库的搭建。

2 烧结矿性能预测模型的建立

在烧结数据仓库建立之后,对烧结矿的质量指标与化学成分进行特征选择与建模预测。烧结矿性能指标对铁水成分、产量和炼铁工艺流程的经济利益具有直接影响,但烧结矿性能指标的检测存在大时滞性,不能够及时地向现场工作人员反馈[13]。为了获得高精度的应用预测,文章采用RFE-DNN算法来建立烧结矿质量指标与化学成分的预测模型。

2.1 RFE与DNN

递归消除特征法(Recursive Feature Elimination,简称RFE)使用一个基模型来进行多轮训练,每轮训练后,消除若干权值系数的特征,再基于新的特征集进行下一轮训练。首先,在原始特征上训练模型,每个特征得到一个权重。之后,那些拥有最小绝对值权重的特征被踢出特征集。如此往复递归,直至剩余的特征数量达到所需的特征数量。

深度神经网络(Deep Neural Networks,简称DNN)是一个多层神经网络模型,具有深层次、非线性及提取逐层特征等特点[14]。DNN根据节点在网络中的位置可以分为输入层(input layer)、隐含层(hidden layer)和输出层(output layer),其基本结构如图1所示。相较于其他算法模型,DNN拥有不俗的稳定性、很强的建模能力及超强的非线性拟合能力与泛化能力。

图1 DNN基本结构

2.2 烧结矿化学成分的预测

对烧结矿化学成分的预测,主要选择V2O5、CaO/SiO2、TFe和FeO含量的预测[15]。首先在Python环境下运用RFE对相关特征参数做特征分析,得到与V2O5、CaO/SiO2、TFe和FeO的烧结矿主要化学成分相关参数的分布,其次剔除每个目标值相关系数最小的10个特征参数,去除了2个冗余度量,得到56个有用维数作为每种成分预测模型的输入参数,然后对输入参数与预测参数进行相关性分析,得到相关性排序,前10的参数如表2所示。然后对V2O5、CaO/SiO2、TFe和FeO依次运用DNN算法建立烧结矿化学成分预测模型,DNN预测模型预测评价结果如表3所示。DNN预测V2O5、CaO/SiO2、TFe和FeO的R2分别达到0.965 8、0.824 7、0.846 2和0.871 1,模型能够对烧结矿化学成分进行精准预测。

表2 烧结矿化学成分与输入参数的相关性排序

表3 基于DNN预测模型评价结果比较

2.3 烧结矿质量指标的预测

对烧结矿质量指标的预测,主要是物理性能的转鼓指数与筛分指数的预测[16]。首先运用RFE对特征参数做特征分析,剔除多余数据,得到46个特征参数,其次根据特征分析结果结合Pearson相关系数法做相关性分析,从46个特征参数中分别选出相关性最好的11个和17个特征参数作为转鼓指数和筛分指数回归模型的输入参数集,其重要性排序如表4所示。

表4 转鼓指数与筛分指数的输入参数集

然后运用DNN算法建立烧结矿质量指标预测模型,通过模拟实际生产环境对转鼓指数和筛分指数的最优回归模型进行了测试,结果如表5所示。由表5可知烧结矿质量指标的预测值与实际值变化趋势基本一致,转鼓指数和筛分指数回归模型的R2分别达到0.899和0.875,模型精度满足了预测要求,可以用于实际生产预测。

表5 转鼓指数和筛分指数回归模型的测试结果

3 烧结物料预警区间的整合

在整理某钢厂铁前数据库中烧结物料的预警区间时,发现许多烧结物料的预警区间为空值(Null)。

由于烧结物料种类复杂,且每个厂家供应的原料成分配比各不相同,单个物料种类的成分含量对产品质量的影响难以测定,所以对部分烧结物料成分的检测结果进行预警还多以传统经验人工判断为主,导致部分烧结物料的预警区间无法确定,产生预警区间空值。企业没有建立符合生产需求的预警系统,导致部分产品质量的判断不及时,并且没有对原料质量偏低的厂家进行记录,无法对原料的采购做指导参考。针对以上问题,结合烧结物料成分的检验结果、传统人工经验与大数据技术,对预警区间的空值进行填补与整合。

先将SQL Server中的烧结物料表与生产厂家表进行视图连接,再运用Spark Streaming框架与传统工艺经验对数据进行时间频次统一,然后运用箱线图算法剔除异常值,再通过Python的Groupby函数对数据表进行分类与最大值、最小值处理,极大地压缩了数据表的大小,同时有序归纳数据,提高了数据表的可读性与可视性。经处理后,检验结果形成一个数据区间。最后结合现场人员的经验与边界分析对区间的合理性进行确认,将所得区间作为预警区间,填补了预警区间的空值,完成了烧结物料预警区间的整合,处理结果如表6所示。

表6 处理后某钢厂烧结物料预警区间(部分)

4 烧结矿性能预警模型的建立

结合烧结数据仓库、烧结矿质量指标和化学成分预测模型、烧结物料预警区间与钢厂实际需求,运用JavaScript将烧结矿性能预警模型可视化。在烧结物料性能预警界面,对烧结物料性能进行监测,当监测结果超出预警区间时报警,实时记录报警的物料信息(设备编号、物料名称、检测项目、生产厂家、检测结果和日期),并以月为周期,统计烧结物料与生产厂家报警次数,使现场工作人员更加直观、及时地掌握报警信息。

在搜索与修改界面,模型根据物料名称与检测项目的输入检索,展示某种物料的生产厂家和该物料检测项目预警范围的信息,并可以根据企业需求对物料预警范围进行修改。模型也对历史报警记录提供了搜索功能,可以根据物料信息对历史报警记录进行检索,并在仅搜索物料名称时展示该物料所有生产厂家的报警次数排序。

在烧结矿性能预警界面,根据实时监测数据,实时预报相关质量指标与化学成分,将预报值与实际值组成折线图,更加清晰地显示物料质量与成分的波动。

根据波动频次、历史报警记录与企业原料采购需求,对烧结物料的采购提出指导方案。首先计算得到该物料的当月报警率,将化学成分与质量指标的报警等比重看待,然后对报警率超出给定标准的厂家的原料进行减采计算,减采率给定指导标准如表7所示。

表7 烧结物料减采指导标准 %

报警率与减采率的计算公式如下:

p=x/m

(1)

pi=3p2+p/20

(2)

式中:p为报警率;x为该物料当月报警次数;m为所有物料当月总报警次数;pi为减采率。

对于减采的烧结原料,使用与烧结原料成分相同或接近且在排序中报警次数最低的其他厂家烧结原料进行补充,以此不断改善生产所需的烧结原料的品质,进而提升了烧结矿的质量。

5 结论

(1)收集某钢厂铁前数据库近两年生产数据,运用SQL Server视图连接主键的方式得到所需要的烧结数据表,采用Z-score标准化原理,消除不同量纲和数量级导致的不良影响,得到规范数据。采用箱线图算法清洗不符合数据规律的空值、重复值与异常值,得到能反映实际生产状态的准确数据,建立了用于模型预测的烧结数据仓库。

(2)运用RFE特征选择法对烧结数据仓库中的烧结生产参数进行特征选择与相关性分析,并运用DNN算法构建烧结矿化学成分与质量指标的预测模型,预测值与实际值的对比结果和性能指标表明模型的精度满足了预测要求,可以用于实际生产预测。

(3)根据某钢厂烧结物料预警区间部分空缺的问题提出了一种预警区间填补与整合的方法,通过大数据技术确定了烧结物料的合理性能范围,并将其整合为烧结物料预警区间。

(4)基于烧结矿性能预测模型与烧结物料预警区间建立了烧结矿性能预警模型,运用JavaScript技术将模型可视化,结合企业需求通过三个界面展示烧结矿性能的监测及预警,通过报警率计算与报警次数排序给出采购指导方案。

猜你喜欢
质量指标数据仓库特征参数
故障诊断中信号特征参数择取方法
基于特征参数化的木工CAD/CAM系统
基于数据仓库的住房城乡建设信息系统整合研究
茶叶籽油精炼工艺条件对其质量指标的影响
基于PSO-VMD的齿轮特征参数提取方法研究
分布式存储系统在液晶面板制造数据仓库中的设计
探析电力系统调度中数据仓库技术的应用
临床检验检验前质量指标的一致化
基于数据仓库的数据分析探索与实践
统计特征参数及多分类SVM的局部放电类型识别