基于深度学习的离散智能车间订单完工时间预测方法

2022-11-21 06:41郭鹏昕苏睿驰何泽吴磊马懿靖

机械工程师 2022年11期

郭鹏昕，苏睿驰，何泽，吴磊，马懿靖

（1.合肥工业大学管理学院，合肥 230009；2.合肥工业大学机械工程学院，合肥 230601）

0 引言

在智能制造快速发展的时代，离散化生产是未来中小企业发展的主流，准确预估订单完工时间，有助于制定合理的生产计划，有利于按时完工交付，从而提高企业信誉度。参考现有文献，当前订单完工期预测问题，朱海平等[1]提出了一种经验回归预测方法，构建车间生产过程的高级Petri网仿真模型；V. Vinod等[2]对交货期分配方法与调度规则之间的关系进行了研究，利用仿真结果开发了元模型；申建红等[3]综合考虑了工期的不确定性及相关性，结合Shapley值函数与仿真技术建立工期预测模型；王燕青等[4]在实时作业车间基础上考虑了用RBF神经网络搭建预测模型；刘道元等[5]建立了一种基于DBN-DNN的离散制造车间订单完工期预测模型，并在回归预测模型中加入dropout和L2正则化以提高泛化能力；Chen等[6]在对晶圆加工周期进行预测时，采用了BP神经网络,实现一定程度的深度学习。

在目前的预测方法研究中，深度学习已成为主流方法。本文建立了基础的可扩展性强的深度学习模型，可以根据具体生产车间具体调整，同时使用了实际生产数据来进行训练和测试，适应不同生产线且使用少量数据即可获得较为准确的结果，深度学习模型的可靠性高。

1 问题描述

订单完工期T是指在离散化生产系统中一个订单的第一个产品开始进入系统到最后一个产品完工所花费的总时间T=［t1，t2，…，tn］[5]。其影响因素主要为生产车间的属性W和订单的构成O两类影响因素。其中车间属性包含设备与人员的工作情况、当前生产状态、物流状态、负载能力等多种不确定因素；订单的构成O则可用产品类型及对应类型产品的数量来表示。

以上为影响订单完工期的量化因素，即{O，W1，W2，…，Wn，W11，W12，…，W1m，…，Wnm}，记订单完工时间T=f（O，W1，W2，…，Wn，W11，W12，…，W1m，…，Wnm），由于函数F的形式未知，无法用简单的条件约束或线性关系拟合，因此采用机器学习的方法来建立影响因素与订单完工时间的关系。传统机器学习在车间产品数量M与订单产品数量N比较大时，影响因素也逐渐增大，一般模型在解决明确问题时十分高效，但当面对实际生产的复杂问题时，会出现泛化性差，应用效果达不到目的。因此，采用深度学习的方法，寻找影响因素之间的隐式联系并最终形成预测模型，可达到逼近实际生产过程中复杂非线性关系与以极高精度逼近任何非线性函数的目的。

2 样本收集

样本收集可以通过历史数据统计和模拟试验进行。由于模拟实验很难捕捉到真实生产作业中细节的影响因素，因此本文选择实际生产数据进行采集，本文从当地某发动机生产装配企业的制造执行系统（MES系统）获取数据，基于两条发动机生产线采集生产过程中的时间数据与影响因素数据，根据生产调查，可以运用统计方法得到不同产品的工艺参数以及在固定设备的加工时间，结合对生产环境人员与设备的调查，对样本进行特征分析，如表1所示[7]，人工筛选出明显的特征值，筛除“脏”数据，并加入设备故障、人员缺勤等不确定因素，最终整合收集了31 293组数据构建数据集，构建实际生产过程样本，作为本方法的模型构建的样本。

表1 特征分析

3 订单完工时间预测模型的构建

深度学习神经网络具有很强的鲁棒性，其强大的自学习能力能够逼近任意的非线性函数，建立深度学习神经网络模型能够有效处理时间预测问题中多变量不确定性问题的非线性关系。具体算法步骤如下：1）对MES获取的数据进行归一化、标准化及主成分分析法处理，降低信息冗余；2）通过分析确定模型重要参数；3）搭建模型训练数据，根据训练结果调整参数及模型激活函数、优化算法选择；4）运行算法得到结果，分析结果，对比其他机器学习模型，相应算法流程如图1[4]所示。

图1 算法流程图

3.1 影响因素的确定与量化

本文对生产过程中各个环节进行分析，生产过程中确定或不确定的因素都可影响订单完工时间，从当地企业的制造执行系统（MES系统）获取数据文件后，除去影响因素中的不可抗力及部分人为因素，并对强相关性的数据进行整合之后，以生产线为导向，利用MySQL数据库管理系统选取数据，并获取对应的完成时间，导出数据为csv格式，以便Python读取数据。将统计数据以影响因素的形式写入对应类别的影响因素（0，0.5,1）作为样本值，通过人工筛选出明显的特征值，剔除无用数据，最终整合了31 293组数据构建数据集，并使用60%数据建立训练集，其余数据用于测试。整合的数据按时间长短分类，特征包括工序数、工件数、生产线、人员缺勤、机器生产能力、人工生产能力、物流时间、物流不畅（通畅：0；短时：0.5；超过1 d：1）[7]、机器故障（无故障：0；当天可解决：0.5；当天无法解决：1）[7]、物料短缺（不短缺：0；当天可解决：0.5；当天无法解决：1）[7]10个相关特征。因此每一组输入样本有10个输入变量，每个变量代表一种影响完工期的信息，同时以每一输入向量下的预测完工期作为输出层。

3.2 数据处理

使用主成分分析法（PCA，Principal Component Analysis）对数据进行特征提取，降低数据的冗余，能够进一步减少数据中“脏”数据的隐患，使模型能够更好地把握数据中的主要特征，以便后续模型运算过程中提高预测的效率与准确度。

3.3 搭建深度学习模型

3.3.1 网络结构的搭建

模型底层选择激活函数为sigmoid交叉熵损失函数，公式如下：

用softmax函数作为处理参数运算过程中的分类问题的激活函数，公式如下：

由于时间预测问题不同于传统二分类问题，使用logistic回归算法建立k个独立的二元分类器无法实现对时间的准确预测，只能得到时间的区间。因此使用Softmax回归分类器更加有利于对时间预测问题的结果表达。

传统机器学习的神经网络通过1个隐层实现非线性映射，但为了提高模型的稳定性和泛用性，本文选择建立DNN（深度神经网络）选择包含3个隐层的神经网络，输入层包含节点数为10，即代表订单所包含的10个不同特征，输出层的节点数为1，即预测结果得到的时间。网络结构如图2所示。

图2 神经网络结构图

3.3.2 结构参数的确定

该深度学习神经网络结构内部共包含65个隐含层神经元，且均可被训练，依照训练样本可以进行学习迭代。由于基于多不确定变量构建的时间预测模型，输入变量的有限性导致在测试中发现学习率不宜过大，将导致严重的过拟合现象，故在学习过程中选择模型训练过程中初始化学习精度ε为0.1，扩展常数Spread定为3，模型输入节点为样本特征数10，输出节点为1，训练步长为500。取样本中60%的数据作为深度学习神经网络模型的训练集，余下40%作为模型的测试集用以验证样本的可靠性以及结果分析。

3.3.3 代码实现

本文采用keras深度学习架构，基于tensorflow的深度学习库，利用Python实现深度学习神经网络模型，核心代码(部分）包括3个部分：

1）对样本数据的预处理。划分训练集与测试集，分割时间与其他特征，对特征数据进行归一化、标准化及PCA处理（参照3.2节）：

2）模型构建。依照模型架构（参照3.3.1节）最终实现深度学习的神经网络模型，并且利用训练集数据进行训练，利用测试集进行测试。

3）结果分析。根据模型的测试结果进行loss曲线和val_loss曲线的绘制，利用对时间的预测结果，并通过对真值与预测值的反演计算RMSE（均方根差），衡量测试集预测值与真实值的样本标准差，来评判预测结果的优劣（参照4.1节）。

4 实例分析

4.1 模型验证

本文以某发动机生产及装配车间为例，从发动机两条生产线上各选取部分数据，经过归一化及主成分分析法处理后，输入深度学习模型。

多次实例运行测试后最终得到的结果如表2所示。

表2 实例测试结果

RMSE（Root Mean Squared Error，均方根差）代表预测的值和观察到的值之差的样本标准差，用以表示预测结果分布的稳定性。计算式如下：

loss采用均方误差Mean Squared Error（MSE）评定指标，MSE可以评价数据的变化程度，在模型运算过程中随模型迭代次数增加而减少。

分析得出: 在相同条件下，多次试验所得出的训练结果不尽相同，但是训练速度及仿真精度变化不大，能够在误差很小的范围内完成对数据结果的预测。

4.2 模型对比

为了进一步验证深度学习神经网络在解决本问题上的优越性能，根据对相似问题的研究，构建另外两种机器学习订单时间预测方法的模型，径向基函数神经网络－RBF神经网络模型[4]和BP神经网络模型[7]，在相同样本数据下，相同学习率的条件下，独立进行20 次实验，将预测结果进行比较。

作为完成订单时间预测问题的模型，RBF 网络有更简洁的参数限定，预测结果变化幅度较小，而BP 网络预测结果与实际结果有着相同的波动趋势，且与实际结果的误差较小，即对数据有更好的适应性，更利于在不确定条件下做出预测。作为近年来典型的预测模型，与传统逻辑回归算法相比，均有较好的准确性与适用性。

通过对20次实验结果进行整体分析，选取RMSE（均方根差），作为评价分析指标，对比结果如表3所示。

表3 三种模型的误差对比

由结果分析得知，DL神经网络、RBF 神经网络、BP神经网络3种模型都可以精准地进行订单完成时间的预测，但是DL神经网络的均方根差为2.610，低于RBF模型的6.982与BP网络模型的9.424，综上分析可知，DL神经网络模型的运行精度更好，优越性更强。

但深度学习方法由于在结构上扩大网络尺寸，故本文方法比其他方法的网络参数数量增加，使网络更容易过拟合。尤其是在样本不足的学习率过高的情况下，DL模型会出现严重的过拟合现象，模型的偏差小而方差大。且DL模型对样本数据的要求比其他两种机器学习模型高，导致的模型训练后的泛用性问题使之局限于对目的任务的准确预测，进一步优化网络结构与数据初处理过程是下一步改进方向。

5 结论

本文重点针对离散型制造企业订单完工时间预测展开研究，搭建了一种基于深度学习的订单完工时间预测模型。采用了归一化处理数据，运用深度学习获取订单相关参数及参数与预测时间的相关函数，有效提高了模型拟合度，比BP神经网络与RBF神经网络的效果更好。将基于深度学习的订单完工时间预测模型运用到离散化车间生产中，通过模型处理数据，可以达到准确预测生产时间的目的，能为企业的生产、调配、协调工作提供保证。