基于时序分解与CNN的车间能耗预测方法

2021-06-21 01:54陆应康盛步云张志瀚张燕强
计算机应用与软件 2021年6期
关键词:贝叶斯时序能耗

陆应康 盛步云 张志瀚 张燕强

1(武汉理工大学机电工程学院 湖北 武汉 430070)2(东风设计研究院有限公司智慧技术研究院 湖北 武汉 430056)

0 引 言

随着制造业发展突飞猛进,制造业对能源的消耗也越来越大,据统计2000年-2016年中国工业能源消耗总量年均增长率为6.69%, 同期制造业能源消耗量占中国工业部门能源消耗量的比例平均达到82.8%[1]。在装备制造业中,涂装车间是制造企业中工艺最复杂,也是高能耗和高排放的车间之一[2]。在涂装车间内,最主要的能耗集中在空调和照明等系统,其能耗比例达到涂装车间总能耗的60%~70%[3],具有很大的节能潜力,因此,对涂装车间的能耗进行分析,从而挖掘节能潜力对整个汽车制造业的节能减排具有重要意义。Azadeh等[4]利用遗传算法对人工神经网络模型的参数进行了优化,从而得到对某企业电能耗的预测模型,并与时间序列法的预测结果进行了对比分析,表明优化后的神经网络预测能力更优。张宗华等[5]提出一种基于遗传算法的反向传播神经网络模型,在对电力负载的预测中有较高的预测精度。李曼洁等[6]基于XGBoost的用能预测模型对某汽车制造企业油漆车间的日能耗进行预测,达到了良好预测效果。文献[7]利用优化BP神经网络的模拟退火粒子群混合算法对钢铁企业的生产能耗进行预测,实现较高的精度预测。赵超等[8]提出了自适应加权最小二乘支持向量机(AWLS-SVM)回归方法的短期电力负荷预测模型,计算结果表明,AWLS-SVM模型在预测精度和泛化能力方面均有所提高。廖文强等[9]基于长短期记忆神经网络(LSTM)对暖通空调未来短期能耗进行预测,实验表明,LSTM预测比传统方法效果更好。以上预测模型都是利用人工智能算法建立模型,但是这些人工智能算法对于数据的依赖性太强,模型训练需要大量的数据,难以解决数量较少的车间能耗预测的问题。

综上,针对神经网络模型对数据依赖性强以及能耗数据的动态性和不确定性的问题,本文提出基于时序分解与CNN的预测模型,最后利用某汽车制造企业涂装车间能耗数据进行实验,验证模型的有效性。

1 概 述

本文的模型结构如图1所示,其中包括车间能耗数据的时序分解、贝叶斯参数估计[10]、卷积神经网络数据挖掘部分。

图1 车间能耗预测模型结构

首先通过具有周期特征的傅里叶变换基函数和分段函数分别对动态的能耗数据的周期成分和趋势成分进行拟合,建立时序分解模型。然后基于贝叶斯理论,将车间能耗的历史数据作为先验信息,并利用马尔可夫链蒙特卡洛(MCMC)模拟方法[11]对周期成分模型和趋势成分模型进行参数估计。最后将得到的周期和趋势特征数据以及环境变量等随机因素作为卷积神经网络的输入,进行卷积运算,最终得到车间能耗预测值。

2 车间能耗预测模型

2.1 周期成分模型

对于能耗数据的周期性,主要是季节以及节假日等因素造成的,本文考虑工作日与周末车间能耗的差异导致能耗数据呈现周期性的问题,选取拟合数据周期性应用最广泛的傅里叶变换分析方法[12]。傅里叶变换一般在信号处理上应用比较广泛,根据不同周期的数据的频谱筛选出振幅最大的频率,高效地拟合数据。如果将能耗数据也看作一种信号的话,经过傅里叶变换可以得到能耗数据的频谱,一般的傅里叶变换基函数为:

(1)

本文对于车间能耗数据,在傅里叶变换基函数中加入参数T,通过调整T的值来拟合能耗数据,最大限度地减小数据方差,最终获得能耗数据的周期成分。其表达式如下:

(2)

设α=[a0,b0,a1,b1,…,an,bn]T为傅里叶系数,车间能耗数据的周期成分可以表示为:

S(t)=W(t)α

(3)

2.2 趋势成分模型

考虑到车间能耗数据受到车间生产任务等因素影响,呈现出不同趋势,能耗的增长率不断变化。采用单一的趋势拟合,将淹没这些特征,本文采取分段函数[13]来拟合车间能耗数据的趋势成分,以此显现不同时段能耗的特征信息,提高趋势拟合精度,将能耗数据分为N段的线性模型表示:

X={(X1L,X1R),…,(XiL,XiR),…,(XNL,XNR)}

(4)

式中:(XiL,XiR)表示为第i段的线性模型,XiL、XiR是第i段线段的起始值和终止值;N表示为整个能耗数据划分的线段数目。

本文设置N-1个趋势转折点SN,当时间t大于趋势分段点SK时,修正趋势函数,其表达式为:

T(ti)=(XiL,XiR)=(k+a(t)kδi)t+(b-ka(t)θi)

(5)

式中:k为斜率;a(t)为本文设置的指示函数,当时间ti大于趋势分段点Si时,a(t)取1,否则取0;δi表示第i段线段斜率的变化率系数;θi为偏移量系数,θi=Siδi;b为偏移参数。

2.3 基于贝叶斯推理时序分解模型求解

车间能耗受人的行为、环境等诸多外部因素的影响,能耗数据呈现出动态性、随机性、不确定性等特征。贝叶斯状态估计方法能准确度量时序数列的不确定性,并能根据更新的观测数据对参数进行更新,借助贝叶斯方法,根据先验信息对时序模型进行求解,估计模型参数,提高拟合的准确性。

分别对周期和趋势函数参数估计,如果将周期函数的未知参数ω={α,T}看作随机变量,根据能耗的先验信息,可以确定未知参数的先验分布为π(ω),概率密度函数也可以看作是随机样本序列,则能耗数据集序列D和参数ω的联合分布为:

h(D,ω)=P(D|ω)π(ω)

(6)

式中:P(D|ω)为在参数ω的条件下,能耗数据集的概率,本文的能耗数据集已知,则P(D|ω)为参数ω的似然函数。因此,式(6)也可以写为:

h(D,ω)=L(D|ω)π(ω)

(7)

我们的任务是得到周期模型的参数,确定准确模型,即确定参数ω在能耗数据集的条件下的分布:

cL(D|ω)π(ω)

(8)

式中:m(x)为能耗数据的边缘密度,一般为常数c。则式(8)中未知参数ω的后验分布,它其中包括了能耗数据和有关参数ω的先验信息,本文取参数ω的估计由后验均值给出,即:

(9)

在实际应用中,式(9)的后验分布很难通过求解得到,一般采用抽样的方法来估计参数值,马尔可夫链蒙特卡洛(MCMC)的方法是计算贝叶斯后验分布的有效的方法。通过MCMC算法对模型参数进行后验模拟,取后验均值作为模型参数的估计值。

Gibbs抽样[14]是一种重要的MCMC抽样算法, 计算方法可以表示如下:

2) Gibbs抽样的i次迭代过程:

2.4 卷积神经网络

卷积神经网络(CNN)是一种用于处理视觉图像的深度神经网络[15],CNN由输入层、输出层和多个隐藏层组成,其中隐藏层由多个卷积层、池化层和全连接层组成。本文将CNN用于能耗预测,因CNN具有极强的局部特征捕捉能力,可以处理能耗数据多维度的耦合关系,同一层神经元之间共享权值,不仅可以降低网络的复杂度、提高预测效率,而且具有较好的拟合度。因此通过对能耗数据时间序列分解得到多维度因素,再利用CNN对能耗数据进行预测,相比传统的将时序分解的多维度因素叠加(TSD)的预测方法[16],是一种更有效的预测方法。

本文所采用的卷积神经网络模型参考Alex Net模型[15],由两层卷积层和两层池化层组成,本文在每个卷积层加入ReLU激活函数,为了防止梯度消失或梯度爆炸,并加入Dropout层消弱过拟合。网络结构如图2所示,其中p和q为池化层的尺寸。

图2 卷积神经网络模型

在卷积层中,从能耗数据序列中提取出局部的节点组合信息。通过每一个卷积核在所有数据上的重复滑动得到多组输出数据,当输入信号为xi=(x1,x2,…,xn)时,卷积层的计算公式为:

(10)

池化层主要用于保留主要特征,降低维度,减小过拟合。本文采用平均池化方式,对能耗数据的特征进行下采样处理。则池化层计算公式为:

(11)

式中:h(·)表示求平均值函数;kp为池化层权值;bj为偏置矩阵。

经过池化层后得到一系列特征,全连接层通过全连接方式将每一个神经元与池化层的所有输入出连接,将所有的特征集合起来,最终输出能耗预测值。

3 实例分析

3.1 数据集和数据预处理

本文以某企业的车间能耗数据作为研究对象,用于验证基于贝叶斯估计的时序分解与卷积神经网络组合预测方法的预测效果,数据的步长为1天,共有317个样本。图3显示了车间在一年内的能耗值变化,其中节假日等因素对于能耗值的影响很显著。

图3 车间日能耗数据

由于电表等读取误差以及停电等突发状况,原始数据中有很多异常值和缺失值,为了降低异常值和缺失值对模型训练造成的误差,本文采用临近值求平均值来填补缺失值和替换异常值。

3.2 基于贝叶斯估计的时间序列分解

对车间能耗数据的317个样本通过贝叶斯参数估计方法进行时序分解,在Gibbs抽样中,设置迭代次数为5 000次,并将前1 000次不平稳的数据删除,模拟实验的主要参数结果如表1所示,通过所得参数绘制数据的周期成分和趋势成分。时序分解结果如图4-图5所示。

表1 模型参数的估计结果

图4 周期成分

图5 趋势成分

分析可知:能耗数据的周期规律很强,有利于对神经网络的分析和预测,能耗的趋势成分的波动较大,需要通过分析环境因素等数据与其关系,进行预测。

3.3 评价模型设置

1) 对比设置。为验证本文方法的有效性, 本文选取了自回归移动平均模型(ARIMA)、长短期记忆神经网络(LSTM)、支持向量机(SVM),以及时序分解算法作为对比。

2) 模型评估。本次研究采用R2与RMSE评估模型预测效果。

(12)

(13)

3.4 模型结构参数设置

本文通过反复实验得知,选取步长为50,卷积核大小为3×3,数量分别为2和4,池化层尺度为2×1时,预测效果较好,具体结构如图6所示。

图6 能耗卷积神经网络模型结构图

在训练CNN时, 本文选取Euclidean Loss作为CNN的损失函数, 即:

(14)

图7 CNN模型训练过程的损失函数

3.5 结果与讨论

本文分别使用SVM、ARIMA、LSTM、时序分解,以及本文方法对2019年1月10日至2019年1月25日的15天车间能耗数据进行预测,对比实验中各类的预测方法能耗预测结果如表2、表3和图8所示。

表2 其他模型和TSDCNN模型的预测结果对比

表3 其他模型和TSDCNN模型的评价对比

图8 能耗预测结果

可以看出,对于正常日期的车间能耗数据,五种方法的预测效果都很相近,但是对于节假日这样的突发情况,SVM的预测效果最差,因为SVM无法拟合到节假日这种与正常数据悬殊的数据。相比SVM的预测效果,ARIMA和LSTM对突发事件能够有一定程度的预测。TSD和本文方法对突发事件的预测效果最好。通过表3可以看出,本文的组合方法在预测值与实际能耗值的吻合度(R2)最高,比TSD的吻合度提高了0.09, RMSE降低了523.7。所以本文方法的预测效果明显优于SVM、ARIMA、LSTM、TSD算法。

综上所述,本文方法在五种方法中表现最好,不管在正常日还是特殊日期都能完成较高精度的预测,可以很好地预测车间能耗情况。

4 结 语

涂装车间能耗预测对于降低车间的能源消耗以及节能减排具有重要意义。本文通过基于贝叶斯的时序分解与卷积神经网络组合模型对能耗进行预测,通过时序分解将历史能耗数据分解为周期因素和趋势因素,为CNN模型提供基础,采用贝叶斯估计方法,可以很好地描述实际问题的内在规律。CNN模型可以对于局部的特征进行提取,提高模型的预测精度。本文研究为涂装车间能耗节能决策以及能耗异常诊断提供一定的参考。

猜你喜欢
贝叶斯时序能耗
顾及多种弛豫模型的GNSS坐标时序分析软件GTSA
EnMS在航空发动机试验能耗控制中的应用实践
清明
基于GEE平台与Sentinel-NDVI时序数据江汉平原种植模式提取
探讨如何设计零能耗住宅
你不能把整个春天都搬到冬天来
水下飞起滑翔机
日本先进的“零能耗住宅”
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究