基于组合神经网络的建筑冷负荷混合预测模型

2022-10-08 09:24于军琪，高之坤，赵安军*，周敏，虎群

大连理工大学学报 2022年5期

于军琪，高之坤，赵安军*，周敏，虎群

(1.西安建筑科技大学建筑设备科学与工程学院，陕西西安 710055；2.西安建筑科技大学信息与控制工程学院，陕西西安 710055；3.中国建筑西北设计研究院有限公司，陕西西安 710015)

0 引言

空调系统能耗约占建筑总能耗的40%，是建筑中最大的耗能系统[1]，这意味着空调系统节能对建筑能效起着重要作用.而准确的建筑冷负荷预测是提高空调运行能效的关键[2]，也为许多能源管理任务(故障诊断、需求侧管理和最优控制)奠定了必要基础.

目前，以神经网络为基础的预测方法被广泛应用于负荷预测[3].李元旦[4]对时间序列负荷预测方法与神经网络进行比较，得出神经网络具有预测精度高、推广能力强的特点.Li等[5]使用BP神经网络、径向基神经网络(RBF)、广义回归神经网络(GRNN)3种不同的神经网络对某建筑逐时冷负荷进行预测.结果表明，3种神经网络模型都可以有效预测建筑物冷负荷，但GRNN具有更好的准确性和通用性.蒋小强等[6]对某区域供冷系统的逐时冷负荷变化规律进行分析，并采用神经网络对逐时冷负荷进行预测.Wang[7]利用小波神经网络(WNN)对短期冷负荷进行预测，并证明其在预测方面具有很好的适用性.

网络参数的合理设置是提高神经网络预测模型预测效果的关建.因此，许多研究引入智能算法优化网络参数，开发基于神经网络的混合预测模型，进一步提高模型的非线性映射能力[8].将一些基于神经网络的混合预测方法用于冷负荷预测，如粒子群算法优化BP神经网络(PSO-BP)、人工蜂群算法优化多层感知器神经网络(ABC-MLP)、改进蚁群算法优化小波神经网络(IACO-WNN)等，均表现出了良好的预测效果[9].

上述研究虽然证明了不同神经网络用于负荷预测的有效性，但仍存在不足.一方面，预测模型输入变量种类不全面，大部分是室外气象参数[10].建筑冷负荷还受到建筑本体特征、室内变量等的影响，这些也应被分析和考虑[11].另一方面，针对冷负荷呈现出动态、不确定等非线性特征，虽然已有很多智能算法优化神经网络的混合预测模型，但很少考虑将两种或多种神经网络组合起来，进一步提高模型的预测精度和泛化能力[12].

为克服上述局限和不足，本文提出一种天牛须搜索算法优化的广义回归神经网络结合长短时记忆神经网络的混合预测模型(BAS-GRNN&LSTM)，用于建筑冷负荷预测，即从建筑本体特征、内扰、外扰和历史负荷4个方面对影响冷负荷的因素进行综合分析；采用随机森林算法结合递归特征消除法进行特征提取，避免输入变量选用不合理影响预测精度；利用天牛须搜索算法优化广义回归神经网络参数，并建立BAS-GRNN&LSTM混合预测模型；通过实际案例，对BAS-GRNN&LSTM模型的预测性能进行对比验证.

1 预测模型输入参数分析

1.1 不同参数对建筑冷负荷的影响

正确选择模型输入是建立负荷预测模型的前提.因此，分析各影响参数与冷负荷的相关性，合理选择输入参数非常重要[10].影响冷负荷的因素主要分为4个方面[11]：建筑本体特征、内扰、外扰和历史负荷.

建筑本体特征主要包括建筑面积、建筑层高、建筑物外表面积、窗墙比等.其中，建筑面积、建筑层高和建筑物外表面积对负荷的影响都可以归结为体形系数对负荷的影响.内扰主要为室内流动人员数量、设备散热、照明等.外扰主要指室外温度、相对湿度、建筑物周围风速以及太阳辐照度等气象参数.由于太阳辐照度对室内温度影响存在严重滞后现象，外扰中还包括上一时刻的太阳辐照度[4].考虑到建筑空调系统具有大惯性，无法突变，历史负荷会对当前负荷产生影响，尤其前一时刻负荷与当前时刻负荷间存在强烈的相关性[13].

1.2 随机森林特征提取

由于影响建筑冷负荷的扰动因素很多，且这些因素之间可能存在非线性、共线性问题，传统的数据分析方法难以避免自变量之间的相互作用，而随机森林(RF)[14]作为一种新兴的有监督机器学习算法，运行稳定，可以有效地对存在非线性、共线性的数据进行分析.

利用随机森林算法对建筑冷负荷相关因素进行特征提取主要包括以下几个阶段：

(1)采用bootstrap方法从建筑冷负荷原始数据集中随机抽取n个训练子集，每个训练子集共有m个样本(特征)，未被抽取的样本为袋外数据.

(2)对n个训练子集进行模型训练，生成n个决策树模型.

(3)对于单个决策树模型，利用方差最小准则从m个特征中选择最有分裂能力的一个特征进行节点分裂：

(1)

式中：I为最优分裂变量，s为嵌入样本维数，xs、x′s分别表示变量的值与平均值.

(4)每棵树不经过剪枝最大程度生长后整合成随机森林，进而利用均方误差计算袋外数据对模型的影响：

(2)

式中：Ems为均方误差，k为袋外数据样本量，yi、y′i分别表示第i组样本的真实值与预测值.

(5)所有决策树进行投票，通过Ems减少量表征输入变量的重要性，利用袋外数据得到均方残差序列为[Ems1，Ems2，…，Emsn]，对于输入变量，其影响系数如下：

(3)

随机森林算法具体流程如图1所示.

1.3 递归特征消除

利用随机森林算法可以得到各特征参数对冷负荷的影响系数，但无法确定预测模型的最佳输入参数个数，因此采用递归特征消除法(RFE)来确定最佳特征数.RFE[15]的主要思想是重复建立模型，根据特征得分排序，选出得分最高的特征，对剩余特征重复上述过程，遍历所有特征后停止，得到最佳特征数.

2 混合预测模型

2.1 广义回归神经网络

广义回归神经网络(GRNN)[16]是一种径向基神经网络，其设计简单、收敛快，具有很强的容错性和鲁棒性，适合建筑冷负荷这类不稳定数据的预测问题.典型的GRNN网络结构如图2所示，包括输入层、模式层、求和层和输出层.

在GRNN中，输入层的神经元数量等于训练样本的输入向量维数，每个神经元直接将输入向量传递给模式层.模式层的n个神经元对应n个训练样本，该层神经元的传递函数为

(4)

式中：Pi为模式层中每个神经元的输出，X为输入向量，Xi为模式层中第i个神经元对应的训练样本，σ为平滑因子.

在求和层中使用了两种神经元.一种是对模式层中所有神经元的输出进行算术求和，神经元间的连接权值为1，传递函数为

(5)

另一种是神经元输出的加权和，其连接权值是模式层中神经元的输出向量Yi，传递函数为

(6)

输出层中的输出Y=(y1y2…yk)为

Y=Sn/Sd

(7)

根据上述GRNN原理可知，其需要调整参数较少，只有一个平滑因子.而传统的GRNN中，平滑因子的选择具有主观性和随机性，限制了GRNN的预测能力.为了获得理想的平滑因子参数值，减少人为干预，采用天牛须搜索算法对GRNN的平滑因子进行优化.

2.2 天牛须搜索算法

天牛须搜索(BAS)算法[17]是于2017年提出的一种新型的智能仿生算法，其灵感来源于天牛觅食过程，如图3所示.天牛有两根触角，用来探测食物气味浓度.如果左侧触角检测到气味浓度较高，天牛就会飞向左侧.同样，如果右侧触角探测到气味浓度较高，它就会飞向右侧.这样，天牛便能够在未知的环境中成功地找到食物.BAS算法模拟了这一过程，它只需要一个个体就能实现有效优化，这对降低算法的计算复杂度有很大作用.

因此，利用BAS算法优化GRNN的平滑因子，并将GRNN对建筑冷负荷训练集的平均绝对误差设为BAS算法的适应度函数：

(8)

由于天牛头的朝向随机，即右侧触角指向左侧触角的方向向量是随机的，定义如下：

(9)

其中Rand为随机函数，c为空间维度.

获得方向向量后，定义左、右侧触角的位置为

Xl=Xt-dtb

(10)

Xr=Xt+dtb

(11)

式中：Xl与Xr分别为左、右侧触角的位置，Xt为t次迭代时天牛的质心位置，dt为t次迭代时两触角间距.

此时，计算左、右侧触角的适应度ffit(Xl)和ffit(Xr)，根据二者大小关系，判断天牛下一次迭代的方向和位置：

Xt=Xt-1-δtbsgn[ffit(Xl)-ffit(Xr)]

(12)

式中：δt为t次迭代时搜索步长，sgn为符号函数.

计算天牛移动后的适应度，并判断是否满足迭代结束条件，满足就结束，否则重复上述过程.BAS算法的具体优化过程如图4所示.

2.3 长短时记忆神经网络

长短时记忆(LSTM)神经网络[18]是一种特殊的递归神经网络(RNN)，并克服RNN梯度消失问题.因此，LSTM适合处理动态、长间隔的数据，具有强大的非线性映射能力.同时，不同于其他神经网络，LSTM模型通过3种门结构进行信息传递，分别为遗忘门、输入门和输出门，如图5所示.

在LSTM中，对于每个时间步长t，使用前一时间步长的输入xt和输出ht-1计算当前单元细胞状态ct和输出ht.LSTM的第一层遗忘门f控制对上一单元细胞状态ct-1的遗忘程度：

ft=sigmoid(bf+Wf，hht-1+Wf，xxt)

(13)

输入门i根据新输入的信息对细胞状态进行更新，将更新后的细胞状态传送到下一单元：

it=sigmoid(bi+Wi，hht-1+Wi，xxt)

(14)

ct=tanh(Wc，xxt+Wc，hht-1+bc)

(15)

输出门o根据输入数据对细胞状态进行过滤，产生本阶段的输出结果：

(16)

ot=σ(bo+Wo，hht-1+Wo，xxt)

(17)

ht=ottanh(ct)

(18)

2.4 BAS-GRNN&LSTM模型构建

充分利用GRNN、LSTM这两种网络优点，提出一种BAS-GRNN&LSTM混合预测模型，BAS-GRNN&LSTM建模的主要过程如下：

(1)将冷负荷训练集拆分为训练子集和测试子集，利用训练子集对BAS-GRNN、LSTM建模.

(2)分别利用建立好的BAS-GRNN、LSTM模型对测试子集预测，并计算出每个时刻预测的平均相对误差.

(3)将BAS-GRNN与LSTM的预测结果(平均相对误差)进行比较以确定两者的预测时刻，完成BAS-GRNN&LSTM建模.

3 实验分析

3.1 样本获取及数据预处理

本文以西安市某大型商业建筑空调负荷数据为例，进行预测模型学习和测试.此建筑的建筑本体特征信息如表1所示.当某一建筑建成后，该建筑几何尺寸和窗墙比等建筑本体特征参数也随之确定，对于同一建筑，其值为常量，并不能直接应用于建筑冷负荷预测.但体形系数、窗墙比通过影响建筑太阳辐射的热量影响建筑冷负荷，因此需要对体形系数、窗墙比和太阳辐照度之间进行交叉特征构建.同时，由于建筑围护结构存在隔热性，太阳辐照度对室内温度影响存在严重滞后现象，因此进行交叉特征构建时，应考虑前一时刻的太阳辐照度，具体交叉特征构建公式如下：

表1 建筑本体特征信息

w*=0.3fsw+0.7fpw

(19)

式中：w为体形系数或窗墙比，w*为交叉特征构建后的特征变量，fs为当前太阳辐照度，fp为前一时刻太阳辐照度.

同时由于建筑冷负荷相关参数有着不同的量纲和量纲单位，为了减少不同的参数量纲对实验模型误差的影响，需要对原始数据进行归一化处理，使得归一化处理的各参数处于同一量纲级，归一化公式如下：

z*=(z-zm)/zs

(20)

式中：z*为原始数据标准化后数据，z为原始数据，zm为原始数据的均值，zs为原始数据的标准差.

3.2 参数选择

将此建筑冷负荷原始数据中的室外气象、人员流动、照明使用情况以及历史负荷等参数加上建筑本体特征中的体形系数、窗墙比和太阳辐照度之间构建的交叉特征参数作为RF参数选择的输入.在使用RF对冷负荷进行相关参数选择时，运用了5折交叉验证的模型训练方式，将整体冷负荷数据集拆分成5份数据子集，交替地把其中4份作为训练集、1份作为测试集来训练模型，最后对5次训练的输出(影响系数)取平均值.这样做能提升模型的稳定性，增加参数选择结果的可信度，得到参数影响系数如图6所示.利用RFE得到的最佳特征数量结果如图7所示，图中Nf为特征数量，Scv为交叉验证得分.

从图6可以看出，13种冷负荷相关参数对冷负荷有着不同的影响系数，对于此建筑而言，其东向窗墙比和北向窗墙比一致，但东向窗墙比影响系数仍高于北向，原因在于此建筑的北向有建筑物对其遮挡，从而在一定程度影响了从这个方向窗户渗透的太阳辐射的热量，造成了窗墙比几乎相同，但对冷负荷的影响系数不同[19].另外，结合图7中得到的最佳特征数量为9，因此选用前一时刻负荷、室外干球温度、房间人员、窗墙比、前一时刻太阳辐照度等9种对冷负荷影响系数高的相关参数作为预测模型的输入.

3.3 结果验证

考虑商业建筑的工作特点，每天9：00～21：00 为商场营业时间，因此商业建筑空调系统采用间歇运行方式，8：00开始提前制冷.本节实验采用5月1日至9月26日8：00～21：00的数据作为训练数据，9月27、28、29、30日4 d的数据作为采样点进行验证分析.同时，为了验证模型预测效果，选取均方根误差(erms)、平均绝对百分比误差(emap)作为模型预测精度的主要评价指标，公式如下：

(21)

(22)

多次对BAS-GRNN&LSTM预测模型的相关参数进行调整和测试，最终得出一组适用于建筑冷负荷预测的参数设置，如表2所示.其中，LSTM的超参数由ADAM优化器优化得到.

表2 BAS-GRNN&LSTM参数设置

利用此建筑训练样本数据对BAS-GRNN&LSTM预测模型进行构建，分别计算出BAS-GRNN与LSTM模型对不同时刻负荷预测的平均相对误差emr，如图8所示，图中T为时刻.BAS-GRNN在8、9、11、12、13、14、15、17、19时得到预测误差小于LSTM，因此，确定以上时刻由BAS-GRNN进行预测，其余时刻由LSTM预测，完成BAS-GRNN&LSTM建模.

将BAS-GRNN&LSTM模型的预测结果与LSTM、BAS-GRNN和GRNN的进行对比，预测精度比较结果如表3所示.结果表明，BAS-GRNN&LSTM模型的erms、emap均优于其他模型，其预测精度更高.同时，相比于GRNN，BAS-GRNN的预测精度有所提高，表明BAS算法可以用于GRNN平滑因子参数优化.

表3 模型预测精度对比

为了更清楚地呈现对比结果，图9展示了这4种模型的预测折线图，图中Ps为采样点，Lp为冷负荷预测值.与其他3种预测模型相比，BAS-GRNN&LSTM得到的建筑冷负荷预测值与实际值相差最小，部分预测值与实际值几乎完全重叠，拟合效果更好.

同时，做出了4种模型预测值与实际值的回归拟合曲线，如图10所示，图中La为冷负荷实际值.由图可以看出，相比较其他3种模型，BAS-GRNN&LSTM的预测冷负荷值集中在直线Lp=La附近，表明其预测效果更好，进一步证明BAS-GRNN&LSTM的预测能力.

3.4 性能分析

3.4.1 天牛须优化算法性能分析为了进一步验证BAS算法优化GRNN参数能力，针对7月冷负荷相关数据，分别采用遗传算法(GA)、PSO、BAS对GRNN的平滑因子进行迭代寻优，得到的收敛曲线如图11所示，图中ema为平均绝对误差.由图可知，3种算法优化GRNN参数的适应度即ema总体呈下降趋势.但相比于GA、PSO，BAS在更短的时间内使ema收敛，且得到的ema最小.同时，相较于GA、PSO，BAS获得的收敛误差迭代曲线更为平坦.因此，BAS算法具有很好的稳定性和收敛性，能够适用于GRNN参数优化.

3.4.2 BAS-GRNN&LSTM泛化能力验证为了证明BAS-GRNN&LSTM预测模型有较高的泛化能力，对不同的月份也有较好的预测效果，利用BAS-GRNN&LSTM预测模型分别对4～8月最后4 d的冷负荷进行预测，当月其余天数的冷负荷数据作为模型的训练数据，并以是否使用特征提取算法为自变量进行实验对比，实验结果如图12所示.

可以看出，BAS-GRNN&LSTM预测模型有着较强的泛化能力，对于不同月份的冷负荷都有着良好的预测效果，且误差稳定在一个很小的区间范围内；与此同时，与未进行特征提取相比，利用RF结合RFE进行特征提取后的预测效果更好，表明其成功地对原始特征集进行了降维处理，利用选择出的特征能够更好地建立预测模型，有效地增加模型预测精度.

4 结论

(1)相比于GRNN预测模型，BAS-GRNN的预测精度有所提高，同时相比于GA、PSO算法，BAS算法优化GRNN的误差迭代曲线收敛速度更快，比GA和PSO更平坦.因此，BAS算法有很好的稳定性和收敛性，能够适用于GRNN参数优化.

(2)与未进行特征提取相比，利用RF结合RFE进行特征提取后的预测效果更好，表明RF结合RFE能够成功地选取出更为合理的模型输入特征，有效地提升模型预测精度.

(3)相比于其他的预测模型，BAS-GRNN&LSTM预测效果更为优越，并能够对不同月份冷负荷进行有效预测，泛化能力强，可以满足实际工程需要，对建筑空调系统在线优化控制提供了有效的数据支撑.