基于改进天牛须算法-优化极限学习机的 地源热泵能耗预测研究

2019-08-14 03:06刘涛徐成良陈焕新
制冷技术 2019年3期
关键词:学习机天牛源热泵

刘涛,徐成良,陈焕新

(华中科技大学能源与动力工程学院,湖北武汉 430074)

0 引言

随着经济的发展,我国建筑呈现出高能耗低能效的趋势,改革开放以来,我国建筑能耗在全国总能耗中的占比稳步增长[1]。预计到2020年,我国建筑能耗占比将达到35%[2-3]。作为能耗占比最大的领域,建筑能耗拥有很大的节能潜力。因此,建筑能耗预测分析及节能设计已成为一项重要的研究课题[4-7]。

目前,建筑能耗预测方法主要有工程方法和数据驱动方法[8]。其中,工程方法是根据建筑的热力学原理进行能耗预测,如利用EnergyPlus、eQuest等软件对建筑进行模拟仿真,这种方法需要依赖大量的建筑参数,有时会因为实际问题的高复杂性而难以进行。数据驱动方法基于建筑能耗历史数据即可建立高精度的能耗预测模型,包括人工神经网络(Artificial Neuron Network,ANN)、支持向量机(Support Vector Machine,SVM)等,在建筑领域已经得到了广泛的应用[9-10]。王尉同等[11]针对建筑能耗短期预测问题,提出了一种基于梯度渐进回归树(Gradient Boosting Regression Trees,GBRT)的建筑能耗预测方法,并验证了基于GBRT的建筑能耗预测算法的实用性。EKICI等[12]利用BP神经网络预测了3座不同建筑的供热能量需求。LI等[13]分别采用了BP神经网络(Back Propagation Neuron Network,BPNN)、径向基神经网络(Radial Basis Function Neuron Network,RBFNN)、广义回归神经网络(General Regression Neural Network,GRNN)及SVM对同一住宅建筑的年总能耗量进行预测,结果表明SVM预测精度最高。

尽管神经网络等算法有极强的非线性映射能力,但有时仍较为依赖算法中关键参数的选取。针对此类问题,国内外学者提出了多种参数寻优方法对神经网络进行改进,以提高模型的泛化能力。姚丽丽等[14]利用遗传算法对BP神经网络的输入因素和网络结构进行自动寻优确定,有效提高了能耗预测精度。ZHANG等[15]提出了一种将粒子群寻优算法(Particle Swarm Optimization,PSO)与RBFNN相结合的建筑能耗预测方法,并证明了该方法的有效性。LEE等[16]研究了基于非线性时变演化粒子群优化算法的径向基神经网络预测小时用电负荷,结果表明这种算法具有良好的精度。

本文以某地区建筑地源热泵系统为研究对象,提出了一种基于改进天牛须搜索(Beetle Antennae Search,BAS)算法优化极限学习机的建筑能耗预测方法,实现对地源热泵系统能耗的准确预测,这对评价和改善建筑的运行策略具有重要意义。

1 改进天牛须算法优化极限学习机

1.1 极限学习机(ELM)

极限学习机(Extreme Learning Machine,ELM)是HUANG等[17]依据摩尔-彭罗斯理论提出的一种单隐层前馈神经网络(Single-hidden Layer Feedforward Neural Network,SLFN)。极限学习机随机初始化输入神经元的权值和隐层神经元的阈值,且与经典的BP算法不同,输入权值和阈值经初始化后就不再改变,并由简单的矩阵求逆得到网络输出权值。与传统训练方法相比,ELM具有学习速度快和泛化能力强等优点[18]。

图1为ELM的网络结构。对N个任意输入输出样本(Xi, ti),其中Xi=[xi1, xi2,… , xin]∈Rn,ti=[ti1,ti2,…,tim]T∈Rm,则存在L个隐层节点的ELM网络模型为:

其中,Wi为输入权重矩阵,bi为隐层第i个节点的阈值,g(x)为激活函数,βi为输出权重。将上式表示为矩阵形式:

初始化输入权值和阈值后,输出矩阵H即可确定,则输出权值矩阵可计算为:

H+称为H矩阵的摩尔-彭罗斯广义逆。如此,整个ELM网络结构即被确定。

图1 ELM网络结构

1.2 改进天牛须算法(BSAS)

BAS算法是JIANG等[19]于2017年提出的一种生物启发式优化算法。其基本仿生学原理为:天牛在觅食时,会依据两根触角嗅到的食物气味大小,来指导自己下一时刻的前进方向。仿照天牛的行为,可抽象出BAS算法实现对目标函数的高效寻优。BAS算法流程如下。

a)对于D维优化问题,定义目标函数,并初始化天牛参数,包括天牛坐标x0、天牛质心到两须的距离d0等;

b)计算t时刻左、右须的坐标:

其中,xt为t时刻的天牛坐标,dt为t时刻天牛质心到两须的距离,b为随机生成的标准化方向向量;

c)比较左右须的目标函数值,并依此对天牛的位置进行更新:

其中,δt表示t时刻天牛的步长,sign为符号函数,f为待优化目标函数;

d)更新天牛的步长和搜索距离:

其中,ηδ和ηd分别是步长和搜索距离的更新衰减系数。

BAS不需要知道目标函数的具体形式就可以实现高效寻优,但BAS在寻优策略上仍存在一些不足,如不管每次迭代的结果是否变得更优,天牛的步长和搜索距离都会衰减,且BAS只有一只天牛在随机方向上寻优,容易迷失。

改进天牛须(Beetle Swarm Antennae Search,BSAS)算法是基于BAS算法的一种改进寻优算法[20]。BSAS改进了BAS的步长更新策略,只有某次迭代没有找到更优结果时,才会更新天牛步长。BSAS在每次迭代过程中可派出多只天牛进行寻优,因此相较于BAS,BSAS能更好地找到全局最优。

1.3 改进天牛须算法优化极限学习机(BSAS-ELM)

极限学习机的输入权值和隐层阈值是随机产生的,导致ELM存在网络不稳定的问题,模型预测精度也无法得到保证。针对ELM网络的此类问题,采用BSAS算法对ELM输入权值和隐层阈值进行优化(BSAS-ELM),从而克服ELM的不稳定性,改善网络性能,提高模型预测精度。BSAS-ELM算法流程如图2所示。

图2 BSAS-ELM算法流程

2 基于BSAS-ELM的地源热泵能耗预测模型

2.1 数据来源及地源热泵系统图

本文以河南省某商务中心的地源热泵机组为研究对象。该商务中心地下1层,地上9层,局部5层,建筑高42.9 m,总面积约25,000 m2。建筑采用地源热泵机组为建筑物提供冬季采暖和夏季制冷,空调末端设计冷负荷为2,438 kW,热负荷为1,696 kW。其地源热泵系统如图3所示。

该地源热泵系统共有2台HE1200B涡旋机组,为建筑冬季供暖、夏季制冷,冬季供暖期只运行其中一台,夏季制冷高峰期两台机组同时运行;空调循环泵共3台,其中两台对应并联动各台机组,一台备用;补水定压采用隔膜气压罐加补水泵方式,补充软化水,补水泵共2台,一用一备;热源井设计十眼井,两抽七回,一口抽水并备用;热源井中潜水泵共3台,两用一备。

以5 min/次的频率对该系统进行数据采集,采集的数据包含当地的室外温度数据和传感器记录的地源热泵系统运行各项数据,本文选择其中的地源热泵机组功率序列数据进行能耗时间序列预测。

2.2 数据预处理

数据预处理是能耗预测过程中的重要步骤,直接决定了数据质量的好坏,实际上,最终建立的能耗预测模型的预测精度在很大程度上取决于数据预处理后的数据质量的高低[21]。在本次数据采集实验中,由于采集间隔时间较短,采集变量较多,因此采集的数据会存在大量的死值、异常值等。这些数据不仅会降低能耗预测的精度,甚至可能导致算法效率低下,产生大量计算资源的浪费。

数据预处理步骤如下:剔除数据中的死值、异常值;选择数据中的地源热泵机组能耗序列数据,利用线性插值法对数据进行补全;对能耗序列数据进行标准化处理,数学公式为X*=[X-min(X)]/ [max(X)-min(X)],其中X表示原始能耗序列数据,max(X)和min(X)分别表示原能耗序列数据的最大值和最小值。预处理后的地源热泵能耗序列数据有10,944组,共计43天。

图3 地源热泵机组系统

2.3 训练建模

得到预处理后的能耗序列数据后,即可进行基于BSAS-ELM的训练建模,过程如下:依据ELM网络结构和能耗序列数据构建输入输出矩阵;数据集划分,选取前70%数据作为建模的训练集,剩下30%数据作为测试集;将训练集数据输入BSAS- ELM模型进行训练,获得地源热泵能源预测模型。

2.4 基于BSAS-ELM的地源热泵能耗预测

对训练集数据进行训练得到地源热泵能耗预测模型后,将测试集数据输入训练好的模型,并以此对建立的模型的预测效果进行评价。本文选取决定系数(R2)、平均绝对误差(MAE)和均方根误差(RMSE)作为模型预测效果的评价指标。

图4所示为基于BSAS-ELM的地源热泵能耗预测流程,包括数据预处理和能耗预测两部分。

3 能耗预测结果及分析

基于建立的BSAS-ELM模型,分别对本文仿真对象的地源热泵机组的能耗进行提前5 min的单步预测和提前3 h的多步预测。同时,为验证模型的有效性,建立了单独的ELM模型及常见的支持向量机(SVM)模型,进行对比分析。

图4 基于BSAS-ELM的地源热泵能耗预测流程

3.1 数据描述及ELM网络结构

本文利用地源热泵机组的能耗历史序列数据进行能耗预测,能耗数据时间序列历时43天,共10,944个样本点,其变化趋势如图5所示。基于BSAS-ELM算法,分别对地源热泵能耗进行提前5 min(提前一步)的单步预测和提前3 h(36步)的多步预测。对于单步预测,采用12输入,1输出,因此,单步预测的ELM网络的输入和输出节点分别为12和1,隐层节点数经试错法确定为25,即单步预测的ELM网络为12-25-1结构;对于多步预测,采用36输入,1输出,因此多步预测的ELM网络的输入输出节点分别为36和1,隐层节点数经试错法确定为73,即多步预测的ELM网络为36-73-1结构。

3.2 基于BSAS-ELM的单步预测

表1展示了SVM、ELM、BSAS-ELM这3种算法对地源热泵机组进行单步能耗预测的预测效果。可以看出,较为常见的机器学习算法SVM在单步预测时表现良好,决定系数可达0.902;单独的极限学习机预测的决定系数为0.960,预测平均绝对误差相比SVM降低了47%,均方根误差与SVM相当;BSAS-ELM算法预测的决定系数达到了0.984,且平均绝对误差和均方根误差相比ELM更小,其中MAE为5.195,RMSE为26.085。

图6展示了SVM、ELM和BSAS-ELM这3种算法的单步能耗预测回归效果。由图6结合表1可以看出:对地源热泵机组能耗进行提前1步的单步预测时,ELM的预测效果要优于SVM,尽管ELM的预测效果已经较为理想,利用改进天牛须搜索算法优化后的BSAS-ELM仍能提升不小的预测精度。

图5 地源热泵能耗时间序列变化

图6 3种模型单步能耗预测回归效果

表1 3种模型单步能耗预测效果对比

3.3 基于BSAS-ELM的多步预测

表2展示了SVM、ELM、BSAS-ELM这3种算法对地源热泵机组进行提前36步的能耗预测效果。在进行多步能耗预测时,较常用的机器学习算法支持向量机的表现不好,其决定系数只有0.67,平均绝对误差和均方根误差却高达77.761和138.275,总体预测效果不能让人满意;相比之下,ELM的决定系数为0.925,平均绝对误差和均方根误差也与单步预测时相差不多,总体预测效果较为理想;BSAS-ELM多步预测的决定系数高达0.989,平均绝对误差和均方根误差分别为4.210和18.410,相比ELM分别降低了65%和37%。

表2 3种模型多步能耗预测效果对比

图7展示了SVM、ELM和BSAS-ELM这3种算法建立的能耗预测模型多步预测的回归效果。结合表2可知,在对地源热泵能耗进行多步预测时,SVM表现不好,尤其在0值附近表现很差;单独的极限学习机较SVM有了一定提升,预测效果差强人意;BSAS-ELM在进行多步预测时相比ELM表现突出,BSAS寻优算法的引入对ELM的能耗预测效果有显著提升。

图7 3种模型多步能耗预测回归效果

4 结论

1)改进算法BSAS可克服传统的天牛须搜索算法BAS步长更新无反馈、单只天牛易迷失等问题,能更好地收敛于目标函数的全局最优点。

2)利用BSAS寻优算法优化ELM网络的输入权值和隐层阈值,能克服ELM网络不稳定等问题,获得泛化能力更佳的模型。

3)基于BSAS-ELM对地源热泵能耗进行单步和多步预测,能显著提升模型预测精度,便于对地源热泵机组的运行策略进行实时、及时调节,达到建筑节能的目的。

猜你喜欢
学习机天牛源热泵
暖通空调设计中地源热泵实践
空气源热泵用于天然气加热的经济环保性
空气源热泵供暖期耗电量计算
天牛到底有多牛
黑黄花天牛
巨型昆虫——天牛
基于改进极限学习机的光谱定量建模方法
分层极限学习机在滚动轴承故障诊断中的应用
空气源热泵机组设计与维护方法
天牛