基于深度信念网络的建筑物用水流量预测

2018-01-19 11:35姚腾辉李峰
软件导刊 2018年10期

姚腾辉 李峰

摘 要:随着高层建筑的普及,无负压供水已成为一种重要的二次供水形态,而建筑物用水流量预测是水泵选型的重要依据。提出一种基于深度信念网络的建筑用水流量预测方法。综合利用环境、房价、水价等因素对建筑的低谷流量、普遍流量和峰值流量进行预测,进而为水泵选型提供数据支持。通过与BP神经网络方法进行对比实验,结果表明基于DBN的建筑用水流量预测方法可以较好地预测流量,优于BP神经网络的预测结果。

关键词:无负压供水;建筑用水流量预测;深度信念网络;受限玻尔兹曼机

DOIDOI:10.11907/rjdk.181254

中图分类号:TP301

文献标识码:A 文章编号:1672-7800(2018)010-0036-05

英文摘要Abstract:With the popularity of high-rise buildings, non-negative pressure water supply has become an important form of secondary water supply, and water flow forecasting of buildings is one of the important basis for selection of pumps. Therefore, this paper presents a method of forecasting water flow in construction based on deep belief network. Through the comprehensive environment, housing prices, water prices and other factors on the building′s low flow, the general flow and peak flow forecast, to provide data for the pump selection support. Compared with the BP neural network experiment, the DBN-based water flow forecasting method can predict the building flow well, and the results are superior to that or the BP neural network prediction is made.

英文关键词Key Words:non-negative pressure water supply;building flow forecasting;deep belief network;restricted Boltzmann machine

0 引言

高层建筑的普及促进了二次供水发展,无负压供水方式由于直接对接供水管网,没有二次污染,可充分利用市政管网的剩余压力,节能环保效果好,因此得到了广泛应用[1]。水泵在二次供水系统中消耗大量能源,耗电费用约占供水成本的60%以上,极大影响着运行成本。目前无负压供水水泵选型时流量的确定均根据《建筑给排水设计规范》。由于国家标准的编制具有普遍性,致使设计秒流量往往高于实际用水量,导致水泵长期低效运行,造成极大浪费,增加了初期投入成本和运行成本。因此,如何在无负压供水设备选型中充分依据用水规律使水泵最大限度地工作在高效区域,以便更有效地发挥变频调速水泵节能效果,达到节能环保之目的,是无负压供水设备设计选型中亟待解决的问题[2-4]。

目前对建筑物用水流量的预测研究刚刚起步,且大部分集中在对历史数据的分析计算上。张昊[5]对宾馆类建筑的自来水、热水、中水系统的用水量变化规律进行研究,分析了时间和入住率对用水量的影响。蒋龙[6]对住宅小区生活用水量及给水方式的能耗进行了分析,进而对住宅小区生活给水方式进行优化。上述两个研究都是对固定类型的建筑用水规律进行统计分析,对用水规律的影响因子挖掘较少,也沒有对建筑物流量建立预测模型,研究结果不能推广使用。丁小凯[7]使用LS-SVM建立基于时段、压力特征的流量预测模型,对日流量进行预测,属于短期预测,考虑的因素过少,模型预测准确度不高。

当前需水量的预测方法主要有定额法[8]、回归分析法[9]、时间序列法[10]、人工神经网络[11]等,这些方法实现了不同对象的需水量预测,但均存在局限性[12-13]。其中,定额分析通过人均用水定额指标进行核算,相对简单;时间序列输入为单一的历史数据,主要突出数据的时间属性;回归分析是分析需水量和各因素之间的关系,通过参数表现出来。但影响建筑物用水流量因素众多,各影响因素之间互相关联、错综复杂,属于多因素、非线性问题,经典的回归分析不能满足预测要求;人工神经网络模拟人脑神经组织的处理过程,具有自组织、自学习特性,更适用于多因素、非线性的用水量预测。需水量预测前需要搜集大量基础资料,通过定量分析,筛选需水量的影响因子。一方面需水量影响因子复杂,因子之间的非线性关系不容易发现,另一方面搜集资料存在主观性,导致筛选的影响因子不充分,也就是输入的特征向量中只有部分是可能影响楼宇流量的因子,而BP神经网络对输入的依赖性较高,导致需水量预测精度欠佳。

近年来特征学习能力突出的深度信念网络在不同领域被广泛应用,如图像处理、语音识别等[14-17],同时深度信念网络是人工神经网络的一种发展,突出了特征学习的重要性,在数据预测应用中效果很好[18-20]。鉴于此,本文提出一种基于深度信念网络的建筑用水流量预测方法,与建筑流量相关的因素都作为输入,自动提取各影响因素的相关特性。与BP神经网络对比,结果证明该方法预测精度更高。

1 深度信念网络

深度信念网络(DBN)通过多层受限玻尔兹曼机(RBM)和一层BP神经网络叠加组合而成。DBN通过贪婪算法逐层训练,每次RBM上一层的输出作为下一层的输入,学习相邻两层RBM的模型参数,通过训练将数据向量映射到不同的特征空间。但每次只学习相邻两层之间的参数,不对整个DBN的特征向量映射达到最优,需要通过BP神经网络将误差进行反向传播得到最终的DBN。

受限玻尔兹曼机(RBM)由可视层(v)、隐含层(h)和权重矩阵(w)组成概率图模型,其结构如图2所示。其中,可视层由显元vi组成,是神经元的输入层;隐藏层 h 由隐元 hj组成,用于特征提取。同层神经元之间没有连线,层之间全连接,并且每个节点只有(0,1)状态[21-22]。

2 流量预测模型

2.1 特征变量选取

影响居民用水量的因素很多,结合之前的研究结果,将建筑物用水量影响因素归纳为建筑物属性、经济状况、价格因素、人口特征、天气特征和水资源特征6个方面[24-25]。

(1)建筑属性指建筑类型、厨房数量、卫生间数量、建筑面积。不同的建筑类型中居民的生活习惯不同,导致用水规律差异很大。厨房和卫生间作为建筑中主要的耗水场所,对需水量有较大影响。此外,建筑面积越大,潜在的耗水行为也会越多。

(2)天气特征指建筑所在地区的温度和湿度。我国地域辽阔,各地区间气候条件差异较大,从而形成不同的生活习惯,不同的生活习惯导致居民对水资源的需求不同。

(3)经济状况指居民的收入水平和地区的经济水平。建筑中卫生设施种类、居民用水习惯等都和经济状况有很大的关联。对于建筑物,可通过房价和均价的比值和人均GDP体现经济状况。

(4)人口特征主要指人口数量。

(5)水资源特征指居民用水定额、市政管网压力。城市水资源的稀缺性和供水能力是居民用水量的重要制约因素,而市政管网压力体现了城市的供水能力,也是无负压供水的重要影响因素。

(6)价格因素指水价。水价作为调节居民用水行为的重要手段,对需水量也有很大影响。为督促居民节约用水,目前大部分城市都实行了阶梯水价,其中基础水价对居民用水行为影响不明显[26],所以选取阶梯水价中的第三阶梯水价作为影响因子。

通过以上分析,最终选取建筑类型、厨房数量、卫生间数量、建筑面积、年均温度、年均湿度、房价、人均GDP、人口数量、人均用水定额、市政管网压力、水价12个因素作为建筑用水流量的影响因子。

2.2 数据获取

本研究所用到的天气数据(年均降水量、年均温度)从中国天气网获取,与建筑相关的信息(建筑类型、户数、厨卫数量、建筑面积)均从相关物业处获得,房价信息通过房价网API获得,水价信息从中国水网处获得,居民用水定额从住建部发布的《城市居民生活用水量标准》中得到,人均GDP通过国家统计局查询得到,用水流量数据和进口压力等用水历史数据通过无负压供水设备生产厂家远程监控系统获取。

2.3 数据预处理

通常从无负压远程监控系统获取的流量数据为小于等于30s间隔采集的瞬时流量值。为更好地分析用水规律,对建筑物类型细化为表1所示编码,在此基础上通过对不同建筑类型进行用水规律分析,得到居民用水的集中区间,然后通过频率分析统计各个区间用水频率最高的流量值,即可得到低估流量、普遍流量和峰值流量。本文通过上述分析处理得到800栋历史数据,其中普通住宅300栋、办公楼300栋、集体宿舍200栋。

2.5 DBN网络架构

首先确定输入、输出层大小,将统计好的建筑类型、厨房数量、卫生间数量、建筑面积、年均温度、年均湿度、房价、人均GDP、人口数量、人均用水定额、市政管网压力、水价等12个用水量影响因子作为输入,将频率分析后的低谷流量、普遍流量和峰值流量作为输出。为使深度信念网络更适用于建筑物用水流量预测,对隐层、训练周期和样本数量进行大量实验,选择最优参数设置对建筑用水流量进行预测。

在基于DBN的预测模型中,影响预测结果的主要因素是隐层大小和每个隐层神经元的数量。首先固定训练样本数量为500,训练周期为100,通过实验,逐渐增加隐含层及隐含层神经元数量得到最佳隐层设置。表2為第一隐含层不同神经元个数对训练准确率的影响。

从表2可以看出,当第一个隐含层的神经元数目不同时训练误差也不同。在第一层结构大小从1-9的递增过程中,MRE数值不断下降,说明随着隐含层神经元数量的增加,模型的训练误差越来越小。但当神经元数量继续增加时模型训练效果提升不大,因此第一个隐含层的神经元数量为9时模型表现较好。

将第一隐含层的大小设置为9,然后不断增加第二隐含层神经元数量,实验结果见表3。

从表3可以看出,增加隐层层数可使训练误差减小,当第二层的神经元数量增加到3时误差最小。继续增加神经元数量时,误差率有增大趋势,所以选取第二个隐含层的神经元数量为3。

设置好前两层结构后,继续增加神经网络层数,如表4所示。从表中可以看出,继续增加网络层数时,模型的误差率没有继续降低。

选取DBN模型结构为12-9-3-3,即整个模型由一个输入层(节点数量为12)、两个中间层组成,其中第一个隐含层的神经元个数为9,第二个为3,一个输出层,输出层节点个数为3。训练好的DBN网络结构如图2所示。

确定好DBN模型后,分析训练周期和样本个数对预测准确率的影响。样本个数和训练周期的增加可使DBN提取到更多特征,进而提高预测准确度。同样使用MRE对训练结果进行评判,实验结果如图3所示。从图中x轴走势可以看出,当训练周期固定时,增加训练样本数量可明显降低训练误差率。当样本数量为600时,训练效果趋于稳定,说明已经提取到了足够的特征。从y轴走势可以看出,当样本数量固定时,训练周期的增加可减小训练误差,当训练周期为250时MRE达到较低水平。继续增加训练周期,模型的误差变化较小,因此选取训练周期为250。

3 实验结果及分析

将600个训练样本分别输入BP神经网络和DBN模型进行训练,从剩余样本数据中随机选取15个样本,对其低谷流量、普遍流量和峰值流量进行预测。BP神经网络和DBN的预测结果以普遍流量说明,如图4所示。对比图中各模型预测曲线与实际曲线,可以看出DBN和BP神经网络都能很好地对建筑流量进行预测, 并且较BP模型,DBN模型的预测曲线与实际曲线一致性更高,表明其预测精度更高。其中DBN的MRE為3.76%,BP神经网络的MRE为6.89%。

同数据集下,采用DBN模型对低谷流量和峰值流量的预测结果见表5。

目前无负压设备选型主要参考《建筑给排水设计规范》,该规范计算得到的用水流量和本文的分级峰值流量都满足最不利点的用水流量。根据《建筑给排水设计规范》对待预测的15栋建筑流量进行计算,同时与DBN的峰值流量预测结果进行对比,结果见图5。从图中可以看出,DBN模型对峰值流量的预测结果与实际值很接近,而根据《建筑给排水设计规范》计算得到的流量值远远高于实际峰值流量,导致选型结果远远大于实际需求,增大了投资成本,水泵投入运行后一直处于“大马拉小车”状态,节能效果差。

4 结语

本文对采集的数据进行预处理,通过分析用水规律后,建立了建筑用水的低谷流量、普遍流量和峰值流量预测的DBN模型并进行预测,同时与BP神经网络的预测方法进行对比。实验结果表明:

(1)基于BP的神经网络和DBN的深度信念网络均能根据当前数据学习并抽取特征,可用于建筑流量预测。相对BP神经网络, DBN由于其强大的特征学习能力在建筑流量预测方面精度更高。

(2)由于建筑类型和样本数量有限,不能对更多的建筑类型进行分析预测。下一步可尝试在大数据量的情况下对建筑类型进一步细分,同时选取更多的影响因子作为输入,进一步提高预测精度,使预测模型适用性更广。

参考文献:

[1] 张琳,郭玲,李峰.浅谈无负压供水设备的应用[J].城市建设理论研究,2012(21):155-159.

[2] 郭乃溶,刘志强,刘洪海,等.基于用水规律的住宅二次供水系统优化及节能分析[J].给水排水,2013,39(11):146-150.

[3] 陈立新,李强,刘东杰.浅论高层建筑二次供水泵房的节能措施[C].贵阳:中国水协设备材料委二次供水设备选型与节能减排技术交流研讨会,2011.

[4] 水浩然,柳兵.再谈管网叠压(无负压)给水设备增压水泵的选用与节能判别[J].给水排水,2007,33(12):99-102.

[5] 张昊.宾馆类建筑二次给水系统的节能优化[D].天津:天津大学,2014.

[6] 蒋龙.住宅小区生活给水系统的节水节能优化研究[D].重庆:重庆大学,2012.

[7] 丁小凯,朱霄珣.最小二乘支持向量机在楼宇流量预测中的应用[J].中国给水排水,2013,29(3):54-56.

[8] 黄正荣,张振林,贾剑峰,等.工业用水定额分析与研究[J].水资源与水工程学报,2009,20(4):101-103.

[9] 张雅君,刘全胜,冯萃敏.多元线性回归分析在北京城市生活需水量预测中的应用[J].给水排水,2003,29(4):26-29.

[10] 孙平,王丽萍,陈凯,等.基于时间序列模型ARMA的水厂逐日需水量过程预测方法[J].中国农村水利水电,2013(11):139-142.

[11] 班懿根.基于RBF神经网络的城市需水量预测[J].地下水,2012(1):114-116.

[12] 李琳,左其亭.城市用水量预测方法及应用比较研究[J].水资源与水工程学报,2005,16(3):6-10.

[13] 张雅君,刘全胜.需水量预测方法的评析与择优[J].中国给水排水,2001, 17(7):27-29.DJURDJEVIC P D, HUBER M. Deep Belief Network for Modeling Hierarchical Reinforcement Learning Policies[J]. Directory results for A Alexandre,2013, 8215(2):2485-2491.

[14] 酆勇,熊庆宇,石为人,等.一种基于受限玻尔兹曼机的说话人特征提取算法[J].仪器仪表学报,2016,37(2):256-262.

[15] LIU P, HAN S, MENG Z, et al. Facial expression recognition via a boosted deep belief network[C].IEEE Conference on Computer Vision and Pattern Recognition. IEEE Computer Society, 2014:1805-1812.

[16] 陈国华,汤庸,彭泽武,等.基于学术社区的学术搜索引擎设计[J].计算机科学,2011,38(8):171-175.

[17] 郑毅,朱成璋.基于深度信念网络的PM2.5预测[J].山东大学学报:工学版,2014,44(6):19-25

[18] 代杰杰,宋辉,杨祎,等.基于深度信念网络的变压器油中溶解气体浓度预测方法[J].电网技术,2017,41(8):2737-2742.

[19] 孙志军,薛磊,许阳明,等.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810.

[20] SALAKHUTDINOV R, HINTON G. An efficient learning procedure for deep boltzmann machines[J]. Neural Computation, 2014, 24(8):1967-2006.

[21] 张春霞,姬楠楠,王冠伟.受限波尔兹曼机[J].工程数学学报,2015(2):159-173.

[22] HINTON G E. Training products of experts by minimizing contrastive divergence.[M]. MIT Press, 2002.

[23] 陈晓光,徐晋涛,季永杰.城市居民用水需求影响因素研究[J].水利经济,2005,23(6):23-24.

[24] 陈晓光,徐晋涛,季永杰.华北地区城市居民用水需求影响因素分析[J].自然资源学报,2007,22(2):275-280.

[25] 褚俊英,王灿,王琦,等.水价对城市居民用水行为影响的研究进展[J].中国给水排水,2003,19(11):32-35.

(责任编辑:杜能钢)