基于ARMA模型的地铁站环控系统能耗预测

2019-02-22 10:40
制冷学报 2019年1期
关键词:阶数控系统残差

(1 华中科技大学能源与动力工程学院 武汉 430074; 2 广州市地下铁道总公司 广州 510030)

随着近年城市化进程的推进,我国城市轨道交通得到了大力发展。截至2016年,我国已有29座城市开通轨道交通运营线路,运营总线路达130条,总里程达3 849 km。由于具有节约地面空间、噪音低、采用清洁能源减少污染等特性,地铁逐渐成为城市和区域的轨道交通主力。作为城市轨道交通主干网,地铁成为城市能源消耗的重要组成部分,其中地铁站环控系统(HVAC系统,供热通风和空调系统)的能耗占比较大[1-2]。Wang Yongcai等[3]通过对北京地铁站环控系统能耗的分析指出,2012年北京地铁站环控系统总能耗在夏季每月可达1.819×107kW·h。朱颖心等[4-5]指出在地铁运行期间,北京地铁站环控系统能耗与列车的牵引能耗相当。建立有效的地铁站环控系统能耗预测模型,实时对地铁站环控系统能耗做出预测和分析,从而对环控系统进行实时运行调节,一方面可以提高环控系统运行效率,保障机组的高效运行,另一方面可以降低地铁站的能耗。因此,建立有效的地铁环控系统能耗预测模型对于地铁站节能具有重大意义。

近年来,对轨道交通环控系统的节能运行和能耗预测有了较为广泛的研究[6-7]。牛丽仙等[8]提出了一种基于BP神经网络的地铁节假日能耗预测方法,利用反向传播的神经网络实现了对地铁能耗工作日和节假日的分别预测,相比于常规预测提高了地铁节假日能耗预测的精度。同时,时间序列分析方法作为一种成熟的统计学方法,在诸多领域得到了广泛应用,如建筑能耗预测[9]、电力预测[10-11]、HVAC故障诊断[12-13]。欧阳前武等[12]利用ARMA模型对广州市区的商业建筑逐月总能耗进行预测,结果表明ARMA模型在短期建筑能耗预测中可达到较高的精度。周芮锦等[13]对上海某办公建筑逐月能耗进行预测,采用CensusXl2方法建立ARMA时间序列模型,结果表明模型能够有效预测办公建筑能耗。

关于时间序列方法在轨道交通环控系统的能耗预测应用的研究较少。因此,本文提出一种基于ARMA模型的地铁站环控系统能耗预测方法,通过分析能耗数据的时间序列来预测地铁站环控系统能耗。

1 ARMA模型原理

ARMA模型即自回归移动平均模型,是目前最常用的平稳时间序列拟合模型[14]。ARMA模型根据对研究对象长期观测采集到的时间序列数据,利用参数估计建立数学模型来实现对于该时间序列未来值的预测。以ARMA模型为代表,基于时间序列的预测方法在气象预报、水文预报和空间科学等领域已得到广泛的研究和应用[15]。ARMA模型可细分为三类:AR(auto regression,自回归)模型、MA(moving average,移动平均)模型和ARMA模型。三类模型的区别在于自相关系数和偏自相关系数呈现的性质不同,如表1所示。其中,ARMA(p,q)模型主要由自回归过程和移动平均过程两部分组成,其中p为自回归阶数,q为移动平均阶数。

表1 ARMA(p,q)模型的性质Tab.1 Properties of ARMA(p, q)model

ARMA(p,q)模型结构:

Zt=θ0+φ1Zt-1+…+φpZt-p+αt+θ1αt-1+…+θqαt-q

(1)

式中:Z为观测值,t为时间,Zt为t时刻下的观测值;{φ},{θ}为各项系数;αt为残差序列。引进延迟算子B,式(1)可简写为:

φ(B)Zt=θ0+θ(B)αt

(2)

式中:φ(B)和θ(B)分别为AR模型和MA模型的特征多项式。

φ(B)=1-φ1B-φ2B2-…-φpBp

(3)

θ(B)=1-θ1B-θ2B2-…-θqBq

(4)

2 ARMA模型构建

ARMA模型构建流程如图1所示,分为5个步骤。

图1 ARMA模型构建流程Fig.1 Flowchart of ARMA model building

1)平稳性检验。时间序列的平稳性代表时间序列的统计性质关于时间平移的不变性。对地铁站环控系统能耗数据进行平稳性检验时,如果数据为非平稳时间序列,需要对序列进行差分运算,直至序列平稳。

2)白噪声检验(纯随机性检验)。序列的各项数值之间不相关,序列在进行完全无序的随机波动,这样的序列称为纯随机时间序列(白噪声序列)。纯随机时间序列是没有信息可提取的序列,如果序列为白噪声序列,应当停止分析。

3)模型定阶(模型识别)。结合数据样本时序图和AIC信息准则,确定模型自回归系数p和移动平均系数q的最优组合。

4)模型拟合。根据已经确定的最优参数p和q,对平稳非白噪声时间序列进行拟合,构建ARMA(p,q)模型。

5)模型检验。对模型进行显著性(有效性)检验,检验模型是否将样本信息进行充分提取。当模型检验为无效模型时,重复步骤3,直至模型有效。

3 仿真实验与结果分析

3.1 数据描述

本实验采集北方某城市地铁站环控系统的实际运行数据进行能耗预测。该城市某一地铁站环控系统由2台送风机、2台排风机、2台回风机、4台冷却泵、4台冷冻泵、3台制冷机及一系列阀等组成,子系统结构如图2所示。实地采集该地铁站2013-08-21—2013-08-26的6日实际运行数据。通过布置于地铁站内外的电表和传感器等监测地铁环控系统中各设备的运行参数和能耗,计算得出环控系统的总能耗。数据采集时间间隔为5 min,最后得到1 728个数据样本。

图2 地铁站环控系统结构Fig.2 Structure of a metro HVAC system

3.2 仿真实验

图3所示为北方该城市某一地铁站环控系统2013-08-21—2013-08-26的实际能耗数据时间序列。23∶00—06∶00(次日),由于地铁停运,环控系统能耗维持在最低水平;白天地铁运行时能耗明显增加。由于地铁站外天气变化和每日客流量变化等不确定性因素的影响,地铁站环控系统能耗呈现出一定的不确定性[16]。由图3可知,原始能耗数据序列整体上并无明显持续上升或下降趋势;在平均值23.4附近随机波动,且波动范围有界,因此可初步判定能耗数据序列是平稳时间序列。

图3 地铁站环控系统能耗时间序列Fig.3 Time series of energy consumption of metro HVAC systems

时间序列的平稳性检验包括时间序列检验法和单位根检验法。为了进一步判断能耗数据序列是否平稳,本文对能耗数据序列进行ADF根检验。ADF假设检验:假设能耗数据序列存在单位根,即时间序列不平稳。在3种不同显著性水平下展开检验,1%:严格拒绝原假设;5%:拒绝原假设;10%:不能拒绝原假设。能耗数据序列的ADF根检验结果如表2所示。由表2可知,检验统计量adf=-3.63 < -3.43 < -2.86 < -2.57;且P=0.005 < 1% < 5% < 10%,因此拒绝原假设,可认为能耗数据序列是平稳时间序列。

Ljung-Box统计检验是常用的白噪声检验方法[11]。为检验能耗数据序列是否为白噪声序列,对能耗数据序列做延迟4阶的Ljung-Box统计检验,P均明显小于显著性水平0.01,因此原始序列不能判定为白噪声序列,即原始序列中包含不可忽略的相关信息。

表2 原始序列ADF根检验Tab.2 ADF test of original data sequence

注:adf为ADF单位根检验的统计量;P为置信度,即接受原假设检验的概率。

模型定阶是估计自回归阶数p和移动平均阶数q的过程。图4所示为能耗数据序列的自相关图和偏自相关图。横坐标为滞后阶数,纵坐标分别为自相关系数和偏自相关系数,阴影区域为系数的置信度边界。由图4可知,自相关系数呈衰减趋势,滞后57阶后在95%置信区间内可视为趋近于0,相关系数衰减的过程相对连续且缓慢,因此自相关系数可视为不截尾,确定q=0。观察偏自相关图,在滞后1、2、3、4阶时,偏自相关系数显著大于0;滞后5阶后,偏自相关系数迅速衰减趋于0,且在95%置信边界内随机波动,性质表现为5阶截尾,因此可初步确定p=5。

图4 序列自相关图和偏自相关图Fig.4 ACF and PACF charts of data sequence

为进一步确定最合适的自回归阶数,在p=5附近采用AIC信息准则估计不同自回归阶数对模型拟合精度的影响,如表3所示。由表3可知,当p=5时,AIC取得最小值,因此选取p=5。当确定最佳自回归阶数和移动平均阶数,可对能耗数据序列进行模型拟合。根据表1,构建ARMA(5, 0)模型,即AR(5)模型。

表3 不同自回归阶数下的AIC信息准则值Tab.3 AIC values of different p order

3.3 模型显著性检验

模型的显著性检验主要检验模型的有效性,即拟合模型是否充分提取观测值序列中所有的样本相关信息。当拟合模型为有效模型时,残差序列αt中不存在任何相关信息,从而残差序列αt为白噪声序列。采用4种方法对模型显著性进行检验。

1) 相关图检验

图5所示为能耗预测模型的残差序列αt的自相关图和偏自相关图,阴影区域为系数的置信度边界。由图5可知,自相关系数和偏自相关系数在0阶之后,在95%置信边界内以0为均值随机波动,且数值上均趋近于0,呈现出截尾的性质,因此可认为残差序列不存在自相关性。

图5 模型残差序列的自相关图和偏自相关图Fig.5 ACF and PACF of model residual sequence

2) DW检验

DW(Durbin-Watson,德宾-沃森)检验是检验残差自相关性的常用方法[17]。检验统计量DW的取值范围为区间[0, 4],当DW趋近于0时,序列显著正相关;当DW趋近于2时,序列不存在自相关性;当DW趋近于4时,序列显著负相关。对能耗预测模型的残差序列αt进行DW检验,经计算,检验统计量DW=1.31,因此可判定残差序列不存在自相关性。

3) QQ分布

为判断能耗预测模型的残差序列αt是否服从正态分布,将残差序列绘制QQ分布,如图6所示。由图6可知,拟合模型的残差序列值基本在拟合直线y=0附近呈近似对称分布,即残差序列服从均值为0、方差不变的正态分布。因此,可判断残差序列为白噪声序列。

4) Ljung-Box检验

Ljung-Box test是基于一系列滞后阶数,对时间序列是否存在滞后相关的一种统计检验[14]。对能耗预测模型的残差序列αt做假设检验,原假设:序列相关系数等于0,即序列为白噪声序列。检验结果如表5所示。当取显著性水平为0.01,最后一列检验概率显著大于显著性水平,说明序列相关系数与0没有显著差异,即可认为残差序列为白噪声序列。

图6 模型残差序列QQ分布Fig.6 QQ plot of model residual sequence

lagACQ概率(>Q)1-0.0190.6540.41920.0000.6540.7213-0.0020.6630.88240.0050.7100.95050.0070.7980.97760.0070.8720.99070.0060.9340.99680.0060.9950.99890.0081.1190.999100.0061.1871.000110.0131.5001.00012-0.07812.0500.442130.01312.3400.500140.00912.4970.566150.00712.5860.63416-0.0190.6540.419

注:lag为滞后阶数,AC为自相关系数,Q为Ljung-Box检验的统计量。

综上4种对能耗预测模型的残差序列αt的检验分析,一致判定模型残差序列中不存在任何相关信息,说明拟合模型为有效模型。

3.4 模型预测分析

模型构建之后,可利用能耗数据对模型进行拟合程度分析。模型观测值与拟合值的拟合序列如图7所示。由图7可知,拟合值与观测值基本吻合。

图7 地铁站环控系统能耗拟合分析Fig.7 Energy consumption fitting analysis of metro HVAC systems

MAE(平均绝对误差)和RMSE(均方根误差)可分别用式(5)、式(6)计算:

(5)

(6)

根据上式,可进一步对拟合模型进行性能评估。经计算,MAE和RMSE分别为0.101和0.470。因此,该模型对地铁站环控系统能耗数据序列具有很好的拟合效果。

4 结论

地铁站环控系统的建模和预测对于提高环控系统运行效率和地铁站节能运行具有重要意义。本文通过对地铁站环控系统能耗数据进行时间序列分析,提出了一种基于ARMA模型的地铁站环控系统能耗预测方法,介绍了建模的分析过程和步骤。通过实地采集地铁站环控系统能耗数据,对能耗数据进行平稳性检验和白噪声检验,构建能耗预测ARMA模型,采用4种方法对拟合模型的有效性进行检验。得到如下结论:

1)该方法充分考虑了地铁站环控系统能耗的不确定性因素,建立了有效的ARMA模型,提取出地铁站环控系统能耗数据中有价值的信息。

2)对于地铁站环控系统能耗预测具有较高的拟合精度,MAE和RMSE分别达到0.101和0.470,具有较高的理论意义和应用价值。

本文受华中科技大学自主创新研究基金(5003120005)项目资助。(The project was supported by Independent Innovation Research Foundation of Huazhong University of Science and Technology (No.5003120005).)

猜你喜欢
阶数控系统残差
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
确定有限级数解的阶数上界的一种n阶展开方法
关于DALI灯控系统的问答精选
基于残差学习的自适应无人机目标跟踪算法
联调联试中列控系统兼容性问题探讨
15相感应电机槽配合研究
数字电视播控系统关键技术探究
基于深度卷积的残差三生网络研究与应用
复变函数中孤立奇点的判别