ARIMA联合深度学习的基坑形变预测模型探讨

2021-11-18 11:53王隆安魏长寿张家威王俊杰李豪杰
矿山测量 2021年5期
关键词:差分残差测点

王隆安,魏长寿,张家威,王俊杰,李豪杰

(山东科技大学,山东 青岛 266590)

地铁车站深基坑开挖过程中最为重要的是其地下工程结构形变监测问题,通过实测数据进行形变分析、建模预测形变规律,是该类问题研究的重点。在已有的研究当中,有AR模型、灰色模型、BP神经网络模型、遗传算法等,都在形变拟合及预测问题上得到了众多应用[1]。容静等[2]使用改进灰色模型,合理剔除数据噪声,做出了地铁隧道形变预测方法;孟庆年等[3]使用AR模型求出模型参数,对工程形变作出预测;郭张军等[4]利用LSTM模型对大坝形变进行预测,证明其具有工程实用性。

在众多学者的研究中,多数是单一模型的工程拟合,其研究不能剔除多余噪声,少有组合模型的形变预测,笔者发现ARIMA模型与时间序列特征相吻合,经过差分后的形变数据平稳性达标,但模型预测值略微偏大[5]。LSTM记忆神经网络对历史数据有长期依赖性,在时间序列的预测中具有很高的契合度,但模型容易出现过拟合。鉴于此,展开ARIMA模型联合优化LSTM模型的研究,对数据进行差分处理、参数定阶、残差拟合、数据还原等步骤,再与众多模型进行动态过程发展态势的量化比较分析,其在众多模型中得出最优解,合理拟合预测基坑形变,可以为相似工程提供一定参考。

1 模型构建

1.1 ARIMA(p,d,q)模型

ARIMA模型可划分为三个部分,AR:自回归;I:差分;MA:移动平均[6-7]。ARIMA模型对数据有平稳性和非白噪声的要求[8],因此,需用差分法来实现序列的平稳性操作。通过白噪声P值确定差分阶数。

在自回归模型AR中,

(1)

式中,yt为当前值;μ为常数项;p为阶数;γi为自相关系数;εt为误差项。

移动平均模型着重解决AR模型误差项累加的精度问题[9],通过移动平均法剔除噪声,消除随机波动,在MA中,

(2)

式中,yt为当前值;μ为常数项;q为阶数;εt为误差项;θi为最优参数(需求解)。

经差分后,将AR与MA组合,即:

(3)

式(3)中各符号含义同式(1)、式(2)。

检验自相关系数ACF,用于随机变量与自身的比较。偏自相关系数PACF的检验,可以严格x(t)、x(t-k)之间的相关性。选出ACF和PACF大概范围后,进行热力图定阶,其目的是选择更简单模型[10-11]。

1.2 LSTM(Long Short-Term Memory Network)

LSTM 是通过设置了三个“门”来实现对单元状态的控制[9]。其中遗忘门决定了有多少数据会被记忆;输入门决定了有多少数据会被输入到单元状态中;而输出门则决定了单元状态有多少会被输入到输出值当中。单个单元内部结构图如图1所示。图中用四个虚线框标出了四个结构,从左到右分别为:遗忘门、输入门、当前单元状态输入部分的计算模块、输出门。

图1 LSTM单元内部结构图

LSTM 的训练算法流程与传统 RNN 的训练算法一致[12]:首先,求出各个神经元的输出值,再根据误差反向传播原理,得出各个神经元的误差项,根据梯度下降原理对各个权重矩阵与参数进行更新。通过对样本数据的学习,反复更新 LSTM 内部的权重矩阵及参数,直到网络整体误差达到标准,进而利用训练好的模型对数据进行拟合预测。

1.3 优化ARIMA-LSTM组合模型

首先,通过ARIMA建模后输出预测值序列、残差序列;然后,利用LSTM网络对残差序列建模,输出新的残差预测序列;最后,将新的残差序列与ARIMA预测值序列组合,得到组合结果[13]。建模流程如图2所示。

图2 ARIMA-LSTM组合模型构建方法图

其中,LSTM采用指数衰减学习率算法,增强模型的泛化性;采用早停止策略,弱化随机噪声的影响,防止过拟合。其方法在实例应用中给出。

2 实例应用

2.1 工程概况与数据来源

某地铁车站主体结构位于绿地内,场地条件较好,桩顶水平位移监测点使用徕卡TS15A1′R400全站仪观测,按《工程测量规范》(GB50026-2007)二等水平位移技术要求进行。在众多观测点中选取位于主测断面二上的测点ZQS06,从10.17~11.15共计23期数据进行拟合和预测。

2.2 程序设计与应用流程

整个实验过程完全按照程序设计与应用流程表展开,如表1所示。

表1 程序设计与应用流程表

2.3 算例分析

以测点ZQS06实验过程为例,选取该测点10.17~11.15共23期数据,其测点位置及原始数据可视化如图3、图4所示。

图3 ZQS06测点位置

图4 原始数据可视化

可以看出数据类型为时间序列,有些时段出现数据冗余,数据中间时段波动较大,应进行数据预处理(差分、白噪声检验),处理结果如表2所示。

P-value越接近0越平稳。由表2可知,进行d=2二阶差分,P-vaule=4.212 821e-7,白噪声为7.933 47e-5,二阶差分即可使原始数据的平稳性达标。

表2 差分、白噪声结果

对二阶差分序列做出ACF图和PACF图,得到p、q范围,结果如图5所示。

图5 自相关与偏自相关分析

ACF和PACF都呈现拖尾,在ACF图中,在1阶位置就开始基本落在置信区间内,且后方无过多噪声点,确定出q为1;在PACF图中,在1阶或2阶位置就开始基本落在置信区间内,且后方无过多噪声点,确定出p为1或2,由此可得(p,q)=(1,1)或(2,1)。

当有多组备选参数可以选择时,根据AIC值进行模型参数的选择,通过衡量模型的复杂度来选择更简单的模型,做出热力图如图6所示,完成最终定阶。

图6 热力图定阶

在热力图中,图块数值为AIC值,横纵坐标的选取原则为AIC值越小模型精度越高,选取尽量黑色的区域即为p、q最合适取值,结合偏自相关函数所确定的p、q值的范围最终确定为:p=1,q=1。

数据经二阶差分处理后其稳定性如图7所示,差分值稳定在(-1.5,1.5)之间,均值趋于0附近,结合表2可知,差分值P-vaule=4.212 821e-7,白噪声为7.933 47e-5,数据趋于平稳,无较大波动,已符合平稳序列要求。

图7 二阶差分稳定性分析

至此,确定为ARIMA(1,2,1)模型,将差分数据喂入模型,画出残差图,如图8所示,对模型精度进行评估。

图8 模型残差图

残差均值接近0且方差满足正态分布,模型精度符合要求。将残差序列喂入LSTM模型,LSTM模型采用均方误差计算误差,选择“Adam”优化器,迭代次数选择1 000次,网络结构如图9所示。

图9 LSTM网络结构

LSTM输出预测残差序列,联合ARIMA的拟合值,得到最终序列,与LSTM模型、GM(1,1)模型、MLP多层感知器及原始数据做出动态过程发展态势量化比较分析,如图10所示。

图10 ZQS06模型拟合对比分析

计算得出,ARIMA模型的RMSE误差相比于LSTM模型降低了15%,因此,先用ARIMA模型预测残差符合逻辑与实际。由图10可知,单一LSTM模型拟合值整体偏低;GM(1,1)模型基本保持单调上升的趋势,不适合非指数型序列的预测;MLP模型有些时段噪声过大;ARIMA-LSTM组合模型始终随着观测数据的变化而变化,且二者的数值十分接近。相较于单一LSTM模型、GM(1,1)模型和MLP模型,优化ARIMA-LSTM组合模型可以挖掘相隔较长时间数据的关联性,对此基坑形变规律的适应性更强。

3 结 语

本文挖掘ARIMA对于时间序列的优势,结合深度学习优化LSTM记忆神经网络对历史数据记忆的优点,将两者结合建立了优化ARIMA-LSTM组合模型,采用该模型应用于地铁基坑形变预测,结果表明:MLP多成传感器、GM(1,1)等模型单一预测精度较低,优化ARIMA-LSTM组合模型能充分利用两种单一预测模型各自的优势,在中长期的基坑形变规律拟合及预测中,该组合模型预测精度更高,继而可以作为该工程的预测模型来进行后续的研究分析。

猜你喜欢
差分残差测点
RLW-KdV方程的紧致有限差分格式
符合差分隐私的流数据统计直方图发布
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
数列与差分
基于CATIA的汽车测点批量开发的研究与应用
基于残差学习的自适应无人机目标跟踪算法
基于小波包位移能量曲率差的隧道衬砌损伤识别
广州市老城区夏季室外园林空间人体舒适度评价①
室外风环境实测及PHOENICS 模拟对比分析研究*
——以徐州高层小区为例