使用TimeGAN和LSTM神经网络预测隧道开挖引起的建筑物沉降

2022-10-29 04:43陈雪峰
华南地震 2022年3期
关键词:原始数据监测数据时序

陈雪峰

(宁波市建设工程安全质量管理服务总站,浙江 宁波 315046)

0 引言

地铁施工可能出现地铁隧道穿越或者靠近已建建筑物的情况,造成已有建筑物的沉降。建筑物沉降超过一定数值,就可能对建筑物产生损害、给人民生命和财产造成损失。因此,有必要对地铁隧道施工引起的建筑物沉降进行预测。

传统建筑物沉降预测模型有回归分析、灰色理论方法和BP神经网络方法等。比如,基于回归分析方法,陈丽佳[1]结合凤凰城项目深基坑变形监测数据,对监测数据进行分析和预测;尹盛斌和丁红岩[2]基于基坑监测数据提出了时序—投影寻踪回归模型对沉降进行了预测。基于灰色理论方法,王强等[3]采用GM(1,1)模型,对基坑开挖所引起的支护结构水平位移进行了预测;魏健等[4]结合实际监测数值,提出了建筑物沉降预测方法。但是,传统建筑物沉降预测模型常常存在易陷入局部极值、对缺失值较敏感等问题,需要新的方法来提高建筑物沉降的预测精度。

建筑物沉降监测数据属于时间序列数据。长短期记忆神经网络(LSTM)对等间隔时序数据有较好的预测效果,近年来获得了很多应用。比如,Kim等[5]使用LSTM模型对海洋表面的温度和高水温进行了预测;Li等[6]利用LSTM神经网络、基于历史空气数据来预测未来空气污染物的浓度;Rashid和Louis[7]提出了一个数据增强框架,使用LSTM模型对建筑设备活动进行识别。

尽管LSTM神经网络在多个领域的时序数据处理方面有了较多成果,但用于建筑物沉降预测的研究还不多。生成对抗网络(Generative Adversarial Network,GAN)能够较好学习原始数据的分布特征、生成与原始数据相似的数据,为有效增补数据提供了良好途径[8]。肖儿良等[9]使用GAN网络对医学图形中的计算机断层加权核磁共振成像(MRT2)进行了高质量的图形融合处理;Song等[10]基于GAN网络对雷达数据进行仿真生成处理,结果表明生成雷达数据的分布与原始雷达数据分布相似;Bowles等[11]使用GAN网络对医学图像数据进行了合成处理,将GAN衍生合成数据引入训练集,结果表明戴斯相似性系数提高了4%;Cui等[12]提出了基于GAN网络的遥感卫星图像数据增强方法,显著提高了识别准确率;Zhang等[13]使用一种基于噪声的超分辨率对抗生成网络对大脑磁共振图像进行了纹理恢复;Pham和Bui[14]使用GAN网络,将卫星图像分辨率扩增到10 m。通常情况下,GAN网络用于数据集的扩增,而GAN神经网络衍生的时间序列对抗神经网络(TimeGAN)对时间序列扩增有较好的效果。

本文拟以宁波地铁5号线同德路站—石碶站区间建筑物沉降监测数据为研究对象,使用TimeGAN神经网络对建筑物沉降原始监测数据进行扩增,使用基于LSTM的人工神经网络模型进行训练与预测,提出隧道开挖引起建筑物沉降的一种预测方法。

1 建筑物沉降监测数据

1.1 工程概况及测点布置

本文的研究对象是宁波地铁5号线同德路站—石碶站区间的建筑物沉降监测数据。同德路站—石碶站区间采用单圆盾构法施工,区间单圆隧道上行线1184.09 m,下行线1195.882 m。本工程监测范围为3H(H为隧道等效直径)。

本文将对监测点JC11-4的监测数据进行分析。该测点布置位置如图1所示。监测原始数据曲线如图2所示。

图1 建筑物测点布置Fig.1 Layout of measuring points of buildings

图2 测点JC11-4的沉降Fig.2 Settlements at measuring point JC11-4

1.2 使用TimeGAN进行数据扩增

使用LSTM网络进行沉降预测时,样本过少容易造成模型过拟合、降低网络的实用性,所以,需要首先对原始数据进行扩增处理。

对抗生成网络(Generative Adversarial Network,GAN)为人工合成数据提供了有效途径,可以用于原始数据集的扩增处理。本研究使用GAN网络的衍生模型-时间序列对抗神经网络(TimeGAN)进行沉降时序监测数据的扩充。

TimeGAN由四个网络组件构成:嵌入网络(Embedding)、恢复网络(Recovery)、序列生成器(Generator)和序列鉴别器(Discriminator)。这一神经网络的本质是让模型学习真实数据的分布。网络具体训练过程如图3所示。

图3 TimeGAN网络数据扩增流程Fig.3 Data amplification in TimeGAN network

使用TimeGAN之前,先对原始建筑物沉降监测数据进行预处理,包括时序处理和归一化处理。归一化采用的是线性函数归一化公式,如下面的式(1)所示:

式(1)中,Xnorm为归一化后的数据,X为建筑物沉降原始输入数据,Xmax和Xmin分别为原始数据集的最大值和最小值。

预处理后的数据如图4所示。可以看出,数据预处理后,建筑物的沉降分布在区间(0,1)。

图4 原始建筑物沉降数据预处理Fig.4 Preprocessing of original settlement data of buildings

将预处理后的数据输入TimeGAN神经网络中进行数据扩增,将建筑物沉降数据扩增过程进行可视化,得到图5。图5中,橙色曲线和蓝色曲线分别表示原始沉降监测数据和新生成的数据。

由图5(a)可以看出,模型迭代2次时,TimeGAN神经网络按照建筑物原始沉降数据分布关系开始生成新数据,新生成数据与真实数据分布相差比较大、还没有学习到真实数据的特征。

由图5(b)可以看出,模型迭代150次时,新生成数据在数量上已经与原始建筑物沉降数据相同,但数据分布规律与原始数据分布规律差别比较大、还没有很好学习到真实数据的分布特征。

由图5(c)可以看出,模型迭代500次时,新生成数据分布形式比图5(b)更加接近原始数据,TimeGAN网络已经能够较好地实现扩增。

图5 不同迭代次数下网络训练过程的可视化Fig.5 Visualization of network training process under various iterations

1.3 数据扩增效果评价

下面从三个方面来评价建筑物沉降新生成时序数据的效果,分别是:t分布随机邻域嵌入可视化(t-SNE)和主成分可视化分析(PCA)、判别分数(Discriminative Score,简称DC)分析、预测分数(Predictive Score,简称PS)分析:

(1)t-SNE和PCA可视化分析。t-SNE和PCA分析用于数据的降维,可以将时间高维变成二维,从而生成二维空间中的建筑物沉降分布与原始数据分布,有利于直观了解原始数据和新生成数据的相似程度。

原始建筑物沉降时序数据通过TimeGAN神经网络后,新生成数据与原始数据t-SNE与PCA的可视化结果如图6所示。图中,蓝色线(Synthetic)表示新生成的建筑物沉降数据,红色线(Original)表示原始的建筑物沉降数据。

从图6可以看出,经过TimeGAN网络生成的建筑物沉降数据与原始建筑物沉降数据重叠效果较好,说明新生成的数据与原始数据的相似性较好,即TimeGAN神经网络能够较好学习原始时序数据的特征。

图6 t-SNE和PCA可视化Fig.6 Visualization results for t-SNE and PCA

(2)DC分析和PS分析。DC用于量化生成数据和原始数据的相似性,DC越小、则生成数据与原始数据就越相似。PS用于保证生成数据的实用性,PS越小,新生成数据继承原始数据的特性就越好。原始建筑物沉降时序数据经过TimeGAN网络后,新生成数据的DC和PS分别为0.18和0.04,说明新生成的建筑物沉降数据与原始建筑物沉降数据相似性强、实用性强,较好继承了建筑物沉降原始时序数据的预测特性,能够较好用于原始数据集的扩充。

2 建筑物沉降预测LSTM网络的建立

通过以上t-SNE和PCA可视化、判别分数和预测分数的分析结果来看,建筑物原始沉降数据经过TimeGAN网络后,新生成的数据与原始数据重叠性好、相似性强且继承了原始数据的预测特性。

下面将使用TimeGAN网络后扩增后的数据集,建立建筑物沉降的LSTM时序预测模型。

2.1 LSTM网络的结构

LSTM是循环神经网络(RNN)中的一种特殊结构,该网络通过增加三种门控:遗忘门ft、输入门it和输出门ot来学习长远历史时间序列数据中的特征,根据式(2)~(7)来判断该数据是否符合网络输入要求:

式中,σ为sigmoid激活函数;Wf为上一单元隐藏层的输出和当前输入数据xt相乘的权重矩阵;bf为遗忘门的偏置;Wit为输入门it在t时刻的输入xt的权重矩阵;Wc为新生成信息在t时刻的权重矩阵;bi、bc为输入数据和新生成信息在当前单元的偏置;Wot为输出门ot的权重矩阵;bo为偏置。

建筑物沉降预测模型网络结构框架如图7所示。结构框架包括输入层、隐藏层、输出层、网络训练、网络预测等5个模块。输入层负责对原始建筑物沉降数据和通过GAN网络生成的数据进行预处理,隐藏层采用LSTM结构,输出层输出建筑物沉降的预测值。

图7 建筑物沉降预测框架Fig.7 Prediction framework for building settlement

2.2 LSTM网络的评价指标

为了评价建立的建筑物沉降预测模型性能的好坏,使用均方根误差(RMSE)进行模型评价,计算公式为:

式(8)中为预测值,Yi为真实值,n为迭代次数。

3 结果及分析

原始建筑物沉降数据通过TimeGAN神经网络后,由101个数据生成了1010个数据。将新生成数据作为LSTM网络的原始数据进行训练,训练过程中的损失曲线和RMSE如图8所示。

从图8可以看出,网络训练过程中,随着迭代次数的增加,损失曲线下降;迭代次数为800时,损失曲线开始稳定;建筑物沉降预测网络最终均方根误差(RMSE)为1.3323,说明网络预测值与真实值相差较小、网络性能较好。

图8 建筑物沉降LSTM网络训练过程中的损失与均方根误差Fig.8 Loss and RMSE in building settlement LSTM network training

使用网络对生成数据集,预测结果如图9所示。从图9可以看出,使用新生成的1010个建筑物沉降数据来训练LSTM网络,预测值与监测值吻合性较好,本文所建LSTM网络可较好用于建筑物沉降的预测。

图9 使用扩充数据后沉降预测值与监测值随时间的变化Fig.9 The variation of predicted and monitored settlements with time after using extensive data

为了验证本文所建立模型的预测性能,分别将未进行数据扩增后的预测结果、进行数据扩增后的预测结果以及建筑物沉降监测值进行对比,结果见图10。

图10 不同数据来源下沉降预测值与监测值随时间的变化Fig.10 The variation of predicted and monitored settlements with time under different date sources

从图10可以看出,未对原始数据进行扩增时,建筑物沉降原始数据较少,预测值与监测值相差较大、相差最大出现在第89 d(监测值为-3.77 mm、预测值为-2.05 mm、两者相差45.6%)、网络预测准确率只有54%左右;使用TimeGAN网络对原始数据进行扩增后,预测值与监测值比较接近、相差最大出现在82 d(监测值为-3.65 mm、预测值为-4.48 mm、两者相差22.7%)、预测准确率达到77%左右;其余时刻预测值与监测值相差均小于20%、预测准确率均高于80%,原始数据扩增后预测值准确率提高了23%。与使用原始数据的LSTM网络相比,使用TimeGAN扩增数据进行训练,LSTM网络的RMSE提高了44%,网络得到了较大改善。所以,使用TimeGAN网络对建筑物沉降原始监测数据集扩增,可以有效提高LSTM网络预测的准确率、使预测值与监测值更加接近。

5 结论

本文根据宁波地铁5号线同德路站—石碶站区间建筑物沉降监测数据,使用时间序列对抗神经网络(TimeGAN)对原始数据进行扩增处理,将新生成数据与原始数据一起输入到LSTM模型进行训练,建立了沉降预测模型,得到以下结论:

(1)使用时间序列生成对抗网络对原始建筑物沉降数据进行扩增后的数据与原始数据重叠程度较高,新生成的数据与原始数据吻合性较好。

(2)新生成建筑物沉降数据判别分数和预测分数分别为0.1759和0.0412,新生成数据与原始数据相似性较强、较好保留了原始数据的预测特性。

(3)与使用原始数据进行训练的LSTM网络相比,使用TimeGAN扩增数据进行训练的LSTM网络,预测准确率提高了23%。

(4)TimeGAN-LSTM网络的准确率达到了80%,预测值与监测值基本一致,可用于隧道开挖引起的建筑物沉降预测。

猜你喜欢
原始数据监测数据时序
GOLDEN OPPORTUNITY FOR CHINA-INDONESIA COOPERATION
基于Sentinel-2时序NDVI的麦冬识别研究
受特定变化趋势限制的传感器数据处理方法研究
GSM-R接口监测数据精确地理化方法及应用
基于FPGA 的时序信号光纤传输系统
全新Mentor DRS360 平台借助集中式原始数据融合及直接实时传感技术实现5 级自动驾驶
一种毫米波放大器时序直流电源的设计
GPS异常监测数据的关联负选择分步识别算法
基于小波函数对GNSS监测数据降噪的应用研究
变电站监测数据采集系统