基于灰色支持向量机残差修正模型的地面沉降量预测

2021-06-18 03:39宁志杰
地质与勘探 2021年3期
关键词:预测值残差修正

宁志杰,袁 颖,2

(1.河北地质大学城市地质与工程学院,河北石家庄 050031;2.河北省高校生态环境地质应用技术研发中心,河北石家庄 050031)

0 引言

随着我国经济的迅猛发展和城市化进程的加快,人们对空间资源和矿产资源的需求量越来越大,资源的过度开发对周围环境造成了极大的影响和破坏。其中,以地下空间及矿产资源的开发和高层建筑的兴建等工程活动引起的地面沉降现象尤为严重。地面沉降不仅会引起周边建筑物和地下管线的变形,而且区域性的地面沉降往往伴随着地裂缝的发生,严重危及人民的生命财产安全。因此,通过发现已有地面沉降数据内在的规律与本质,预测未来沉降量与沉降趋势是一个值得探索的问题。

目前应用于地面沉降量预测的模型有很多种,如种亚辉等(2019)基于时序InSAR技术对常州市重点沉降区域的沉降量进行了预测;周爱红等(2018)采用粒子群优化的支持向量机模型对盾构施工引起的地面沉降量进行了预测;戴文婷等(2019)通过缓冲算子优化原始序列,对地铁施工过程中的地表沉降量进行了预测;彭立顺等(2019)采用优化后的神经网络对南城高速路基沉降量进行了预测。上述各类单一模型都能够对沉降量进行预测,但是均存在预测精度较低的情况。为了提高预测结果的精度,结合不同模型的优点建立组合模型在地面沉降量的预测中应用越来越受到重视。李慧洁等(2016)以山西省太原市阎家峰路段地面沉降数据为基础,建立了泊松和指数模型的组合模型,对黄土地区高填方路堤沉降量进行了预测;杨彪等(2016)将人工神经网络与灰色GM(1,1)模型相结合,建立了GM(1,1)-ANN预测模型对某工程沉降监测点数据进行了预测;武光伟(2016)针对沉降量具有非平稳时序性和发展趋势确定的特点,建立了GM(1,1)-AR组合模型,对某高层建筑物的沉降量进行了预测;王朋飞(2017)基于经验模态分解(EMD)和支持向量回归(SVR)相结合的预测方法,建立EMD-SVR模型对长春自由大道地铁站地表沉降量进行了预测。上述组合模型有效地提高了沉降预测的精度,在一定程度上表明了组合模型在沉降量预测中的优势。

鉴于此,本文基于GM(1,1)模型具有处理小样本、贫信息,弱化原始序列随机性的特征和SVM模型泛化能力强、处理小样本、波动大、非线性样本数据等方面的优势,采用SVM模型对GM(1,1)模型沉降量预测值的残差进行修正,建立GM(1,1)-SVM模型,并检验GM(1,1)-SVM模型在沉降量预测方面是否能够取得更好的效果以及该模型能否满足实际应用的需要。

1 模型理论

1.1 灰色GM(1,1)模型

中国控制论专家邓聚龙教授于1981年提出灰色系统概念,并于1982年建立了灰色系统理论。该理论以部分信息已知、部分信息未知的灰色系统为研究对象,通过对部分已知信息的处理、开发和分析,实现对整个灰色系统的发展趋势、变化规律进行准确的反映和描述。目前,应用最广泛的是GM(1,1)模型,它通过对原始数据累加形成有规律的时间序列数据,进而建立微分方程形式的预测模型(Dejamkhooy et al.,2017;Manjunatheshwara and Vinod,2018;Shi et al.,2018;Gao et al.,2018)。具体的步骤为:

(1)设建模序列x(0)有n个对应的观测值

x(0)={x(0)(1),x(0)(2),...,x(0)(n)}

(1)

式中:n为数据个数。

(2)进行累加运算使其成为有规律的时间序列数据,弱化其随机性

(2)

(3)构造变量x(1)关于时间t的一阶微分方程GM(1,1)方程

(3)

式中:ax(1)项中的a为发展系数;u为灰色作用量;其中a和u均为未知。

(4)由上式的离散形式,可得如下矩阵,并简化为线性模型:

Y=[x(0)(2),x(0)(3),...,x(0)(n)]T

α=(au)T

Y=Bα

(4)

式中:Y为数据向量;B为数据矩阵;α为参数向量。

(5)用最小二乘估计法求解上述简化的线性模型得

(5)

(6)

(7)

(7)同时以平均相对误差作为检验GM(1,1)模型精度和预测效果优劣的方法,其具体计算方法为

(8)

(9)

1.2 SVM模型

SVM方法是建立在统计学理论中的VC理论和结构风险最小原理基础上的一种机器学习方法。当需要处理低维空间难以处理的数据集时,SVM通常会通过一个非线性映射将这些数据映射到高维空间,在此空间构造最优超平面使各类之间的距离达到最大来解决分类问题(图1)。它的关键在于核函数,核函数能够有效地解决空间内积的计算过程复杂繁琐、计算量庞大的问题,这就意味着,当我们确定好核函数后就能在高维空间对这些数据进行有效的学习和识别(Huang et al.,2016;Qian et al.,2016;Wei et al.,2018;Abdolrazzaghi et al.,2018)。SVM具体的实现过程为:

图1 超平面划分示意图

(1)将回归问题转化为求结构最小风险度问题

对于给定的样本,[(xi,yi)],i=1,2,3...,n。n为样本总数,xi为训练样本的各个参评指标,yi为相对应的评价结果。根据SVM理论建立一个目标函数并设置约束条件,将最优化问题转化为结构风险度最小问题。

(10)

(11)

式中:αi和αj为拉格朗日乘值;ω为权值矢量;b为偏置值;C为惩罚因子;ξi,ξi*为松弛因子;ε为允许误差;φ(x)为从输入空间到高维特征空间的非线性映射。

(2)解决对偶问题并引入核函数

(12)

(13)

式中:xr和xs为一对支持向量;αi为与每个样本对应的拉格朗日乘子;αi*为最优解;K(xi,x)为核函数。本文通过阅读大量文献选择了在时间序列预测中应用较为广泛的RBF核函数,其公式如下:

K(x-xi)=exp(-g|x-xi|2)

(14)

式中:g为参数。

1.3 GM(1,1)-SVM残差修正模型

在GM(1,1)模型的精度不理想的情况下,应当考虑建立残差修正模型。GM(1,1)-SVM残差修正模型首先利用SVM模型对残差序列进行修正,然后将GM(1,1)模型预测出来的沉降量与SVM模型修正后的残差序列相加,最终得到GM(1,1)-SVM模型的预测结果。在SVM模型训练过程中采用GA算法对参数C和g寻优(Vijayashree and Sultana,2018;要震等,2018;杨风开和程素霞,2018;Han et al.,2019)。GM(1,1)-SVM模型具体的实现过程如下:

(3)同时仍以平均相对误差检验GM(1,1)-SVM残差修正模型预测效果的优劣。

2 模型预测效果分析

由GM(1,1)-SVM残差修正模型的建模过程可知,当GM(1,1)模型精度较差、预测结果难以满足实际应用时,需要考虑建立GM(1,1)-SVM残差修正模型。因此本节首先采用GM(1,1)模型对沉降量进行预测,并根据预测结果分析GM(1,1)模型存在的问题以及是否需要建立残差修正模型。若GM(1,1)模型精度较差则按1.3节中的步骤建立GM(1,1)-SVM残差修正模型,将预测结果与GM(1,1)模型的预测结果进行对比,分析GM(1,1)-SVM模型能否解决GM(1,1)模型存在的问题以该模型的预测结果能否满足实际需要。

2.1 数据来源

某高层建筑地面18层,地下2层,基础埋深8 m,采用天然地基,地基土类型为低压缩性的粉土及粉质黏土。为研究高层建筑建成后对周围建筑的影响,有关单位从2010年高层建筑完工到2012年的2年内对该高层建筑的沉降量进行了监测频率为1次/月的长期监测。记录了该高层建筑的沉降发展情况,监测点平面布置图如图 2所示,本文以2010年7月~2011年12月的时间段内角点A1、B1和B5的18次沉降数据为例进行了后续分析。

图2 监测点平面布置图

2.2 GM(1,1)模型预测效果分析

以角点A1、B1和B5的18次沉降数据的平均值(表1)作为沉降量样本,为充分利用所收集的沉降数据,提高沉降量的预测次数(即预测更长时间段内的沉降发展趋势),通过不断的调整拟合沉降数据与预测沉降数据的次数经过反复试算,最终确定采用前15次地面沉降值作为建模序列建立GM(1,1)模型,预测第16次~第18次的地面沉降值。首先,将前15次沉降值作为建模序列相对应的15次观测值(形如式(1)所示),采用式(2)~(5)对上述15次观测值进行累加、建立微分方程、求解线性模型获得灰参数α,通过式(6)建立离散形式的GM(1,1)模型时间响应函数。由式(7)可知,GM(1,1)模型的预测过程是一个累减还原的过程,当取式(7)中的t为18时,不仅能够得到第16~18次沉降量的预测值,并且通过累减还原还会得到前15次沉降量的预测值,称其为拟合值。将GM(1,1)模型的18次累减还原值划分为对前15次沉降量的拟合结果和第16~18次沉降量的预测结果见图3,并通过式(8)计算残差值见表1。

表1 高层建筑监测点18次实际沉降量平均值

图3 高层建筑沉降量拟合结果与预测结果对比图

由图 3从整体上对18次实际沉降值与GM(1,1)模型的18次沉降量累减还原值进行对比分析可知,实际沉降量以第7次观测数据为分界点,可以近似的看为是斜率不同的两段直线,分界点前沉降量增长较快,分界点后沉降量增长缓慢。表明该高层建筑竣工后的一段时间内地面沉降量增长迅速,随着时间的推移沉降量增长缓慢乃至于停止,这符合我们对地面沉降现象的认知。而由图 3中沉降量累减还原值不难看出,在不考虑第一次的沉降量累减还原值时,沉降量累减还原值的增长类似于一条增长率逐渐增大的曲线,这不符合沉降量后期缓慢增长的实际情况,将会导致第16次~第18次的沉降量预测值偏高。为排除建模序列长度对GM(1,1)模型预测效果的影响,采用1次~第5次的沉降量值作为建模序列建立GM(1,1)模型,预测第6次~第7次的沉降量时,发现沉降量的累减还原值仍近似于一条增长率逐渐增大的曲线。该结果表明模型累减还原值的这种曲线形式的增长规律并不是由建模序列过长引起的。因此,认为GM(1,1)模型沉降量累减还原值呈曲线形式增长是模型本身的问题。

在实际地面沉降量预测过程中,由于预测沉降量所对应的沉降实际值是未知的,不可能通过第16次~第18次地面沉降量的预测值与实际值进行对比分析预测效果的好坏,只能通过对比前15次沉降量拟合值与实际值判断GM(1,1)模型第16次~第18次的预测值是否符合实际情况。由表1中残差值计算得出GM(1,1)模型的前15次拟合值与实际值的平均相对误差为27.6%可知,模型的精度并不理想;而由图 3中拟合结果部分可知,拟合值与实际沉降值的第4次~第12次拟合程度较高,第1次~第4次和第12次~第15次的拟合效果较差,并且由图 3中第12次~第15次残差值逐渐增大的趋势可知,沉降量预测值增长量要比实际沉降值增长快,综上所述,推测GM(1,1)模型的第16次~第18次的预测值较实际值是偏高的,而由图 3中预测结果部分可知沉降量预测值的确比实际值高。由于这种预测值偏高的情况是模型本身导致的,难以通过调整GM(1,1)模型的相关参数提高模型沉降预测的效果,只能通过预判第16次~第18次的残差值,将其与GM(1,1)模型第16次~第18次的预测值相加来降低模型预测值的误差,因此考虑利用泛化能力强、处理突变问题效果较好的SVM模型对残差进行修正。

2.3 GM(1,1)-SVM模型预测效果分析

为了克服模型本身的缺陷,提高预测结果的准确性,以表1残差序列中的18个残差值作为原始数据建立SVM模型。SVM模型建模的具体步骤为:以残差序列的第1次~第3次数据作为输入xi,第4次作为输出yi;再以第2次~第4次数据作为输入xi,第5次作为输出yi;以此类推,基于式(10)~(12)对上述12组数据处理得到式(13)中的回归函数建立SVM模型,预测第16次~第18次残差值,接着将残差修正值与GM(1,1)模型的预测值对应相加作为GM(1,1)-SVM模型的预测值。最后将两种模型的第16次~第18次地面沉降预测值同实际值进行对比,并根据式(9)计算出预测结果的平均相对误差来检验预测结果的精度,如表2所示。

表2 GM(1,1)模型和GM(1,1)-SVM模型预测结果对比

由于SVM模型预测效果受参数C和g影响较大,为了获得最优的参数值本文利用MATLAB语言编写GA算法进行参数寻优,遗传算法的初始参数为:种群的最大数量设置为20,进化终止代数为100,参数C的取值范围为(0,100],参数g的取值范围为[0,1000],SVM交叉验证参数为默认值5,GA算法的寻优过程如图 4所示。经过不断地迭代计算最终确定SVM模型最优参数值为C=3.06,g=0.2。利用GA算法所确定的参数值作为SVM模型的最优参数值对上述残差序列进行预测。

由图 4可知,采用GA算法对SVM模型参数进行优化,在遗传进化至54代后,SVM模型能够对训练样本数据进行有效的识别,取得了很好的优化效果,GA算法有效地避免了依赖经验数据进行参数优化,同时缩短了寻找SVM模型最优参数的时间,提高了预测结果的准确率。

图4 GA算法寻优过程图

由表2可知,GM(1,1)模型和GM(1,1)-SVM模型的平均相对误差分别为24%和2.2%,表明GM(1,1)-SVM模型的沉降预测值更逼近真实值,预测精度更高,能够在实际工程中取得更好的应用。并且通过表2可以计算出GM(1,1)模型和GM(1,1)-SVM模型的预测结果与实测沉降数据的相对误差,GM(1,1)模型第16次~第18次地面沉降预测值的相对误差为17.7%,24.4%,30%;GM(1,1)-SVM模型第16次~第18次地面沉降预测值的相对误差为1.6%,2.8%,2.3%。由此可知,经过残差修正后建立的GM(1,1)-SVM模型第16~18次地面沉降预测值的相对误差相对于GM(1,1)模型均有显著降低,表明采用SVM模型修正残差对提高预测结果准确性是十分有效的。

此外,由表2不难看出,无论是GM(1,1)模型还是GM(1,1)-SVM模型,它们预测的沉降量值均高于实际沉降量的值。因此,利用SVM模型对残差序列进行预测,并与GM(1,1)模型的预测结果相结合,并不能从根本上解决GM(1,1)模型对沉降数据预测时出现的问题,但是通过这种方法能够减小预测结果的误差,增强预测模型在解决实际问题中的实用性。

3 结论

地面沉降是在多种因素共同作用下产生的一种地质灾害现象,难以用单一的预测模型准确有效地预测出未来一段时间内地面沉降量的发展趋势。当沉降序列展现出增长率逐渐增大的曲线形式变化规律时,GM(1,1)模型的预测效果会更加精确,而大多数实际沉降是一个前期沉降量增长迅速、后期沉降量增长缓慢的过程,沉降发展趋势并不符合曲线增长的变化规律。因此本文将GM(1,1)模型与SVM模型相结合建立GM(1,1)-SVM模型,充分发挥了GM(1,1)模型和SVM模型的优势,虽然不能从根本上解决GM(1,1)模型预测值偏大的问题,但是该模型做出了更符合工程实际的预测,为地面沉降数据的处理提供了一种新方法。

采取GA算法优化的SVM模型具有良好的自适应性以及预测结果准确率高的特点,实现了对残差的有效预测,但是在利用残差序列建立SVM模型的过程中,训练样本输入数据个数与输出数据个数的确定,仍有待进一步的研究和分析。

猜你喜欢
预测值残差修正
基于双向GRU与残差拟合的车辆跟驰建模
Some new thoughts of definitions of terms of sedimentary facies: Based on Miall's paper(1985)
修正这一天
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
基于残差学习的自适应无人机目标跟踪算法
法电再次修订2020年核发电量预测值
合同解释、合同补充与合同修正
基于递归残差网络的图像超分辨率重建
软件修正