偏最小二乘-马尔科夫模型在大坝位移预测中的应用

2015-07-25 06:41周子东郑东健
三峡大学学报(自然科学版) 2015年3期
关键词:马尔科夫实测值大坝

周子东 郑东健 蒋 明 钱 程

(1.河海大学 水利水电学院,南京 210098;2.河海大学 水文水资源与水利工程科学国家重点实验室,南京

210098)

预测大坝位移对于水库工程的安全稳定运行具有十分重要的意义.大坝变形的原因十分复杂,受多种因素的共同影响.为了对未来的变形值做出预报,必须找出引起变形的因素与变形值之间的内在联系与统计规律,在这方面回归分析是一个很常用的方法[1].在大坝安全监测分析中,一般取直接观测值——水位、温度、时间等作为自变量,自变量之间常不同程度地存在着多重相关性[2].利用常用的最小二乘法来建立回归统计模型时易导致因子系数的不合理.偏最小二乘法则可有效消除多重共线性的影响,建立的回归模型结果更可靠,而且整体性强,具有更好的拟合、预测效果[3].同时考虑到大坝位移监测数据随时间有较强的波动性,而马尔科夫链对于数据的波动具有较好的适应性,应用在偏最小二乘回归模型中,将能进一步提高模型的预报精度.

1 偏最小二乘回归

1.1 基本原理

设有自变量m个{x1,x2,…,xm}和因变量p个{y1,y2,…,yp}.为探明两者之间的联系,选取n个样本点,由此分别组成了因变量与自变量的数据集X={x1,x2,…xm}n×m和Y={y1,y2,…,yp}n×p.PLS分别在X中提取成分t1,在Y中提取成分u1(t1、u1各自为x1,x2,…,xm和y1,y2,…,yp的线性组合).为了后续的回归分析,在提取时要求t1和u1不仅能尽可能好的代表数据集X和Y中的信息,与此同时t1和u1的相关度大,代表t1对u1要有最强的解释能力.

在t1和u1两个成分被提取后,PLS分别进行X和Y对t1的回归.如果此时回归方程的精度已经达到要求,停止计算;否则,把X和Y被t1解释后的结果再次进行成分的提取.循环往复,直至达到要求的精度.假设最终对X一共提取了l个成分t1,t2,…,tl,PLS将通过yk(k=1,2,…,p)对t1,t2,…,tl的回归,接下来再表达成yk关于原变量x1,x2,…,xm的回归方程.

1.2 计算步骤

1)标准化.记因变量标准化后的矩阵为F0,自变量的标准化矩阵为E0.

2)记t1是E0的第一个成分,t1=E0ω1,ω1是E0的第一个轴,它是一个单位向量,即‖ω1‖=1.

相应的记u1是F0的第一个成分,u1=F0c1.c1是F0的第一个轴,并且‖c1‖=1.

由原理中所述,在‖ω1‖2=1和‖c1‖2=1这两个条件下,要求t1与u1的协方差达到最大值,

采用拉格朗日算法,求得轴ω1和c1后,即可得到第1个成分t1,u1,然后,分别求E0和F0对t1,u1的3个回归方程

式中,E1,,F1为残差矩阵.

3)用上一步得到的残差矩阵E1和F1代替原来的E0和F0,然后,按照同样的方法求出ω2和c2及第2个成分t2,u2,依照前述步骤计算下去,如此循环,若X的秩是A,则一共可以提取A个成分.

4)交叉有效性.大多数情况下,我们并不需要选取全部的成分来进行建模,而是可以仿照主成分分析,选择前m个成分就可得到一个效果较好的模型.

指定,若

则认为此时增加成分th就是有益的.此即为交叉有效性原则.

2 马尔科夫链

马尔科夫链是数学中具有马尔可夫性质的离散时间随机过程.该过程中,在给定当前知识或信息的情况下,过去(即当期以前的历史状态)对于预测将来(即当期以后的未来状态)是无关的[4].大坝工作条件复杂,其位移监测受多种因素影响,马尔科夫链的此种无后效性在位移预测中有其特有的优势.

根据模型的阶数,马尔科夫过程可分为1阶至多阶.依据马尔科夫链把数据序列分成若干状态,即把观测值与预测值之间的误差分成若干区间,以E1,E2,…,Es来表示,则误差状态由Em经过k步转移到En的概率为[5]

式中,表示状态Em经过k步变为Ej的次数;Cm表示状态Em出现的总次数.则k步的状态转移概率矩阵为:

有了状态转移概率矩阵以后就可以建立误差预报模型,对误差进行修正.

3 偏最小二乘-马尔科夫模型

偏最小二乘-马尔科夫模型原理是先利用前期实测数据资料建立偏最小二乘回归模型,求得拟合值与实测值之间的误差,然后根据误差状态,建立状态转移概率矩阵,运用马尔科夫链对后续的预测数据进行修正,步骤如下:

1)选取适当的统计模型的因子,根据上述偏最小二乘回归的原理对实测值进行拟合,建立回归模型.

2)把拟合值与实测值相减得到误差序列,用误差除以实测值,得到误差的百分比大小,然后根据百分比大小,划分误差的个数q,误差状态Ei及对应区间[ai,bi](i=1,2,…,q).

3)按照马尔科夫链修正的原理确定状态转移概率矩阵P(k),对上一步得到的误差建立模型修正.选取距预测点最近的一组q个已知概率状态的误差,在每个误差对应步长的状态转移概率矩阵中,找到该误差所属状态对应的转移概率,然后把每个误差状态Ei(i=1,2…,q)的转移概率相加,看其最终转移到哪一个状态的概率最大,即认为预测值的误差就处于这个状态之中,然后根据公式(9)进行修正.

4 工程实例

本文选取某双曲拱坝实测资料对偏最小二乘-马尔科夫模型的预测效果进行测试.

拱坝由于水平拱和悬臂梁的两向作用,使水压力分配在梁上的荷载(Pa)呈非线性变化,Pa与H呈二次或三次曲线关系,因此写成通式[6]:

在有内部温度计的情况下,可采用各温度计的测值作为因子.当有足够数量的混凝土温度计时,可选用各温度计测值作为因子[7]:

时效分量综合反映坝体混凝土的基岩的续编、塑性变形以及基岩地质构造的压缩变形,对于拱坝可采用对数函数,即:

由上述分析可知,坝体位移模型的表达式为:

选取该拱坝第13坝段110组(20130709~20131026)位移观测数据以及相应的水位,温度数据(温 度 计 选 取T13-2,T13-6,T13-64,T13-65,T13-122,T13-126测点)用于建立偏最小二乘回归模型,并再取后续7组数据用于预测.编制Matlab程序计算后得到回归方程为:=-24.353 4+0.034 1H+6.826 1×10-5H2+1.788 1×10-4H3+5.186 6×10-10H4-2.244 8T13-2+3.025 2T13-6+0.536 9T13-64-0.306 7T13-65+0.039 9T13-222-0.003 3T13-126-0.175 3lnθ.

将每组数据的影响因子的值代入回归方程,得到拟合位移值和实测位移值的位移过程线见图1.

图1 拟合位移值与实测位移值过程线图

由图看出,偏最小二乘回归的拟合精度是比较高的,由数据得出其误差范围为-1.8%~1.2%,因此将拟合值与实测值之间的误差分为4个区间,[-2%,-1%],[-1%,0],[0,1%],[1%,2%],即确定状态转移区间,以便后续进行马尔科夫修正.

表1 状态转移区间

然后经由误差序列计算状态转移概率矩阵,结果如下:

以预测20131027位移误差概率为例,未修正前预测值为11.655,马尔科夫修正过程见表2.

表2 20131027位移误差概率预测

由表2可以看出,20131027位移误差落在状态E1的概率最大,根据式(9)进行修正后结果为11.832.

理论上若无数据更新的话,4阶马尔科夫链最多只能修正后4d内的数据,本实例旨在测试偏最小二乘-马尔科夫模型的精度,因此选取后7组知道实测值的数据进行测试,这样后3d的数据也可以继续用马尔科夫链进行修正.测试的结果见表3.

表3 模型预测结果对比

由表可知,偏最小二乘回归模型预测的相对误差最大为1.48%,最小为0.322%;经马尔科夫链修正以后的最大误差为0.632%,最小为0.016%,精度有了较大的提高.图2可以更直观的看出修正后模型的预测精度.

图2 模型预测结果与实测值对比

5 结 论

偏最小二乘回归在大坝位移预测中有着特有的优势,能很好的避免影响因子之间的多重相关性,并对影响因子进行了成分提取,相较普通多元回归提高了精度;马尔科夫过程无后效性的特点,在误差修正中有着很好的应用,本文将两者相结合,发挥各自的优势,先采用偏最小二乘回归得到一个回归方程,然后利用拟合值与实测值之间的误差序列建立了马尔科夫的修正模型进行修正,精度比单一偏最小二乘回归的预测结果提高了许多,具有推广的价值.

[1] 邹 利.回归分析在大坝变形监测数据处理中的应用研究[J].工程地球物理学报,2007,4(6):644-647.

[2] 邓念武.偏最小二乘回归在大坝位移资料分析中的应用[J].大坝观测与土工测试,2001,25(6):16-18.

[3] 徐洪钟,吴中如.偏最小二乘回归在大坝安全监控中的应用[J].大坝观测与土工测试,2001,25(6):22-23,27.

[4] 张爱真.Markov链在工程预测中的应用[J].制造业自动化,2011(4):106-108.

[5] 朱劭宇,施晓萍.大坝变形监控的逐步回归马尔科夫模型[J].水利水文自动化,2010(1):69-72.

[6] 吴中如,顾冲时,苏怀智,等.大坝与坝基安全监控理论和方法及其应用[C].//中国工程院第三次地下工程与基础设施公共安全学术研讨会论文集,2007:25-34.

[7] 吴中如.水工建筑物安全监控理论及其应用[M].北京:高等教育出版社,2003.

猜你喜欢
马尔科夫实测值大坝
基于三维马尔科夫模型的5G物联网数据传输协议研究
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
基于叠加马尔科夫链的边坡位移预测研究
常用高温轴承钢的高温硬度实测值与计算值的对比分析
基于改进的灰色-马尔科夫模型在风机沉降中的应用
市售纯牛奶和巴氏杀菌乳营养成分分析
一种基于实测值理论计算的导航台电磁干扰分析方法
大坝:力与美的展现
马尔科夫链在教学评价中的应用
正式挡水的马来西亚沐若大坝