基于集合经验模态分解与BP 组合模型的短期余水位预测

2020-07-02 01:44屠泽杰邢喆辛明真樊妙卜宪海孙毅
海洋通报 2020年1期
关键词:分量水位模态

屠泽杰,邢喆,辛明真,樊妙,卜宪海,孙毅

(1.山东科技大学 测绘科学与工程学院,山东 青岛 266590;2.国家海洋信息中心,天津 300171)

潮汐是海洋活动中最为显著的动力现象,也是影响海洋经济活动的重要因素。实时精准的水位预报能为大型船舶进出港口、潜水作业提供安全保障,同时也为航运编制提供决策依据。此外,利用水位变化较强的空间相关性,精准的水位预报能减少验潮站布设数量、扩大预报范围,从而节省成本支出。目前,调和分析法在水位预报中有着广泛的应用,其原理是通过天文分潮调和常数回报潮位,以此产生了诸如潮汐表、区域潮汐模型(许军等,2017)等潮汐预报工具。在生产应用中,潮汐表的预测精度较低(20~30 cm),而区域潮汐模型的构建需要大量的长期验潮站资料和测区地形资料,增加了工程的实施难度。因此,高精度、易实施的实时水位预报模型在海洋工程中有着迫切需求。

在水位预报中,潮位是满足潮汐(潮波)规律的部分,而由环境因素引起的余水位(水位异常)会使水位具有非确定性和时变性(方国洪 等,1986),其预测难点在于无法量化诸如风、气压、降水等短周期气象因素以及季节性气候因素引起的增减水,这是制约传统水位预报模型精度的主要原因,为此,许多学者展开了研究分析。裴文斌等(2007)分析了相邻验潮站余水位的相关性,提出了差分方法,完成了两站间的余水位传递,但并未实现余水位的预报。孙美仙等(2014)利用余水位分布特征进行统计分析,实现了余水位的短期预报,但仅从统计意义上的分析无法给出余水位变化规律的物理机制,因此具有一定的局限性。

随着人工智能的发展,神经网络、模糊逻辑推理也逐步应用到海洋水文要素预报中。李燕初等(2012)采用混沌理论提高了短期水位预报的精度。胡继洋等(2006)将多年的验潮站数据进行BP 神经网络训练,证实了神经网络在水位预测中的可行性。薛明等(2019)比较了不同因子输入的多种神经网络模型,在台风型风暴潮水位的短期预测中获得了较好的预测效果。但是上述研究将水位或余水位序列作为整体去进行分析计算,会掩盖不同成因所引起的变化规律,这是因为部分信号在一定的时间尺度下是接近平稳的。经验模态分解(FMD)是处理非平稳信号的方法,能将信号中存在的不同尺度波动逐级分解出来。Pan 等(2018)利用该方法成功地捕获了全日分潮、半日分潮和其他非平稳特征。张存勇等(2013)对连云港近岸海域的余水位数据进行FMD 分解,认为在该区域风和气压是导致余水位变化的主要因素。然而,使用FMD 对复杂的非平稳信号进行分解,会造成严重的模态混叠现象(Wu et al,2009)。集合经验模态(FFMD)是FMD 的改进算法,能有效地减少FMD 中出现的模态混叠现象。

目前,FFMD 多用于对非平稳信号的分析,但在余水位预报方面应用较少,若能通过FFMD 完成对BP 网络中余水位样本数据的优化,就能有效提高BP 网络模型的逼近和预测能力。基于上述分析,本文利用FFMD-BP 组合模型,从余水位序列中分离出平稳特征和非平稳特征,通过BP 网络训练和预测,以期提高余水位的短期预报精度。

1 原理和方法

为了解余水位的成分和变化规律,首先应对实测水位数据进行调和分析,用实测水位数据与天文潮回报的潮位之差作为余水位序列。由于复杂无序的余水位序列不利于网络学习和预报,需通过集合经验模态法进行分解,进而获得有限个本征模函数(IMF)和一个剩余分量。FFT 变换后的IMF 分量频谱特征有助于分析余水位的成因和变换规律。最后,通过BP 神经网络对这些分量进行训练并向后预报24 h,各分量的预测结果之和即为余水位的预测值,具体流程见图1。

图1 实验流程图

1.1 集合经验模态分解

经验模态分解(Fmpirical Mode Decomposition,FMD)是一种处理非平稳信号的方法,它基于信号局部特征尺度进行分解,无须预先设定基函数,可以将时域内的任意复杂信号分解为互不相同、有限的信号分量,每个分量称为一个本征模函数(Intrinsic Mode Function,IMF) (Huang et al,1998)。FMD 分解是在时域展开,分量的振幅和频率随时间而变化,这对于后续余水位的预测工作是有利的。由于FMD 分解存在着模态混叠问题,产生了FMD 的改进算法—集合经验模态分解(Fnsemble Fmpirical Mode Decomposition,FFMD)。利用高斯白噪声频谱均匀分布的特性,在待分解信号中加入高斯白噪声,从而改变原序列的极值点分布,将每次获得的IMF 分量做平均处理后作为最终结果,具体步骤如下:

①初始化高斯白噪声序列的幅值为ξe,次数为N。

②在原始信号x(t)中加入该噪声序列ni(t),则:

③设a(t)和b(t)分别为xi(t)的极大值和极小值拟合成的包络线。则两条包络线的均值c1(t)可以表示为:

④若hi1(t)满足如下两个条件:在整个数据集里,极值点的数目与穿过零点的数目必须相等或者最多相差1 个;由局部极大值所构成的包络线以及由局部极小值所构成的包络线的均值为零。若不满足则将hi1(t)当作原始时间序列,重复上述过程,经过k 次筛选后,直至其满足给定的阈值Sd:

此时得到h1k(t)即为IMFi1(t),剩余信号r1(t)为:

⑤对r1(t)重复③~④步骤,直至n 次分解后rn(t)为单调函数时停止。

⑥此时,得到i 个IMF 分量和1 个剩余分量ri(t),即:

⑦重复上述步骤N 次,将对应的IMF 分量总体取平均值,则最终IMF 分量和剩余分量为:

于是,原始信号经FFMD 分解后可表示为:

1.2 BP 神经网络

BP 神经网络是一种多层前向神经网络,包含输入层、输出层和若干个隐藏层,具有较强的非线性映射能力和自学习自泛化能力。数学理论证明三层的神经网络就能够以任意精度逼近任何非线性连续函数。图3 是典型的单隐含层BP 网络,图中x是输入神经元,K 是隐含层神经元,Y 是输出层神经元。从xm到Ki的连接权值为ωmi,从Ki到Yj的连接权值为ωij。

图2 单隐含层BP 神经网络

1.3 基于组合模型的余水位仿真实验

假设x(t)余水位信号由频率为25、50、100 的正弦函数和高斯白噪声a(t)简单构成:

对该余水位序列x(t)进行FFMD 分解,取ξe=0.2,N=100。图3(a)是余水位仿真信号经FFMD分解后的IMF 分量图。原始信号被分解成了8 个IMF 分量和1 个剩余分量。不难发现,FFMD 从原始信号中成功捕获了3 个规律性的IMF 分量,通过FFT 变换后(图3(b)),验证其为频率100、50

为探究BP 神经网络对不同IMF 分量的预测效果,本文选取平稳特征分量IMF2、非平稳特征分量IMF1 及IMF5 进行预测。考虑到IMF 分量中存在模态混叠问题,需对不同频率组成的重构函数进行预测,其中:和25 的正弦函数,而高斯白噪声则被分解成了其余5 个分量。RFS 为剩余分量,代表余水位整体变化趋势。

图3 EEMD 分解效果图

图4 BP 网络对不同IMF 分量的预测效果

使用300 个仿真数据序列作为样本,向后预报100 个序列,结果如图4 所示。可以看到,平稳特征分量的预测效果十分显著,而非平稳特征分量的预测误差随着预报时长的增长逐渐累积,但整体变化趋势与真值基本一致,且在短期内达到了较好的预报效果,验证了该组合模型在短期预报中的可行性。

1.4 余水位预测精度评定

采用均方根误差(rootmeansquareerror,RMSF)和平均绝对误差(mean absolute error,MAF)来评定余水位预测结果的精度。

式中,Hi表示余水位观测值,Hi.model表示模型预测值,n 表示待预测的余水位观测值个数。

2 实例分析

2.1 研究区域与数据

哥伦比亚河是美国第三大河,年平均流量约为7 500 m3·s-1,流域面积约为660 500 km2(Jay et al,1997),其潮汐具有全日潮和半日潮的混合特征(Jay et al,2011),天然径流主要来自降雪,汛期集中在4-7 月,河道内建有多个水电站(J.W.弗格森等,2012)。下游河口处的水位日变化范围为1.7 ~3.6 m,在Astoria 站 处 最 大 可 达2.0 ~4.0 m(Moftakhari et al,2016)。本文选取了哥伦比亚河下游河口处三个验潮站(图5):Astoria 站、Skamokawa 站以及Wauna 站两年(2017 年1 月1日-2018 年12 月31 日)的逐时水位数据。水位数据来源于美国国家海洋和大气管理局(NOAA)。

图5 验潮站位置概略图

采用开源潮汐分析软件T_tide(Pawlowicz et al,2002) 对各站两年的水位数据进行调和分析,在95 %置信区间下,获得包含半日分潮、全日潮、浅水分潮和长周期分潮在内的68 个分潮,并计算了后报潮位与原始水位数据的方差比,如表1 所示,基本消除了原始水位中潮位的影响。将水位观测数据与天文分潮后报的潮位数据之差作为余水位,如图6 所示。

表1 各站T_tide 调和分析结果

哥伦比亚河有两个较强的河水流量调节期(Kukulka et al,2003),其中河水最大流量发生在5 月-7 月,主要是由于盆地内部的积雪消融所引起。11 月至次年3 月河水会有短暂的高流量,这是由于西部盆地出现了强烈的热风暴,引起强降雨和融雪,因此河水流量会在几天或几周的时间尺度上发生较强波动。从各站的余水位变化趋势上看,大致符合上述两个时间窗口,且各站余水位变化趋势大致相同,说明了余水位在复杂的河口地区仍具有较强的空间相关性。

图6 哥伦比亚河下游Astoria 等站2017-2018 年逐时余水位

2.2 IMF 分量分析

相比于开阔海域,河口处的余水位成因更为复杂,它是非线性的正压海潮、地形、水流和其他因素相互作用的结果(Godin,1985)。对Astoria 站的余水位进行FFMD 分解,得到了13 个IMF 分量和1 个剩余分量(图7(a))。采用FFT 变换对13个IMF 分量进行傅立叶频谱分析。从图7(b)中可以看到,虽然FFMD 能够有效抑制模态混叠现象,但是并不能完全分离不同频率的模态。与IMF2 分量相比,IMF1 分量除了具有半日潮的特征外,还混叠有周期为2.5~12.5 h 的高频信号。除气象因素外,主要是由于河口处受到海底地形摩擦力影响导致潮波变形,从而使分潮相互作用形成倍潮和复合潮;此外,就潮汐本身而言,通过调和分析展开的浅水分潮数量受限于水位观测时长,很难用有限数目的浅水分潮来体现总的浅水效应(方国洪,1981)。表2 显示了除IMF1 外的12 个分量的主频率和振幅。IMF3 和IMF4 虽然具有相同的主频率,但具有不同的振幅,显示了FFMD 在处理模态混叠问题上的优势。IMF2 的周期对应半日分潮周期变化;IMF3、IMF4 的周期对应全日分潮周期变化;IMF11 的周期对应Sa 分潮周期变化。上述IMF 分量存在着近似潮汐周期特征的原因有三点,第一点是由于天文潮和风暴潮的非线性耦合作用会导致信号叠加(冯士筰,1982);第二点是由于气候、天气变化以及人为因素造成的伪周期信号;第三点则是由于在调和分析中存在天文潮推算误差(牛桂芝等,2009)。不可忽视的是,在河口地区余水位存在着较强的季节性和年度变化,IMF5、IMF6 的周期对应余水位的多日变化;IMF7 至IMF10 的周期对应余水位的季节性变化;由于受到水位数据长度限制,IMF12、IMF13 分量实际上可能对应余水位的多年变化;最后的剩余分量显示了余水位的变化趋势。

图7 Astoria 站余水位EEMD 分解效果图

表2 Astoria 站12 个IMF 分量的主频率和振幅

表3 Skamokawa 和Wauna 站EEMD 分解结果与Astoria 站对应IMF 分量的皮尔逊相关系数

Skamokawa 和Wauna 站的IMF 分量与Astoria站对应IMF 分量的皮尔逊相关系数见表3。Wauna站相比Skamokawa 站的皮尔逊相关系数略低,但两站的IMF2-IMF13 分量均与Astoria 站表现出了显著的相关性,说明引起上述IMF 分量变化的因素是伴随整个站区的,且随着空间距离的增大而逐渐减弱。由于IMF1 是浅水分潮产生的复杂混叠信号,而浅水分潮的激发机制主要是海底摩擦力潮波形变以及各分潮引起的非线性耦合,不具有较强的空间相关性。因此,三站在IMF1 分量上的相关性较差。

2.3 组合模型预测

本文使用样本前24 个数据进行滚动预测,以样本后50 个数据作为验证数据,以“Tansig”作为隐含层的传递函数,以“Purelin”作为输出层的传递函数。选取最小全局误差为0.000 1,学习率为0.05,隐含层节点个数为30,最大训练次数为6 000 次。

以Astoria 站为例,将实验分成两组,第一组实验对Astoria 站2017 年1 月1 日0 时-2018 年12月30 日23 时余水位数据进行FFMD 分解。以各个IMF 分量为样本,使用三层神经网络结构进行训练。

网络的训练拟合结果表明,除了IMF1 分量的皮尔逊相关系数略低(约0.8)外,其余分量的相关系数均接近1。训练完成后的网络向后预测24 h,并将获得的各IMF 分量的预测结果相加(余水位的恢复过程)。第二组实验则直接使用未分解的余水位数据进行训练并向后预测24 h。Skamokawa 站和Wauna 站的实验过程与Astoria 站相同。

将所得结果与各站2018 年12 月31 日的余水位观测值进行对比(图8),并计算其在6 h、12 h、24 h 时间段内的预测精度(见表4)。在第一组实验中,各站在6 h、12 h 时间段内的均方根误差均维持在厘米级;在24 h 时间段内,Skamokawa 站和Wauna 站的均方根误差仍维持在厘米级,而Astoria 站的均方根误差则逐渐增大至12.9 cm。在第二组实验中,各站在不同时间段内的均方根误差都超过了10 cm,最高达到19.6 cm。结果表明,实验1 在余水位短期预测中的表现要优于实验2,其精度在动力复杂的河口地区仍能接近厘米级,这是由于FFMD 能有效地将复杂信号分解成有限个本征模函数,从而使神经网络获得较好的训练结果。

由于三站的余水位呈现较高的相关性,为研究不同时长的余水位数据在组合预报模型中的表现,选取Astoria 站1 年、半年及1 个月的水位数据按上述实验步骤进行纵向对比,实验结果见表5。结果表明,不同时长的余水位数据经组合模型预测后仍能达到较高的精度,其中时长为1 年的余水位预报结果最优,这是由于观测时长为1 年的水位数据经调和分析后能有效消除潮位的影响,且与两年时长相比,又能减少网络因过拟合而导致的泛化误差。

图8 各站余水位预测值与观测值对比图

表4 各站余水位预测精度(cm)

表5 Astoria 站不同时长余水位数据的预测精度(cm)

3 结论

本文通过哥伦比亚下游河口处3 组典型验潮站的余水位数据,采用FFMD-BP 神经网络组合模型预测了未来不同时段内的余水位值,通过实验分析可总结如下:

(1)FFMD 分解能有效地将复杂的余水位数据分解成时域下有限个IMF 分量,通过FFT 变换,证明余水位中存在包括半日分潮、全日分潮在内的分潮和其他非平稳特征。

(2)各站的IMF1 分量的空间相关性较差,而其他IMF 分量具有显著的空间相关性,且随着各站距离的增大而逐渐减弱。

(3)FFMD-BP 神经网络组合模型在6 h、12 h时间段内的各站余水位预测精度均达到了厘米级,在24 h 时间段内的预测精度接近厘米级,均优于直接使用原始余水位数据进行预测的结果。此外,不同时长的余水位数据对组合模型预测精度有一定影响,其中1 年时长余水位的预测精度优于2 年、半年及1 个月。

(4)实验表明,该模型在处理非平稳特征的余水位短期预测中有着较好的效果,这是复杂的余水位时间序列被分解成了相对简单的IMF 分量的缘故。若要实现高精度的余水位预测,则必须结合包含气象资料在内的多种资料,从本质上研究各成因的变化规律。

猜你喜欢
分量水位模态
基于BERT-VGG16的多模态情感分析模型
多模态超声监测DBD移植肾的临床应用
跨模态通信理论及关键技术初探
一斤生漆的“分量”——“漆农”刘照元的平常生活
一物千斤
论《哈姆雷特》中良心的分量
日版《午夜凶铃》多模态隐喻的认知研究
基于FFT的航空发动机整机振动分量实时跟踪监视
七年级数学期中测试题(B)