基于多元逐步回归及实时修正的长江南京站高潮位预报

2023-06-09 00:59周莉严锋何健鲍庆煜朱庆云于飞龙
水利水电快报 2023年3期
关键词:水位站潮位高潮

周莉 严锋 何健 鲍庆煜 朱庆云 于飞龙

摘要:

南京潮水位站是长江进入江苏的“第一站”,提高潮位预报精度对于南京市防洪减灾具有重要意义。利用南京潮水位站2010~2020年高潮位超过8.50 m年份的实测资料,采用多元回归分析建立南京潮水位站高潮位预报模型。为消除多重共线性的影响,采用逐步回归对变量进行筛选,并对预报模型进行实时修正以提高预报精度。结果表明:根据GB/T 22482-2008《水文情报预报规范》,该模型预报精度可达甲等。该预报方法简单、实用,对于提高受潮汐影响站点的潮位预报精度具有一定的参考价值。

关键词:

高潮位预报; 多元逐步回归; 实时修正; 南京潮水位站

中图法分类号:P338

文献标志码:A

DOI:10.15974/j.cnki.slsdkb.2023.03.003

文章编号:1006-0081(2023)03-0022-04

0 引 言

长江南京段位于长江流域下游,南京潮水位站作为重要的国家基本水位站,承担着该河段的水文监测工作,为该地区的防汛、抗旱、海事、航运、供水等众多部门提供水情数据[1]。历史资料表明,长江流域洪水频发,在秦始皇元年至唐代中期遭受201次洪涝灾害,其中长江下游占大部分[2];20世纪,长江流域共发生3次特大洪水,分别为1931年、1954年和1998年[3],其中1954年8月17日,南京潮水位站超历史,测记最高潮水位10.22 m;21世纪,长江流域共发生2次特大洪水,分别为2016年和2020年,其中2020年7月21日长江南京站潮水位再次超历史,观记最高潮水位为10.39 m。长江流域防洪形势严峻,为减少洪涝灾害带来的人员伤亡和经济损失,南京潮水位站潮位预测显得尤为重要。

庄一鸰等[4]采用相应水位法建立长江南京站潮位预报方案;张行南等[5]采用改进的相应水位法、分离过程线法和有限记忆最小二乘法分别建立南京潮水位站潮位预报方案。易建军等[6]选用1996,1998,1999,2000年汛期水文观测资料(大通流量过程和下关站前期潮位过程),采用近似方法建立下关站潮位过程预报模型。孙宜宝等[7]选用1991,1995,1996,1998,1999,2003年的实测资料,采用相关预报方法建立南京潮水位站高潮位预报方案。闻余华等[8]采用多因子回归方法对南京潮水位站高潮进行预报,但未考虑实时修正;朱庆云等[1]选用1950~2011年南京潮水位站实测月最高潮位,利用差分自回归移动模型(ARIMA)研究潮水位变化规律、预报月最高潮位。

考虑到2020年长江南京站潮水位再次超历史,本文在原有研究基础上选用2010~2020年的最新数据,同时考虑到上游来水和潮汐变化的影响,以及影响因子存在多重共线性的问题,建立了基于多元逐步回归及实时修正的南京潮水位站高潮位预报模型。

1 潮位影响因素

长江南京段位于长江下游,长江南京站潮水位主要受上游来水和下游潮汐影响[9],区间来水亦是影响因素,但相对而言影响不大。

1.1 上游来水影响

上游来水影响主要是来自大通站以上的降雨径流影响。大通站水位和流量的相关系数高達0.965,因此二者均可代表洪水的大小。大通站水位和流量是南京潮位站最高潮位的主要影响因素[7]。因此,本文选取大通站水位作为上游来水影响因子。

1.2 潮汐影响

长江下游自大通起至徐六泾止,为感潮河段,水位受潮汐影响,长江南京段水位因此呈现明显的半日潮,每天出现两个高潮、两个低潮,最大潮差可达1.5 m以上。因此,位于长江口的吴淞站的潮位可作为表征潮汐对长江南京段水位影响的因子。

1.3 区间来水影响

大通站至南京潮水位站的区间面积仅占南京潮水位站以上面积的3%,绝大多数情况下,区间来水对南京潮水位站水位影响不大[10]。

综合以上分析,南京潮水位站潮位的主要影响因素为上游来水及海口潮汐这两个因子,区间来水的影响在本文中不予考虑。

2 数据来源与研究方法

2.1 数据来源

南京潮水位站设立于1912年1月,现有观测项目:最高和最低潮水位、水温、逐日降水量。本文选用南京潮水位站2010~2020年间高潮位超过8.50 m的年份(2010,2015,2016,2017,2019,2020年)的实测资料进行分析,共有114组样本,每组样本选取Z南京,Z大通1,Z大通2,Z吴淞1,Z吴淞2共5个因子,其中Z南京为南京潮水位站的高潮位,Z大通1为大通站前1日08∶00水位,Z大通2为大通站前2日08∶00水位,Z吴淞1为吴淞站前一次高潮位,Z吴淞2为吴淞站前前次高潮位。

2.2 研究方法

SPSS(Statistical Product and Service Solutions)作为现今最权威的两大统计软件之一,具有数据管理和统计分析等功能,其中统计分析功能包括相关分析和回归分析等[11]。本文利用SPSS进行多元线性回归分析,建立因变量y与自变量xi之间的回归模型[12],见式(1):

y=b0+b1·x1+ b2·x2+…+ bk·xk+e(1)

式中:b为回归系数;e为随机误差。

多元线性回归分析需满足3个假设:

(1) 独立性。各自变量之间不能存在多重共线性;在进行分析解释之前,需进行共线性诊断[13]。常用的参数有容差(Tolerance)、方差膨胀因子(Variance Inflate Factor,VIF)、条件指数(Condition Index,CI),具体标准见表1。

为满足独立性要求,本文选取逐步回归方法对自变量进行筛选:将自变量逐个引入模型,当原先引入的自变量因后面引入自变量变得不再显著时,则将其删除。不断重复该步骤,直到既没有影响显著的自变量选入回归方程,也没有影响不显著的自变量从回归方程中剔除为止[14]。

(2) 正态分布。自变量任意线性组合,残差服从正态分布。

(3) 方差齐性。自变量任意线性组合,因变量方差不变,残差齐性。

回归方程建立之后,需通过方差分析(F检验)、t检验以及确定性系数R2检验方程的有效性[15]。其中,当R2>0.6表示模拟效果良好。

3 结果分析

考虑到大通站水位及吴淞站潮位变化趋势的影响,本文根据资料选取大通站前1日与前2日08∶00水位,以及吴淞站前一次高潮位与前前次高潮位4个因子进行逐步回归,建立大通水位-南京潮位-吴淞潮位相关关系,并进行实时修正。

3.1 多元回归方程建立

本文选取2010,2015,2019,2020年南京潮水位站85组数据进行多元回归分析。由表2可知,大通站水位是南京潮水位站潮位的主要影响因素。大通站前1日、前2日08∶00水位两个因子间相关系数为0.983,相关性较大;吴淞站前一次高潮位、前前次高潮位两个因子间相关系数为0.825,相关性较大。为消除多重共线性的影响,本文通过逐步回归建立大通水位-南京潮位-吴淞潮位相关关系,各因子间的相关性见表2,多元回归模型回归系数见表3。

由表3可知,大通站前1日08∶00水位、吴淞站前一次高潮位2个因子与南京潮水位站高潮位相关,自变量Z大通1,Z吴淞1的VIF<10,该模型不存在多重共线性问题。对该模型显著效果解释如下。

(1) 模型调整R2=0.925>0.6,即该回归模型对因变量的解释程度为92.5%,模拟效果较好。

(2) 该回归方程的显著性水平小于0.05,在F检验中拒绝原假设,因变量(南京潮水位站高潮位)与自变量(Z大通1,Z吴淞1)的线性关系显著,即该回归模型能有效预测因变量。

(3) 自变量Z大通1,Z吴淞1的VIF<10,该模型不存在多重共线性问题。

(4) 标准化残差呈正态分布,散点在直线附近,回归方程满足线性及方差齐次检验。其中,图1为正态分布曲线直方图,可以发现图形基本呈现钟形,表示样本观测值基本符合正态分布假设。图2 为回归标准化残差的标准P-P图,由图可知,该图从左下到右上呈现一条45°的直线,表明样本分布基本符合正态分布的标准。

综上分析,该模型符合线性、独立性、正态性、齐次性这4个假设,且回归效果显著。根据表3系数b,可得到南京潮水位站高潮位Z南京的回归方程:

Z南京=0.699Z大通1+0.280Z吴淞1-2.127(2)

根据GB/T 22482-2008《水文情报预报规范》,用率定期内2010,2015,2019,2020年南京潮水位站超8.50 m水位期间观测资料(85组数据)进行评定,回归模型的精度评定见表4。

3.2 多元回归方程检验

选取2016,2017年29组数据进行验证。根据GB/T 22482-2008《水文情报预报规范》要求,对预报方案进行检验,检验期精度评定见表5。由表5可知,当许可误差取正常潮位预报许可误差±0.30 m时,合格率为79.31%,预报方案为乙等;当许可误差取±0.10 m時,合格率仅为6.90%,没有达到南京潮水位站潮位预报精度要求。

3.3 实时修正

为了提高南京潮水位站高潮位的预报精度,选取前1日南京站高潮位预报差值c对预报值进行实时修正,可得到修正后的南京潮水位站高潮位Z南京修正的回归方程:

Z南京修正=0.699Z大通1+0.280Z吴淞1-2.127-c(3)

经过对预报值进行实时修正,回归模型的率定期和验证期的评定精度分别见表6~7。

通过表4~7可知,南京潮水位站高潮位通过实时修正以后,率定期和验证期的平均误差、平均相对误差均减小,许可误差分别取±0.10 m和±0.30 m时的合格率均得到大幅提升。根据GB/T 22482-2008《水文情报预报规范》,经过实时修正,率定期和验证期的精度等级均达到甲等。

4 结 语

本文利用多元线性回归方法建立南京潮水位站高潮位预报模型。为消除多重共线性的影响,采用逐步回归对变量进行筛选。对南京潮水位站高潮位进行实时修正后,率定期和验证期的精度等级均达甲等。该预报方法简单、实用、价值高,对于受潮汐影响站点的潮位预报有一定的参考借鉴作用。

参考文献:

[1] 朱庆云.ARIMA模型在南京站月最高潮位预报中的应用[J].人民长江,2013,44(增1):20-21.

[2] 姚亦锋.南京市城市地理变迁及现代景观[M].南京:南京大学出版社,2006.

[3] MIDDLETON N.Rivers:A Very Short Introduction [M].Oxford:Oxford University Press,2012.

[4] 庄一鸰,林三益.水文预报[M].北京:水利电力出版社,1986.

[5] 张行南,况惠恒,吴一鸣.南京站实时潮位预报系统研制[J].水利科技与经济,2005(8):487-489.

[6] 易建军,王建群.潮位过程预报的近似方法[J].东北水利水电,2005(8):36-37,54-56.

[7] 孙宜宝,赵建华,严锋.长江南京站高潮潮水位预报方案[J].江苏水利,2006(7):33-35.

[8] 闻余华,司存友,罗利雅.多元回归方法在长江南京站潮位预报中的应用[J].江苏水利,2012(4):28-29.

[9] 张丽.南京站潮位实时预报系统研究[D].南京:河海大学,2001.

[10] 李国芳,黄振平,章志强,等.长江防洪堤南京段设计洪水位风险分析[J].河海大学学报(自然科学版),1999(2):25-30.

[11] 李娜卿.基于SPSS多元回归分析的城市地下水用水量预测[J].河北水利,2021(8):42-43.

[12] 黄振平.水文统计学[M].南京:河海大学出版社,2003.

[13] 张凤莲.多元线性回归中多重共线性问题的解决办法探讨[D].广州:华南理工大学,2010.

[14] 周莉,李致家,韩通.基于地形地貌资料的Nash单位线参数规律研究[J].湖泊科学,2016,28(5):1141-1147.

[15] 林彬.多元线性回归分析及其应用[J].中国科技信息,2010(9):60-61.

(编辑:江 文)

High tidal level forecasting of Nanjing Tidal Level Station on Yangtze River based on Multiple Stepwise Regression and real-time correction

ZHOU Li1,YAN Feng1,HE Jian2,BAO Qingyu1,ZHU Qingyun1,YU Feilong1

(1.Nanjing Branch of Jiangsu Province Hydrology and Water Resources Investigation Bureau,Nanjing 210008,China; 2.Jiangsu Province Hydrology and Water Resources Investigation Bureau,Nanjing 210029,China)Abstract:

Nanjing Tidal Level Station is the first hydrological station located along Yangtze River in Jiangsu Province.Improving the accuracy of tide level forecasting is important for flood control and disaster reduction of Nanjing.The high tidal level forecasting model introduced in this paper was established with the method of Multiple Regression,using the measured data of high tidal level over 8.50m from 2010 to 2020.In order to eliminate the effects of multicollinearity,the variables were screened with the method of stepwise regression,at the same time,real time modification was conducted in the forecasting process to improve the forecast accuracy.The results showed that the model forecast accuracy reached the level of Class A stipulated by the GB/T 22482-2008 Standard for Hydrological Information and Hydrological Forecasting Standard.The forecasting method is simple and effective,which can be useful for improving the forecast accuracy of tidal level of the hydrological station affected by tide.

Key words:

high tide level forecasting;Multiple Stepwise Regression;real-time correction;Nanjing Tidal Level Station

收稿日期:

2022-04-28

作者簡介:

周 莉,女,工程师,硕士,主要从事水文测报工作。E-mail:zhoulinanjing@163.com

猜你喜欢
水位站潮位高潮
基于距离倒数加权的多站潮位改正方法可行性分析
唐山市警戒潮位标志物维护研究
百折再看高潮来
中小河流白石沟水位站预警水位分析
酉水河茅坪镇水位站预警水位确定分析
多潮位站海道地形测量潮位控制方法研究
信息化雨量、水位站在水文工作的应用探讨
基于改进的OLS-RBF模型的感潮河段潮位预测研究
相关图法在平南水位站洪水预报中的应用探讨