基于SUFI-2参数最适置信区间的参数优化方法结果对比分析

2021-07-19 06:46陈海涛曹向真
节水灌溉 2021年6期
关键词:水河置信区间径流

陈海涛,曹向真

(华北水利水电大学水资源学院,郑州450045)

0 引言

SWAT模型作为分布式水文模型,由于其可很好的模拟和反应不同水文要素和下垫面分布的不均匀性而在流域水文平衡、长期的地表径流模拟等方面得到了广泛的应用[1-3]。许多研究发现气候和土地变化对地表径流的形成具有很大的影响[4,5]。近年来基于SWAT 模型对研究区域的地表径流模拟演变规律、大尺度农业面源污染负荷以及城市水文响应的分析逐渐增多[6-9]。

SWAT 模型是在国外的数据和水文试验基础上建立的模型,直接运用在国内流域会出现不理想的情况[10,11],因此要将模型运用到中国流域,需要进行完整的模型验证评估,水文模型参数的不确定性研究及参数率定、校准问题一直是需要关注的重点[12,13]。水文参数的不确定性研究常采用SWAT 模型自带的参数敏感性分析或是SWAT-CUP 中的LH-OAT 方法[14,15]。在参数率定方面,白薇等通过对SWAT 模型自动率定模块的改进和应用[16],提出了一种快速率定SWAT 模型的方法,该方法只对部分子流域进行模拟,大大减少了自动率定所需要的时间。周帅等以黄河上游流域为例探究了水文模型参数独立以及交互作用对径流模拟的影响[17],结果表明,参数间的相互作用在径流模拟中具有很大的不确定性,对汛期的影响尤为显著。参数校准方法大多采用自动校准方法,即SWAT-CUP 自带的四种优化参数算法(SUFI-2、GLUE、PSO、Parasol),目前这些算法已被大量使用在水文模型的研究中。魏丹等构建分布式水文模型并通过改进的SUFI-2 算法对模型参数进行了不确定分析,探讨了SWAT模型在干旱和半干旱流域的适应性[18]。董天奥以河西支流域为研究区域,引入了PSO 优化算法,实现了SWAT 参数的批量优化[19]。薛晨等[20]则是采用SUFI-2和GLUE两种算法对我国霍林河流域的SWAT模型参数进行了不确定分析,比较了不同参数取值对径流模拟的影响。樊琨[21]等运用手动和自动两种方法对三水河流域进行径流模拟和调参,结果表明SWAT-CUP 方法效率高但稳定性差,结合人工干预后可获得更好的结果。但四种算法在同一流域的适用性比较研究还比较少,以上研究也大多没有考虑参数置信区间差异对四种校准方法所得精度结果的影响。

本文以湖北麻城举水河流域为例,通过SWAT建立月尺度径流模型,并采用SUFI-2 方法得到参数适宜置信区间,比较参数置信区间影响前后的3 种优化算法(GLUE、PSO、Parasol)径流结果并进行适应性分析。通过探究参数置信区间不确定性对径流模拟的影响,为模型参数率定及优化算法的选择提供了一种有效的方法。

1 研究区域应用

1.1 研究区域概况

举水河流域位于湖北省东北部,大别山南麓,长江中游下段北岸,北与河南接壤,东与巴水毗邻,西与倒水交界,南临长江,是鄂东北地区跨行政区域的一条较大水系。位于东经114°40'~115°28',北纬30°52'~31°36'。全长170.4 km,流域面积4367.6 km2,上游地区是著名的大别山区,重峦叠嶂,地势陡峭。中游地区主要是丘陵,自新洲城关以下进入鄂东滨江平原,地势平坦。全流域中山地约43.5%,丘陵占46.2%,平原10.3%。流域地势坡向与陆水相反,北高南低,河水自大别山南麓,顺着地势,直泻长江。举水两岸支流众多,流程短促,集水面积不大。河长超过2.5 km 的支流共有136条。举水流域年平均降水量1 224 mm,比全省平均值高出近百毫米,且降水季节分配不均并多暴雨,年际变化大,如上游麻城全年70%的降水量集中于4-8月。最大年降水量超过2 000 mm,最小年降水量不足700 mm。

1.2 研究数据来源

DEM 数据和坡度高程数据来源于中科院地理空间数据云,使用ArcGIS 进行剪裁变换后得到所需区域的DEM 图(图1)。土地利用数据来源于中国科学院资源环境科学与数据中心的Landsat 数据,按照国家土地利用分类方法解译得到研究区域土地利用类型图(图2)并与SWAT 中的代码建立土地利用分类检索表(表1)。土壤数据来源于世界土壤数据库(Harmonized World Soil Database,HWSD)和1∶100 万的中国土壤数据库,经GIS重分类处理后得研究区域土壤类型分布图(图3),研究区域内的主要土壤类型为不饱和疏松岩性土,石灰性冲击土,饱和冲击土,人为堆积土,饱和潜育土,简育高活性淋溶土,不饱和雏形土,饱和黏磐土和水体。气象数据来源于世界气象数据库和麻城气象站的雨量资料(1980-2017年)。水文数据来源于柳子港水文站的月径流实测资料(1953-2006年)。

图1 麻城举水河流域数字高程图Fig.1 Digitai elevation map of Jushui River basin in Macheng City

图2 麻城举水河流域土地利用图Fig.2 Land use map of Jushui River basin in Macheng City

表1 麻城举水河流域土地重分类检索表Tab.1 Land use classification index for the Jushui River basin,Macheng City

图3 麻城举水河流域土壤类型分布图Fig.3 Soil map of Jushui River basin in Macheng City

结合以上数据,使用SWAT模块中的自动水系提取功能加载研究区域的DEM 图,生成河网并以研究流域出口点作为界定进行水文流域的划分,将研究区划分为39 个子流域,结果如图4所示。随后进行HRU 分析与定义,最终输入气象数据进行模拟。

图4 麻城举水河流域子流域划分图Fig.4 Subarea division map of Jushui River basin in Macheng City

2 模型校准与验证

2.1 模型校准方法

模型的参数优化方法选择SWAT-CUP 自带的四种参数优化方法,即SUFI-2 算法、GLUE 算法、PSO 算法、Parasol 算法。模拟结果好坏程度可以通过一系列的统计指标来表示,本文采用决定系数(R2)和效率系数(NSE)来评价模型的适用性。

SUFI-2 算法是利用拉丁超立方随机采样方法来进行水文模型不确定分析的一种常用优化方法。首先确定目标函数和假设初始参数的范围,然后进行参数校准,使得其落在95%的置信区间内(即为95PPU,意为不考虑极坏的5%的情况),再通过拉丁超立方方法(LH-OAT)进行参数结果的输出,能得到多种参数结果,对每一种参数结果进行分析,不断模拟从而减少不确定的范围。SUFI-2 算法结果即参数的不确定性程度是用不确定性程度因子P-factor(范围是0~1)和校准效果因子R-factor(范围是0~∞)表示。当P-factor 越来越接近1和R-factor 越来越接近0 时说明模拟结果与实测结果越吻合,模拟效果越好。SUFI-2 算法中的决定系数R2和效率系数NSE计算公式如下:

式中:QS,i为第i时段实测流量值;为实测径流的平均值;QM,i为第i时段模拟流量值;为模拟流量的平均值;n'表示实测时间序列长度;n表示样本个数。

GLUE 算法(Generalized Likelihood Uncertainty Estimation)即普适的似然不确定性分析方法。GLUE 算法主要是进行参数识别,避免在不确定条件下出现不同参数产生同样结果的情况,解决最优参数不唯一问题。GLUE 算法的核心在于似然函数的选择,但选择会受到人为主观性地影响。该方法通过Monte-Carlo 随机抽样方法获得多组参数,然后计算每组参数的模拟结果与测量值之间的似然函数以及权重,在似然函数值中选择一个分界值,将所有参数组归纳为两类,低于似然函数值的类别说明其不满足模拟结果,不足以表征模型的特点。高于似然函数值的类别则与之相反,选择高于似然函数值的类别,并将它们做归一处理。可知模型在置信区间的不确定性范围与似然函数值的大小有关。该数学表达式如下:

式中:L(Y|θa)表示后验似然值;L(Qa|Y)表示观测到的变量值;L0θa表示先验似然值;C表示归一加权因子。

PSO 算法(Particle Swarm Optimization)即粒子群优化算法。该方法指将系统初始化为一组随机的粒子(有一个矢量速度决定它们飞行地路线)然后通过迭代的方法搜寻最优值。粒子需要通过粒子本身和整个种群的移动所找到的最优解来调整自己下一步的搜寻方向。在SWAT模型中PSO算法的应用是将需要校准的每组参数作为每个粒子的位置坐标进行迭代运算,最终根据模型目标函数进行适应性评价。

Parasol 算法的核心内容是SCE-UA 算法,是一种全局性的优化算法。Parasol 算法能成功解决非线性的复杂分布式水文模型问题。该法结合了空间复合点、系统演化、竞争演化和混合复合形状四个概念。算法的第一步是在模型需要率定的可行空间内将随机产生的a×b个点作为初始群体。第二步是按照目标函数增长的序列将初始群体分成a个种群,则每个种群包含了b个成员。第三步是进行种群之间的若干代独立竞争进化和定期交叉作用产生新的种群,这种情况下可以实现信息被种群共享。最后检查是否满足收敛的要求,不满足则重新进行第二步,算法特点是能够很好地表达出不同参数之间的相关性。以下是Parasol 算法中的目标函数式和NSE 效率系数计算式:

式中:SSQ表示残差平方和;表示实测流量平均值;QS,i表示第i时段实测流量值;QM,i表示第i时段模拟流量值;n表示实测时间序列长度。

2.2 参数敏感性分析

参数敏感性分析一般采用SWAT自带的LH-OAT方法或者SWAT-CUP 程序中的LH-OAT 方法,本文选择了第二种方法进行敏感性分析。参数敏感性程度的识别则可以采用t检验法,即当t值越大,p值越小时,参数的敏感性越高。在此基础上最终确定了对径流参数敏感影响程度最高的4 个参数(表2)。

表2 举水河流域参数敏感性排名Tab.2 Sensitivity ranking of parameters in Jushui River basin

3 模拟结果分析

决定系数R2和效率系数NSE被采用作为本研究区域模型的适应性评价指标。R2表示实测值与观测值的拟合程度,R2越接近1,表明模型越吻合;NSE能判断模型模拟程度的好坏,当NSE≥0.75 时,表明模型的率定效果很好。一般认为,在月尺度下同时满足R2>0.6,NSE>0.5 时[22],说明构建的SWAT模型适用于本流域的水文模拟。

本研究构建举水河流域的月尺度径流模型。选取流域出口的柳子巷水文站1995-2004年的水文实测资料作为依据,其中1995-1996年为预热期,1997-2000年为率定期,2001-2004年为验证期,应用SUFI-2、GLUE、PSO、Parasol 四种算法进行径流模拟。研究区域SWAT 模型模拟结果评价见表3,月径流尺度下实测径流与模拟径流对比分析结果见图5~图8。由表1可知,初次使用4种方法进行校准时,SUFI-2算法在率定期与验证期R2和NSE分别为0.73、0.66 和0.62、0.59,是唯一满足精度要求的,GLUE 仅在验证期内满足要求。表明SWAT模型在麻城举水河流域的建立具有一定的适应性,可以进行相应的模拟与预测。模拟结果见图5,在整个模拟阶段内率定期模拟效果比验证期好,率定期内平水期模拟值偏低,但枯水期与丰水期实测值与模拟值的整体径流趋势线基本一致,径流峰值误差小;验证期年径流量大,枯水期与平水期阶段模拟效果较好,丰水期(4-8月)阶段实测值远低于模拟值,月径流峰值误差大,模型模拟效果较差。GLUE、PSO、Parasol算法结果如表3所示,率定期与验证期的R2和NSE没有同时满足R2>0.6,NSE>0.5,不符合精度要求。对比图6~图8可知,GLUE算法与Parasol算法结果相近,两种算法在枯水期阶段模拟径流曲线变化趋势基本吻合,但在丰水期和平水期阶段GLUE 模拟结果与实测值之间误差更小,模拟效果更佳。PSO 算法模拟效果是最差的,在整个模拟时段内模拟值都偏低,尤其在丰水期,不能体现本流域的径流变化。

表3 举水河流域SWAT模型模拟结果评价Tab.3 Evaluation of SWAT Model Simulation Results in Jushui River basin

图5 SUFI-2算法的举水河流域实测径流与模拟径流结果对比分析图Fig.5 Comparison and analysis of measured runoff and simulated runoff in Jushui River basin based on Sufi-2 algorithm

图6 GLUE算法的举水河流域实测径流与模拟径流结果对比分析图Fig.6 Comparison and analysis of measured runoff and simulated runoff in Jushui River basin based on GLUE algorithm

图7 PSO算法的举水河流域实测径流与模拟径流结果对比分析图Fig.7 Comparison and analysis of measured runoff and simulated runoff in Jushui River basin based on PSO algorithm

图8 Parasol算法的举水河流域实测径流与模拟径流结果对比分析图Fig.8 Comparison and analysis of measured runoff and simulated runoff in Jushui River basin based on Parasol algorithm

在SUFI-2 算法中不断调整置信区间直到达到最佳拟合效果,此时的参数置信区间为SUFI-2 最适置信区间见表4,将所得的参数置信区间作为已知信息,采用GLUE、PSO、Parasol 算法进行第二次参数优化,得到SWAT 模型模拟结果见表5,GLUE、PSO、Parasol 算法二次参数优化后的实测径流与模拟径流的对比分析结果见图9~图11。

表4 基于SUFI-2算法的参数适宜置信区间Tab.4 Suitable confidence interval of parameters based on Sufi-2 algorithm

表5 举水河流域SWAT模型二次模拟结果评价Tab.5 Evaluation of secondary simulation results of SWAT Model in Jushui River basin

图9 GLUE算法二次优化后实测径流与模拟径流结果对比分析图Fig.9 Comparison and analysis of measured runoff and simulated runoff by secondary simulation of GLUE algorithm

图10 PSO算法二次优化后实测径流与模拟径流结果对比分析图Fig.10 Comparison and analysis of measured runoff and simulated runoff by secondary simulation of Pso algorithm

图11 Parasol算法二次优化后实测径流与模拟径流结果对比分析图Fig.11 Comparison and analysis of measured runoff and simulated runoff by secondary simulation of Parasol algorithm

由表5 可知,3 种算法的模拟精度均有明显提高,其中GLUE 和Parasol 算法二次优化后率定期与验证期的结果满足R2>0.7,NSE>0.7,精度均高于SUFI-2 算法,模拟效果较好。PSO算法所得评价因子相较之前也有所提高,但在验证期内仍不满足精度要求,在本流域是不适用的。对比图5 与图9 可知,GLUE 算法优化后相较于SUFI-2 算法,在枯水期与丰水期的模拟效果差别不大,但汛期模拟值与实测值之间误差减小,月径流模拟值与实测径流趋势更加吻合,径流峰值也更相近,对于本流域参数优化工作GLUE更合适。Parasol算法与GLUE 算法精度结果相近。Parasol算法在枯水期和丰水期的模拟效果比GLUE算法差,但在春汛出现单峰径流的情况时模拟值是最接近实测值的,综合来看本研究区域最佳优化方法为GLUE算法或Parasol算法。

4 讨论

由模拟评价结果可知,率定期的模拟效果均要高于验证期,这可能是由于验证期的年径流量大,年际径流变化大造成的。对比参数方法优化前后算法的精度结果可知,三种算法的模拟精度都明显提高,说明SUFI-2 算法所得的参数最适置信区间对算法径流模拟结果具有很大影响。由以上模拟结果图可知参数最适置信区间对模拟阶段内的枯水期径流影响变化并不大,主要是针对汛期。这可能是由于汛期受到强降水和土壤植被覆盖物、土壤类型的影响。汛期径流量大,土壤层之间水量传递的变化特征显著。4 种算法也是各有优缺点,SUFI-2 算法耗时短在枯水期效果好但对于较为复杂的流域变化情况效果差;GLUE 算法在枯水期和平水期模拟效果好,常用于出现春汛和干旱缺水年份时;PSO算法精度低,不适用于干旱缺水地区的模拟;Parasol 算法在春汛出现单峰径流时模拟效果最佳。

5 结论

在麻城举水河流域建立SWAT模型对柳子港水文站的月径流过程进行模拟,通过分析结论如下:

(1)通过SWAT-CUP 中LH-OAT 进行参数敏感性分析,并采用SUFI-2、GLUE、PSO、Parasol四种参数优化方法进行校准。可知本研究区域敏感性影响最大的4个参数因子分别为CN2、ALPHA_BF、GW_DELAY、GWQMN。SUFI-2 算法在率定期与验证期的评价因子R2、NSE满足精度要求,表明SWAT模型在本流域可以适用,但模拟精度不高。

(2)SUFI-2 算法不断调参优化后得到一个满足最高精度要求的参数适宜置信区间,对比参数置信区间影响前后的3种优化算法(GLUE、PSO、Parasol)径流结果,GLUE、PSO、Parasol 算法的精度均有明显提高,但PSO 算法仍不满足精度要求,在本流域是不适用的。GLUE、Parasol算法满足R2>0.7,NSE>0.7,精度均高于SUFI-2算法。本流域选择GLUE 算法或Parasol算法更佳。

(3)根据径流曲线变化选择适宜的优化参数方法前,先采用SUFI-2 方法获取适宜参数置信区间再进行校准,有利于提高模拟精度,选取最佳校准方法,可减少模拟过程中优化方案选择的任意性。

猜你喜欢
水河置信区间径流
格陵兰岛积雪区地表径流增加研究
流域径流指标的构造与应用
基于SWAT模型的布尔哈通河流域径流模拟研究
鉴水河之歌
与众不同的河水和湖泊
基于预警自适应技术的监控系统设计
家乡的赧水河
效应量置信区间的原理及其实现
湖南蓼水河石
人工降雨下三种屋面径流过程环境质量比较