基于多源数据融合的海河流域降水资源评价

2022-09-14 07:10石羽佳王忠静
水科学进展 2022年4期
关键词:海河栅格校正

石羽佳,王忠静,2,索 滢

(1. 清华大学水利系,北京 100084;2. 宁夏大学西北土地退化与生态恢复省部共建国家重点实验室培育基地,宁夏 银川 750021)

海河流域位于中国北方,112°E—120°E、35°N—43°N,东临渤海,南濒黄河流域,流域面积为32.06万km2,高程范围为-10~2 864 m,总地势是西北高东南低,大致分山地及平原2种地貌类型,是中国三大经济区之一和重要的工农业基地,战略地位十分重要。由于受气候自然条件变化和人类社会经济活动影响,海河流域出现了水资源严重不足、土地盐碱化、水污染等一列生态环境问题,流域内水资源与水环境问题突出。降水资源作为流域水资源的最主要部分,对其正确地分析与准确地评价有助于理解流域水资源数量特征和空间分布特点,因此,亟需明晰海河流域近年来的降水特征及规律以辅助水资源与水环境综合治理。

目前主要有4种估算降水的方法:地基测量观测、地基雷达遥感、卫星遥感和大气再分析模型[1]。一般认为地基测量观测值为降水真值,这也是以往研究分析海河流域多年平均年降水量及其空间分布规律的主要依据[2- 5]。但当站点空间分布不均、不密时,观测数据只能代表一定范围内的降水值,难以描绘流域整体降水的空间分布。近年来,卫星降水观测因其大范围面尺度优势成为各类研究与规划中的重要参考[6],也为准确评价流域降水资源及其空间分布特征提供了可能,在海河流域也有所评价和应用[7- 10]。然而,卫星遥感数据并非直接观测数据,是由反演得出的,存在一定的不确定性[11],需加以融合校正,以表达流域真实的降水空间分布特征,进而估算更为可靠的降水资源值。

为得到特定研究区准确的降水空间分布数据,通常的做法是将卫星反演的面降水数据与地基观测的点降水数据融合,校正得到特定区域的降水融合产品,增强卫星降水数据在应用中的可靠性[12- 15],为区域水资源管理提供数据支撑。然而,以往涉及海河流域的遥感降水成果存在2个主要问题:一是所使用的地基观测校正站点分布较为稀疏[16- 17];二是在校正时忽视了与降水密切相关的协变因子[16- 17],得到的结果难以再现海河流域降水实际空间分布。因此,有必要引入与降水密切相关的协变因子,将更密集的地基观测数据与卫星遥感相结合,提供海河流域高质量、高分辨率的降水数据来更准确地评价海河流域降水资源量及其空间分布。

本文提出多要素融合的降水数据校正方法框架,扩展了一致性系数内涵;基于地面站点观测数据、卫星降水数据、地理时空数据等进行多源数据融合校正,形成海河流域2001—2019年融合降水数据集;利用融合降水数据集对海河流域降水资源时空分布进行全面评价。研究成果可为海河流域水资源管理提供更可靠的降水资源数据基础。

1 数据来源

1.1 地面观测降水资料

本文将海河流域分为区域Ⅰ(平原区)、区域Ⅱ(山区迎风坡)和区域Ⅲ(山区背风坡)3个片区融合分析。使用的地面观测降水数据来源于中国气象局国家气象中心气象数据网(http:∥data.cma.cn/),包括海河流域244个气象站点2001—2019年逐月实测降水数据,区域及站点空间分布如图1所示。

图1 海河流域气象站分布Fig.1 Meteorological stations in Haihe River basin

1.2 卫星降水产品

本文使用了2种卫星降水产品,分别是Integrated Multi- satellitE Retrievals for the Global Precipitation Measurement Final Run V06(IMERG- F)[18]和Global Satellite Mapping of Precipitation Guage- calibrated Standard V6[19](GSMaP- G)。时间范围为2001—2019年,时间分辨率为月,空间分辨率为0.1°。IMERG- F来自NASA官网(https:∥pmm.nasa.gov/),GSMaP- G来自JAXA官网(https:∥sharaku.eorc.jaxa.jp/GSMaP/)。

1.3 其他数据来源

本文其他数据包括表征地面高程信息的ASTER GDEM数据(简称为DEM)和ERA5- Land数据。DEM数据来源于地理国情监测云平台(http:∥www.dsac.cn/),ERA5- Land数据来源于欧洲中期天气预报中心(ECMWF,https:∥cds.climate.copernicus.eu/)。ERA5系列产品(ERA5和ERA5- Land)是ECMWF最新和最先进的全球再分析产品[20],已有诸多研究论证了该系列产品在温度、风速、植被分析等方面与实际观测具有良好的相关性和较低的误差[21- 22],可以被作为环境信息的来源和创建高分辨率气候数据集的基础[20]。相较ERA5而言,ERA5- Land具有更高的空间分辨率,可以达到0.1°,与本研究选用的卫星降水产品一致,因此本文选取ERA5- Land数据作为协变量数据来源之一。风场、温度、气压、植被等[22- 25]都与降水有很紧密的反馈与联系,本研究选取ERA5- Land数据集中的8个要素作为协变量,以反映10 m风场(10 m 风向u分量、10 m 风向v分量)、温度与空气距离饱和的程度(2 m露点温度、空气温度)、气压(表面气压)、冬季降水(降雪量)和植被纵向分布情况(高大植被叶面积指数、矮小植被叶面积指数)。

2 研究方法

2.1 融合校正方法

卫星降水融合校正方法包括偏差校正法、插值展布法、多元回归法和机器学习法等[13],效果各不相同[11,12,26- 29]。与传统的插值或回归方法相比,机器学习方法具有较强的学习和泛化能力,在建模更复杂的数据模式和处理大量数据方面具有优势[13,30]。同时,海河流域雨量站分布密度约为1 302 km2/站,研究表明在该雨量站分布密度下更适宜采用机器学习方法进行校正[28]。人工神经网络(Artificial Neural Network,ANN)是典型的机器学习方法,是基于模仿大脑神经网络结构和功能而建立的一种信息处理系统,具有独特的分布并行处理、非线性映射和自适应学习能力等优点,在气象领域的降水、径流、蒸散发等研究中发挥了重要作用[29- 30],诸多研究表明ANN在数据关系拟合、挖掘等方面表现效果较优[31- 32]。因此本文以人工神经网络为基础,以地理要素、气象要素、植被因子等作为协变量,构建了海河流域卫星降水产品融合校正框架,如图2所示。

图2 海河流域卫星降水产品融合校正框架Fig.2 Diagram and framework of satellite precipitation product fusion and correction in Haihe River basin

该融合校正框架是以站点降水数据为目标值,输入相应位置栅格中的卫星降水值,以经纬度、高程及ERA5- Land要素作为协变量,利用ANN进行关系挖掘。测量值观测数据在空间上随机分为两部分,一部分占比70%作为训练数据集,另一部分占比30%作为测试数据集。在本研究中,采用了3层结构(即输入层、隐含层和输出层)的多层感知器(multilayer perceptron,MLP),这是神经网络算法中广泛使用的一种形式,通过择优比较后,将隐含层设定为2层,节点数设置为20。

2.2 评价检验方法

2.2.1 站点处精度评价检验方法

利用气象站点坐标提取卫星降水对应格点数据,以气象站点降水观测数据为基准进行站点处精度对比评价。评价指标分别为相关系数(r)、平均误差(EM)、相对偏差(SBIA)和均方根误差(ERMS)。这4个指标是常用的统计参数,此处不再赘述各指标的计算方法。

2.2.2 无站点处精度评价检验方法

Xia等[26]提出了一种基于降水- 高程连续性的一致性假定,用于评价无地表测站栅格的遥感降水产品精度。该假定建立降水与高程因子之间的关系,用一致性系数(RC)量化指标,并对卫星降水在中国8个山区和柴达木盆地的表现进行了一致性评价[26- 27]。本研究将其影响因子扩展到一般情况,形成广义一致性系数。扩展后RC计算如下:

(1)

(2)

(3)

式中:Nsum为卫星降水落入掩膜内的栅格总数;N为评价区栅格总数;Ci为每个栅格的判定值,i=1,2,,N;Pti为每个栅格的卫星降水值,i=1,2,,N;D为降水- 主要因子掩膜,由站点处主要因子数值与实测降水关系绘制得出,其方法参见文献[26]。若无地面降水观测站栅格上的卫星降水值落入掩膜内,则认为其与地面测降水值有一致性,亦即可靠度较高。

3 结果及分析

3.1 有站点栅格融合校正结果精度评价

根据图2,基于人工神经网络和协变量要素,将IMERG- F和GSMaP- G迭代融合成多源融合校正数据集IG- F(IMERG- F & GSMaP- G Fusion),1 367次后达到最优,迭代寻优收敛过程如图3。

图3(a)表示神经网络在迭代过程中的梯度下降过程,在1 000次迭代后下降趋势显著减小;图3(b)表示神经网络收敛参数在迭代过程中的结果,在第1 367次迭代时收敛参数超出阈值使得迭代停止;图3(c)表示有效参数个数的变化,在400次迭代后趋于稳定;图3(d)表示参数平方和变化,在800次迭代后趋于稳定;图3(e)表示神经网络的泛化能力检查过程,可以看出未被包含在训练过程中的数据在该网络中都可以得到合理的输出。综合以上,本研究建立的神经网络模型对此类多栅格多属性数据融合问题的寻优搜索是较为有效的。

将多源融合校正数据集在有站点栅格上的精度分布结果绘于图4。从图4中可以看出,卫星降水产品IMERG- F和GSMaP- G原始数据在季节尺度上与实测值符合性最佳,在年尺度上最差,总体均高估海河流域降水。多源融合校正降水数据集IG- F在4个统计指标的表现均有显著提升,平均r在月、季节、年尺度上分别为0.94、0.97、0.86,均大于原始产品;平均ERMS在月、季节、年尺度上分别降低至19.18 mm、33.19 mm、68.63 mm,均小于原产品;平均SBIA在月、季节、年尺度上均为-0.02%,优于IMERG- F的8.6%和GSMaP- G的7.3%;平均EM在月、季节、年尺度上分别为-0.01 mm、-0.02 mm、-0.08 mm,同样优于原产品。

图3 模型寻优收敛过程Fig.3 Optimization convergence process diagram

图4 降水数据集站点精度分布评价箱线图Fig.4 Distribution of the precision of precipitation datasets in stations

3.2 无站点栅格融合校正精度结果评价

对比发现,区域Ⅰ降水与位置参数呈现紧密的联系,区域Ⅱ和区域Ⅲ降水与高程关系最为紧密。因此,式(3) 中降水- 主要因子掩膜在区域Ⅰ表现为降水- 位置参数掩膜,区域Ⅱ和区域Ⅲ为降水- 高程掩膜。为更直观地显示各分区高程(位置参数)与降水之间的关系,图5给出了海河流域等高线分布、降水数据融合分区、多年平均年降水等值线和位置参数等值线分布。在经过经度值与纬度值不同组合试验后,各栅格中心经度平方值与纬度平方值之和与降水关系最佳,将其开平方形式作为位置参数,计算过程见式(4) :

(4)

式中:P为栅格位置参数, °;X为栅格中心经度值, °;Y为栅格中心纬度值, °。

图5 海河流域等高线、降水等值线、位置参数等值线分布及区域划分Fig.5 Contour line,precipitation contour line,location contour line and regional division in Haihe River basin

为了对比卫星降水产品在有站点和无站点栅格上的校正效果,本研究把有站点栅格处的降水数据集同样进行了一致性评价,评价结果绘于图6。图6显示,未经融合校正的降水产品在平原区位置参数中值区严重高估了降水分布,在山区迎风坡低估高程高值区的降水分布,在山区背风坡高估高程低值区的降水分布,多源融合数据集分布与掩膜更为一致。

对比图6中有、无地面观测站点栅格的评价结果,不难发现,有站点处RC系数评价结果均比无站点处的评价结果要好,表明RC系数具有客观性。同时,对比校正前后的评价结果可知,校正后的降水数据集与掩膜分布较为一致,改进后的RC系数能更好地描述无站点栅格处的一致性。将3个区域在海河流域的面积占比与其RC值乘积之和作为海河流域的RC值,IMERG- F和GSMaP- G在有站点栅格上的RC分别为55.3%和60.4%,无站点栅格上RC分别为42.7%和48.3%;IG- F在有、无站点栅格上RC分别为80.4%和56.2%。根据Xia等[26]的研究认为,有站点栅格和无站点栅格的RC值并非完全一致,两者差异在30%内均可接受,因此融合数据集精度结果在理想范围内。对原始卫星数据进行融合校正后,落入掩膜内的数量均有明显增加,在有、无站点栅格上的一致性系数RC值均有提高。以上分析可以说明:改进后的RC系数通过选取主要因子建立掩膜,能够反映流域不同主要因子与降水之间的分布关系;生成的多源融合数据集在海河流域表现要优于原始卫星降水数据集,研究构建的融合校正模型能够用于整个研究区的卫星降水校正。

图6 降水数据集一致性评价结果Fig.6 Evaluation of the consistency of precipitation datasets

3.3 海河流域面降水分析

海河流域气象站点、原始卫星降水和多源融合校正数据集2001—2019年平均降水空间分布如图7所示。分析原始卫星产品及多源融合数据集在海河流域的空间分布情况不难发现,原始卫星降水产品不能很好地识别位于平原中部的低降水量中心,高估平原区降水,这与图6(a)、图6(d)结果一致;相较于2种原始数据,IG- F捕捉的降水空间分布与地表站点更为一致,且不存在明显高估的情况。融合数据集显示海河流域东北、东南、西南、中部偏西降水较多,在西北和中部偏东降水较少,降水空间分布差异较大。

进一步分析图6可以发现,海河流域各降水分区的降水存在以下分布规律:

(1) 平原区高程变化不明显,降水空间分布主要受海洋、气压带和风带影响,与其空间位置参数存在明显关系。图6(a)、图6(d)显示位置参数等值线121°—123°区间内存在1个明显的降水低值区,与图4中的降水等值线分布位置一致,说明设定的位置参数变量能够较好地描述平原区降水空间分布。

(2) 山区迎风坡降水与高程关系密切,高程升高易成云致雨。图6(b)、图6(e)显示海河流域山区迎风坡高程500 m以下的降水较多,但在高程500~1 000 m间存在1个降水低值区,之后随高程升高降水再次增加。

(3) 山区背风坡降水与高程同样具有紧密联系,背风坡因地形阻挡,气流下沉增温难以成云致雨,所以降水较少。图6(c)、图6(f)显示背风坡在高程1 200~1 600 m间存在1个降水低值区,主要分布在背风坡山谷内,显示出与迎风面不同的降水特征。

图7 海河流域2001—2019年多年平均降水量空间分布Fig.7 Spatial distribution of annual precipitation in Haihe River basin from 2001 to 2019

3.4 海河流域降水资源评价

计算不同数据源下海河流域2001—2019年多年平均面降水量(表1),显示融合校正数据集的多年平均面降水量为515.2 mm,相较于2种原始产品IMERG- F和GSMaP- G分别小4.4%和3.6%,较水资源公报数据大1.7%。水资源公报显示海河流域水资源量占降水资源量的比(产流系数)为17.3%,若将原始产品IMERG- F和GSMaP- G显示的降水值作为海河流域降水资源量进行计算,产流系数将分别降低为16.2%和16.4%。综上,若用卫星降水原始数据进行流域管理,会高估海河流域降水量,低估产流系数。

3.5 多源融合变量影响分析

2种卫星产品IMERG- F和GSMaP- G在中国大陆地区降水表达的表现优于其他降水产品[33],并且通常认为多卫星产品融合可提高结果的可靠性[34]。本文选用IMERG- F和GSMaP- G生成的融合数据集IG- F的表现也证实了这一点。同时,在无协变量的情况下,卫星产品融合存在ERMS误差增大的现象(增加至48.25 mm),加入协变量后,r从0.93上升到0.94,ERMS从48.25 mm下降到19.18 mm,多源融合月尺度试验方案评价结果见表2。因此,研究认为加入气象要素、植被因子等作为协变量能够有效地改善融合结果。

尽管本研究已通过增加协变量因子提高了数据融合的可靠性,但选取的协变量因子仍然较为有限,忽略了土壤含水量等因素。恰当的融入协变量仍是此类方法今后研究的重点之一。

表1 不同数据源及方法计算的海河流域2001—2019年降水资源量

表2 多源融合月尺度试验方案评价结果

4 结 论

为准确评价海河流域降水资源量及其空间分布,本研究提出了海河流域卫星降水产品融合校正框架,并利用多源数据融合生成了2001—2019年降水数据集,评价了海河流域降水资源量。主要结论如下:

(1) 卫星降水产品原始数据在海河流域存在一定高估,本研究生成的多源融合降水数据集在有无站点栅格上的评价结果均优于原始卫星降水产品。

(2) 海河流域降水存在3个较为明显的空间分区及其分布规律。海河流域平原区降水与空间位置参数关系明显,在位置参数中值区存在明显降水低值区;山区迎风坡和背风坡降水均与高程关系明显,在迎风坡高程500~1 000 m、背风坡高程1 200~1 600 m存在降水低值区。

(3) 多源融合数据集IG- F显示海河流域2001—2019年多年平均面降水量为515.2 mm,合降水资源量1 639.4亿m3,较2种原始卫星产品分别小4.4%和3.6%,较水资源公报数据大1.7%。

猜你喜欢
海河栅格校正
栅格环境下基于开阔视野蚁群的机器人路径规划
再分析降水资料的适用性评估与偏差校正
超声速栅格舵/弹身干扰特性数值模拟与试验研究
一种临近海河的超深地下室新型防水体系
反恐防暴机器人运动控制系统设计
炫酷ACR
一种具有自动校正装置的陶瓷切边机
破冰开河
致敬于海河
海河潮