稀疏样本下冬春季月平均气温空间插值研究
——以新疆玛纳斯河流域为例

2020-04-20 04:55李陇同刘帅令王彬泽王丽霞
水资源与水工程学报 2020年1期
关键词:环境变量玛纳斯平均气温

杨 耘, 李陇同, 刘 艳,刘帅令, 王彬泽, 王丽霞, 程 雪

(1.长安大学 地质工程与测绘学院, 陕西 西安 710054;2.地理信息工程国家重点实验室长安大学合作部, 陕西 西安 710054; 3.中国气象局乌鲁木齐沙漠气象研究所, 新疆 乌鲁木齐 830002)

1 研究背景

大气温度作为一个衡量地球表面能量平衡及温室效应的很重要的指标,也是影响融雪径流的重要环境变量之一。新疆北疆的玛纳斯河流域地处高寒山区,海拔高、积雪多,春季易引发融雪性洪水,因此,该地区的气温等气象空间数据的制备直接影响到积雪地区的融雪径流量估算的准确性,对防洪抗旱、合理开发利用水资源以及新疆农业经济的可持续发展也具有十分重要的意义[1-2]。因此,如何获取该地区的气温空间分布,为积雪融雪径流分析提供更准确的基础数据是当前面临的科学问题。传统的气温空间插值方法主要采用克里金插值、反距离插值法等[3-5]。诸多学者也基于地理加权回归与克里金插值组合算法(GWRK)开展了空间插值研究[6]。但该研究区地处高寒山区,且气象观测站分布稀疏,传统的插值算法主要表现出以下问题:(1)利用常规的气象数据空间插值法精度偏低且不均匀[7]。(2)前人对融雪期气温环境变量的选取比较单一,导致了插值精度不高[8]。(3)传统的空间插值模型,同时需要大量的训练样本,才能达到较高的精度,不适合于稀疏气象观测数据条件下的地区。

众多研究表明,机器学习在复杂的非线性问题中表现出明显的优势[9-10]。而与其他神经网络相比,广义回归神经网络(GRNN)具有更好的非线性映射的能力,并且学习速率快,对于不稳定数据的处理和小样本数据的回归分析具有自己独特的优势[11-12]。但目前该模型在气温空间分布插值方面的应用研究较少。在此背景下,本文以新疆玛纳斯流域为研究区,开展了影响气温的环境变量分析及优化,以及基于多变量组合的GRNN月平均气温空间插值研究,以实现2015年11月-2016年4月冬春季气温融雪因子的空间数据制备。

2 数据来源与研究方法

2.1 研究区概况

本文选取中国典型高寒山区的玛纳斯河及周围区域作为研究区。玛纳斯河发源于天山北麓,全长约450 km,是准噶尔盆地最长的内陆河。流域地形环境复杂,南高北低,众多支流汇合经肯斯瓦特水文站流进平原,海拔从5 000 m以上降到500 m左右。日温差较大,年均气温6.6℃,平原区年降水量为110~200 mm,大于10℃年积温2400 ~ 3500℃。山地垂直地带性特征明显,流域上游水流瑞急,下游水流平缓。高山区冰雪融水与上游降水成为玛纳斯河主要径流补给,季节性积雪对玛纳斯河春季径流量起着重要的调节作用,成为重要灌水资源,是新疆融雪性洪水高发区域之一。

2.2 数据来源

由于玛纳斯河流域内只有少量气象站点,因此,本文选取包含玛纳斯河及其周边面积约为750 km2的区域为研究区,区域内有国家及地方设立的气象观测站点共139个,如图1所示。

图1中,蓝色点表示气象观测站点。红色曲线圈定区域为玛纳斯河流域,该流域内观测站点稀少,仅2个观测站,而该流域周边的区域内气象站点较多,研究区上部站点分布相对密集,占总观测站数量的五分之三,但分布不均匀。就土地覆盖类型来看,研究区西南部多为山地和森林,站点分布较少且分布不均匀,而东南部也多为山地,但气象站点分布较东南部稍多。

通过对研究区内139个站点的日气温数据统计计算得到了每个站点的月平均气温,数据精度为0.1℃。从网上下载了分辨率1 km的MODIS月植被指数数据产品MOD13A3。从地理空间数据云下载了分辨率为90 m的DEM数据,对DEM数据进行重采样到栅格大小为1 km×1 km,然后进行坡度、坡向因子的提取,得到了分辨率为1 km的研究区域坡度坡向分布图。MODIS月植被指数数据产品需要进行重投影、拼接、转换、裁剪等操作。

图1 玛纳斯河流域及其周边区域气象站点分布

3 气温环境变量分析及优化

3.1 气温的环境变量分析

已有研究表明,研究区地理位置(经度、纬度及海拔)、地形(坡度、坡向)、地表覆盖类型等因子会对气温的空间分布有较大影响;其次,不同纬度的地区获得的太阳辐射能量及气温不同。气温与坡向关系表现在:迎风坡空气湿润,温度低;背风坡,空气干燥,温度高。而气温与海拔高程呈明显的负相关。气温与下垫面也有关,植被覆盖区的气温低,反之气温高。但是不同的研究区域环境变量对该区域温度的影响略有不同,因此,本文开展了气温环境变量的分析,见表1。

研究区各空间点的海拔高程、坡度、坡向、归一化植被指数这4个环境变量图如图2所示。

表1 影响气温空间变化的环境变量

图2 影响气温的环境变量空间分布图

从图2(a)可以看出,该地区地形中部多为山地,海拔比较高,而东南部和西南部及该区域的北部海拔相对较低。图2(b)表明,坡度变化区间为0~52.41°,研究区域中部为山地所以坡度较大。分析图2(d),该区域植被覆盖率较低,结合其他影像可知荒漠在这一区域占有很大的面积,植被覆盖类型多为草原,NDVI值在-0.1~0.9范围内变化。通过影响气温的环境变量空间分布图,可以清晰地看到环境变量的分布变化趋势,从而直观地判断出其对温度的影响变化。

3.2 气温与其环境变量的相关性分析

利用SPSS软件对上述环境变量与气温的相关性能(决定各环境变量与气温相关性关系大小的系数)进行分析,见表2。根据这些环境变量与气温的相关性分析结果发现,气温与海拔高程、地形坡度、坡向、植被指数和纬度具有较强的相关性,与经度的相关性较弱。为了避免环境变量间的共线性对气温插值的不利影响,选取与气温相关性较强的5个变量进行共线性分析。

表2 环境变量的相关性分析及共线性检验

经相关性分析,经度与气温空间分布相关性值仅为0.006。而其它5个环境变量与气温的相关性大于0.15,且它们的方差膨胀因子均小于10。考虑到上述5个环境变量间相关性相对较高,且不存在共线性。因此,本文选取表1中5个环境变量作为最优环境变量集。

4 基于GRNN模型的气温空间插值

4.1 GRNN插值模型的建立

GRNN具有较强的非线性映射能力和学习速度,样本数据少的情况下也能得到较好的插值结果。网络还可以处理不稳定数据,适于复杂的映射问题。其结构如下图3所示。

本文建立了包括输入层、模式层、加和层和输出层的4层GRNN网络拓扑结构进行研究区气温空间插值。输入层的神经元数目与学习样本中输入向量的维数相同,各神经元直接将输入的变量传递到模式层。模式层的神经元个数为训练样本数119,在求和层中对两类神经元进行求和并将模式层与各神经元的连接权值设定为1。在GRNN网络模型的训练过程中,径向基核函数的分布密度值是影响插值结果的一个重要参数。通常,分布密度值越小,神经网络对样本数据的逼近性就越好;而其值越大,逼近过程就越光滑。为了保证网络对样本的逼近性误差最小,也兼顾网络对样本的逼近过程的平滑,本文选择循环式交叉训练法对径向基函数的分布密度值进行了选取。

图3 GRNN结构示意图

4.2 月平均气温空间插值结果与对比分析

考虑到该研究区观测站点少且分布不均匀的情况,本文从玛纳斯河流域及其外围区域分布的139个气象站点中选取119个站点的气温数据作为训练样本,对GRNN模型进行训练。最后,以各空间点的最优环境变量观测值为输入参数,利用训练好的GRNN神经网络模型对2015年11月-2016年4月期间每个月进行了气温空间分布制图,见图4。

从图4中可以看出,11月平均气温变化范围为-7.415~6.295℃,12月平均气温变化范围为-19.868~-3.803℃,1月平均气温变化范围为-20.439~-6.940℃,2月的气温变化范围为-22.020~0.636℃,3月平均气温变化范围为-16.773~-0.261℃,4月平均气温变化范围为2.147~19.727℃。2015年11月到12月平均气温呈现显著下降趋势,到2016年1月和2月最低气温持续下降但是平均气温回暖,3月和4月的月平均气温明显上升,其时间变化趋势与实际的气温变化一致。从空间变化来看,处于不同地理位置的气温与海拔高度呈明显的负相关。

此外,与GWRK方法的空间插值结果相比发现,GRNN模型插值后的空间分布图更为平滑,避免了GWRK方法导致的突变现象。

图4 基于GRNN模型的2015年11月-2016年4月期间月平均气温空间分布图

用选取的剩余20个观测站点的数据作为检验样本,采用均方根误差(RMSE)和平均相对误差(MRE)指标对插值结果进行精度评价,并与GWRK插值结果进行对比,见表3。

表3 GWRK与GRNN模型的插值误差对比

由表3可以看出,本模型6个月的平均RMSE值为1.46,优于传统的GWRK方法(其平均RMSE值为2.22),而本文GRNN模型的平均MRE值也比GWRK方法低0.31。为了更直观地反映GRNN模型插值误差的总体趋势,图5给出GRNN模型残差分布图,并与GWRK方法进行了对比。

图5 两种气温空间插值结果的残差对比

由图5可以看出,本文建立的GRNN模型残差更趋于0,总体小于GWRK方法的残差。其次,在湖泊或者水库附近GWRK方法的插值误差高于本文模型,这表明地表覆盖类型对气温空间插值结果影响较大。

综合以上分析,本文建立的GRNN模型可实现更高精度、更可信的空间插值结果。

5 结 论

为了实现新疆天山中段玛纳斯河流域积雪-融雪过程模拟中气温融雪环境变量空间数据制备,本文引入GRNN模型,开展了研究区气象站点稀疏、观测数据较少且分布不均匀的条件下的冬、春季节6个月的GRNN气温空间插值模型的研究。通过对研究区时空插值结果的分析,得出如下结论:与传统的GWRK插值方法相比,在观测站点少且分布不均匀的情况下,本文模型的气温空间插值精度高于GWRK方法,且气温空间插值结果更平滑,缓解了传统插值法出现的不平滑现象。其次,从模型的RMSE分布可以看出,GRNN模型的插值误差曲线波动较小,表明该模型更稳定,且本文的GRNN模型空间插值速度比GWRK方法更快。今后还需要引入更多的环境变量并考虑不同时期观测数据的相关性以进一步提高空间插值精度。

猜你喜欢
环境变量玛纳斯平均气温
立春
玛纳斯河
从桌面右键菜单调用环境变量选项
彻底弄懂Windows 10环境变量
从全球气候变暖大背景看莱州市30a气温变化
民族史诗入梦来——歌剧《玛纳斯》观感
1981—2010年拐子湖地区气温变化特征及趋势分析
近50年来全球背景下青藏高原气候变化特征分析
基于三阶段DEA—Malmquist模型的中国省域城镇化效率测度及其收敛分析
基于权变管理理论的科技期刊管理模式研究