基于样本熵的渭河流域降水序列时空特征分析

2023-02-16 01:07穆佳欣孙东永茹亚楠王淼淼李现伟李亚男
人民珠江 2023年1期
关键词:变点渭河流域渭河

穆佳欣,孙东永,茹亚楠,王淼淼,李现伟,李亚男

(长安大学水利与环境学院,陕西 西安 710054)

受气候变化和人类活动的影响,区域降水量呈现出更加复杂的非线性、混沌特性,传统研究方法无法有效地刻画其变化特征[1-2],在揭示降水序列内在机理方面有一定欠缺[3]。Pincus S M提出的近似熵(Approximate Entropy,ApEn)是一个有效的非线性动力学指数,能够用于表征时间序列的复杂性[4-5],广泛用于降水、径流等序列的复杂性和突变性分析中[6-7],但需要较大的样本数目。样本熵(Sample Entropy,SampEn)[8]在近似熵的基础上进行了改进,具有所需数据量小、稳定性好、抗噪能力强、检测结果准确等优点。因此,在水文气象复杂性分析及动力学结构突变方面得到了广泛的应用[9-10]。渭河流域是中国西部非常重要的区域,研究变化环境下的渭河流域降水时间序列复杂性的时空变化特征对水资源合理开发利用、兴利除弊和促进整个西部地区的经济社会稳步发展等具有重要的现实意义[11-12]。相关研究采用传统统计方法如线性回归、Mann-Kendall、小波分析等取得了较好的成果[13],但对于流域变化环境下系统演变的内在属性刻画不足。本文以渭河流域各站点1960—2018年逐日降水量为研究对象,采用滑动样本熵(Moving Sample Entropy,M-SampEn)和滑动移除样本熵(Moving Cut Data Sample Entropy,MC-SampEn)分析流域降水时间序列的变异性、稳定性和复杂性,以期揭示流域降水序列突变前后的复杂性时空变化特征。

1 方法简介

1.1 SampEn

样本熵是检测时间序列中的新的子序列产生概率。熵值越大,产生新模式的概率越高,对应时间序列的复杂度越高[12]。对于N个数据组成的一维降水时间序列x(i),i=1,2,…,N,样本熵可用SampEn(m,r)表示,其中m为维数,通常取2;r为相似容限,通常取(0.10~0.25);SD为x(i)的标准差。算法如下[8]。

①构建一组维数为m的向量:

X(i)=[x(i),x(i+1),...,x(i+m-1)](i=1,2,…,N-m+1)

(1)

②定义向量X(i)和X(j)之间的欧式距离为:

d[X(i),X(j)]=max[|X(i+k)-X(j+k)|](k=0,1,2,…,m-1)

(2)

(3)

(4)

(5)

⑤ 计算时间序列样本熵:

(6)

1.2 M-SampEn

步骤一对于降水序列,确定数据滑动窗口长度h、滑动步长L、维数m和容许偏差r。

步骤二从序列的第i(i=1,2,…,n-h+1)个数据滑动选取长度为h子序列并计算子序列的SampEn熵值。

步骤三以h不变,L逐步移动,重复步骤二,直至原序列结束。

步骤四通过步骤一至步骤三,得到一个长度为int[(n-h+1)/L]的SampEn序列。

步骤五绘制SampEn值随时间的变化图,分析变化情况。

1.3 MC-SampEn

相对于M-SampEn取子序列并进行计算其熵值,MC-SampEn是将子序列移除后重新组合的序列来计算其熵值,其主要步骤如下。

步骤一对于降水序列,确定数据滑动移除窗口长度hc、滑动步长L、维数m和容许偏差r。

步骤二从序列的第i(i=1,2,…,n-h+1)个数据开始移除长度h的数据,将移除h之后的两段数据组合成子序列并计算熵值。

步骤三保持hc不变,以L逐步移动窗口,重复步骤二,直至原序列结束。

步骤四通过步骤一至三,可以得到一个长度为int[(n-h+1)/L]的SampEn序列。

步骤五依据SampEn序列变化图初步确定序列的突变点。

1.4 贝叶斯变点分析

MC-SampEn模型能够依据复杂性的内在属性的变化确定突变点,但是对于突变点的确定主要依靠主观观测,缺乏严格的数学统计分析。贝叶斯变点分析模型的核心部分是根据实测时间序列通过蒙特卡洛马尔科夫链随机抽样的方法来估计变点位置的后验概率分布,其最大后验概率的位置是发生变点的最可能位置[15],可以弥补其不足之处,其详细计算原理见文献[15]。

2 研究区概况及数据来源

渭河是黄河第一大支流,全长818 km,流域面积13.47万km2[14],其中陕西省内流域面积6.8万km2。渭河流域属大陆性季风气候,多年平均降水量约为450~700 mm,降水量集中在夏季,多为短时暴雨,是典型的干旱与半干旱区域。本文采用渭河流域长武、平凉、西峰镇等21个气象站点1960—2018年逐日降水资料(图1);其中1960—2010年降水数据来源于中国气象数据共享网(http://data.cma.cn),2011—2018年降水数据来源于国家冰川冻土沙漠科学数据中心 (http://www.ncdc.ac.cn)。

图1 渭河流域

3 结果与分析

3.1 降水序列复杂性的空间演变

采用样本熵计算长武、平凉、西峰镇等21个站点的逐日降水序列(1960—2018年)的静态SampEn值,结合ArcGIS技术中的反距离权重插值法将其可视化(图2)。同时采用算术平均法计算站点所在的子区域(泾河流域、北洛河流域),渭河干流上、中、下游5个区域的SampEn值,各流域静态SampEn值见表1。

图2 渭河流域静态样本熵等值线

表1 流域21站点日降水序列静态SampEn值

渭河干流上、中、下游日降水序列(1960—2018年)的SampEn值呈下降趋势,但下降趋势不明显;子流域泾河和北洛河区域SampEn值相当,但均小于干流SampEn值,反映出渭河流域降水的复杂性,存在明显的空间差异(表1、图2)。进一步地,渭河干流上游降水序列的影响因子最多,动力学特征复杂,可预测性低;相反地,子流域北洛河区域的最少,不确定成分相对较低。其原因可能在于渭河干流经济发达,人类活动较为剧烈,灌溉、城市化等改变了下垫面情况,间接影响了降水的变化。进一步地,从各子区域SampEn值的代际特征(图3)可以看出渭河流域各子区域均在20世纪90年代发生了转折,与20世纪90年代降水减少的实际情况较为一致。

图3 渭河流域各区SampEn代际特征

3.2 降水序列样本熵的动态分析

根据渭河流域各站点1960—2018年的日降雨量资料,以365 d为步长,采用M-SampEn计算得到各区域59 a降雨的样本熵值时间序列并进行分区统计(图4),可以看到各分区降水SampEn值基本上都呈现3个阶段的特征:20世纪60年代至90年代中期呈现一个均值稳态状况;20世纪90年代中期至21世纪00年代后期发生了SampEn均值改变(图4中红色标记)是否发生变异需进一步分析;21世纪00年代后期SampEn值呈现上升趋势,说明渭河流域降水的复杂性演变较为一致。而20世纪90年代中期至21世纪00年代后期的SampEn均值变化其原因可能主要在20世纪90年代降水的减少。

a)渭河上游

d)泾河

3.3 降水的时空变异特征分析

采用MC-SampEn分别对渭河流域各分区1960—2018年降水SampEn序列进行突变(S=365 d,L=365 d)分析,结果见图5,可以看到除北洛河流域有明显的2个突变点,呈现3个明显的阶段外,其余子区域均在20世纪90年代初期发生了突变,呈现2个阶段的变化。为了进一步确定是否发生了突变,采用贝叶斯变点检测法[15]对各子区域滑动移除熵时间序列进行突变检验,变异分析结果见图6。可以看到,对于渭河上游站(图6a),当k=1995年时后验概率最大,为0.11,说明渭河上游降水在1995年发生了突变;对于渭河中游(图6b),当k=1995年时后验概率最大,为0.06,说明渭河中游降水在1995年发生了突变;对于渭河下游(图6c),当k=1991年时后验概率最大,为0.09,说明渭河下游降水在1991年发生了突变;对于泾河流域(图6d),当k=1995年时后验概率最大,为0.09,说明泾河流域降水在1995年发生了突变;对于北洛河流域,由于贝叶斯变点分析仅对一个突变点分析有效,图5e有2个突变点,为了验证2个突变点是否存在,分别对1960—2000、1970—2018年的子序列进行贝叶斯变点分析(图6e、6f),可以看到,北洛河流域1970年和2000年k后验概率最大,说明北洛河流域在1970年和2000年发生了变异,与之前目测MC-SampEn熵值结果图得出的结果基本一致。

由以上分析可知,渭河流域上游、中游、下游和泾河子流域降水复杂性均在1995年发生变异,这与文献[16-18]研究结果较为一致;而下游降水突变发生在1991年,与文献[19]研究结果一致;北洛河降水的突变发生在2000年,检测结果与文献[20]结果较为接近,而1970年的变异点与其他文献结果有所出入,需进行进一步分析。

a)渭河上游

c)渭河下游

a)渭河上游

e)北洛河

4 结语

依据渭河流域 1960—2018年59 a降水资料,采用滑动样本熵、滑动移除样本熵与贝叶斯变点检测法判断降水径流的突变性以及相关关系,主要结论如下。

a)渭河流域复杂性在空间上的差异性主要表现在干流和支流的差别,干流的复杂性高于支流的,其原因可能在于干流地处社会经济发展迅速的地区,人类活动相对较为剧烈,下垫面情况变化较强,而支流区域泾河、北洛河流域内由于多山区,人类活动相对较少,下垫面变化较弱。在时间上的演变渭河流域各区表现较为一致,均在20世纪90年代中期其复杂性演变经历了一个大约10 a的低谷期,与20世纪90年代黄河流域降水少的实际情况较为一致。

b)除了北洛河流域在1970、2000年发生突变,其余渭河流域各分区均在20世纪90年代初期发生了突变。渭河上游、中游及泾河流域在1995年发生了突变,渭河下游在1991年发生突变,其原因在于气候的突变。而北洛河流域降水复杂性突变的原因较为复杂,在1970年的变化可能是受水利水土保持工程等人类活动的影响,2000年变化显著可能与实施大面积的退耕还草、还林措施有关,需要进一步进行研究。

猜你喜欢
变点渭河流域渭河
故乡
故 乡
回归模型参数的变点检测方法研究
正态分布序列均值变点检测的贝叶斯方法
基于二元分割的多变点估计
独立二项分布序列变点的识别方法
基于RS/GIS 渭河流域植被覆盖时空变化特征研究
渭河流域香菜夏秋无公害栽培技术
渭河流域粮食生产与灌溉农业发展的相互作用关系分析
一种天水市渭河径流预测模型的研究