基于均一化数据的中国典型分区水文频率线型研究

2020-08-21 09:33王大洋王大刚
中国农村水利水电 2020年8期
关键词:格点线型水文

杜 懿,安 程,王大洋,王大刚

(中山大学地理科学与规划学院,广州 510275)

0 引 言

水文频率分析是指根据水文现象的统计特性,利用现有水文资料,分析水文变量设计值与发生频率之间的定量关系[1,2]。我国的水文工作者结合长期的实践经验,发现皮尔逊Ⅲ型曲线在中国地区的适用性较广、可靠性较高,并在规范中明确规定水文总体线型一般可采用皮尔逊Ⅲ型分布曲线,特殊情况,经过分析论证也可采用其他线型[3-5]。但近些年来,随着全球气候结构的变化,以及大规模人类活动对自然过程的干扰,可能导致水文变量的分布特征发生了变化[6-8]。

基于此,许多学者也相继开展了研究, 张玉虎等[9]于2015年利用5种分布线型对中国十大流域内的最大降雨极值序列进行了拟合研究,发现广义极值分布和对数正态分布均优于皮尔逊Ⅲ型分布;2016年,陈璐等[10]在对广义第二类beta函数拟合效果的研究中发现四参数的广义第二类beta分布非常适于水文频率分析,其拟合效果基本优于其他传统分布;熊丰[11]等于2018年利用Halphen分布函数对丹江口水库1929-2014年的年最大日流量系列进行频率分析,结果表明Halphen分布的拟合效果要优于其他的传统分布;2019年,胡辰等[12]在对辽宁省西部17个水文站点的年最大日流量拟合过程中,发现EB-XⅡ分布相较于皮尔逊Ⅲ型分布效果更好;同年,李航[13]在降水频率分析的研究中,发现四参数Gamma分布用以代替P-Ⅲ分布是完全可行的。

但是,以上研究均基于特定区域的水文时间序列,且序列长度有限,结论的可靠性与代表性不强。为此,本文以中国地区近100年均一化历史年降水量序列为基础,对全国七大典型区域进行水文频率适线研究,分别采用了皮尔逊Ⅲ型分布(Pearson-Ⅲ distribution,简称P-Ⅲ)、三参数对数正态分布(three-parameter lognormal distribution,简称LN(3P))、广义极值分布(Generalized Extreme Value distribution,简称GEV)、逻辑斯谛分布(Logistic distribution,简称Logistic)、布尔分布(Burr distribution,简称Burr)以及韦伯分布(Weibull distribution,简称Weibull)等6种常用水文统计学分布函数,试图给出各典型区域的推荐线型,为未来区域的水利工程规划、设计和管理等提供科学指导。

1 研究区与数据

本文的研究数据来自于国家气象信息中心(http:∥data.cma.cn/)提供的《中国近100年均一化历史月降水量网格数据集》,该数据集于2010年8月10日建立并发布,共包含有1900-2009共110年的逐月降水资料,数据集的空间覆盖范围为77.5°~132.5°E、22.5°~52.5°N,空间分辨率为5°×5°。原始降水数据选自于中国753个测站的逐日降水量集,数据经过了严格的质量控制,主要包括极值控制、均一性检验、内部一致性检验以及空间一致性检验等,并运用了反距离加权平均法将实测站点资料插值成格点资料,再利用经验正交展开插补模式将资料插补完整[14,15]。该数据集由于经过了均一化处理,其对于各区域情况的整体性和一般性描述得到了增强,时间序列的可靠性和代表性较高。

图1 全国均一化年降水量数据集空间覆盖范围及格点编号Fig.1 The spatial coverage of the precipitation dataset

从图1中可以看出,全国均一化降水量网格数据集共包含有43个格点(编号从01~43),其中东北地区6个(01~06)、华北地区8个(07~10、14~15、19、24)、华东地区2个(11~12)、华中地区2个(16~17)、华南地区3个(13、18、23)、西南地区10个(21~22、26~28、31~32、35、39、42)、西北地区12个(20、25、29~30、33~34、36~38、40~41、43)。

为简化研究,本文在全国七大自然地理分区中分别选定一个格点作为该分区的典型代表,选取的原则主要有:①格点所包含的时间序列较长,一般应不小于70年;②时间序列一致性较高,没有明显突变特性;③格点的空间覆盖范围基本落在相应分区内。基于以上原则,文中最终选定的七大分区的典型格点分别为03号(东北分区典型格点,简称东北典型)、09号(华北分区典型格点,简称华北典型)、11号(华东分区典型格点,简称华东典型)、16号(华中分区典型格点,简称华中典型)、18号(华南分区典型格点,简称华南典型)、27号(西南分区典型格点,简称西南典型)和 25号(西北分区典型格点,简称西北典型)。各分区典型格点的基本情况及降水时间序列特征如表1所列。

表1 全国七大典型格点的均一化年降水量时间序列特征Tab.1 Time series characteristics of average annual precipitation

2 研究方法

本文分别选用了皮尔逊Ⅲ型分布(P-Ⅲ)、三参数对数正态分布(LN(3P))、广义极值分布(GEV)、逻辑斯谛分布(Logistic)、布尔分布(Burr)及韦伯分布(Weibull)等来对全国七大分区的典型格点历史年降水量序列进行水文频率分析,并选用Kolmogorov-Smirnov(简称K-S)和Anderson-Darling(简称A-D)等统计学指标来对6种分布函数在各个典型格点的拟合效果进行检验。下面给出以上6种分布的概率密度函数表达式。

(1)皮尔逊Ⅲ型分布。

(1)

(2)三参数对数正态分布。

(2)

(3)广义极值分布。

(3)

(4)逻辑斯谛分布。

(4)

(5)布尔分布。

(5)

(6)韦伯分布。

(6)

K-S和A-D是两种统计学中常用的拟合优度检验方法,主要用来检验给定样本是否服从指定的分布函数,属于非参数检验方法[16,17]。

其计算步骤主要是先将所收集的样本数据按照从小到大的顺序排列,计算得到经验累积分布,再与目标分布的理论累积分布进行比较,进而得到统计量值。统计量值越小,说明指定分布函数的拟合效果越好,表现越优。

其中,K-S检验和A-D检验的统计量定义分别如下:

D=max{|Fn(x)-F0(x)|}

式中:D为K-S检验的统计量;A2为A-D检验的统计量;n为样本序列的长度;Fn(x)表示指定样本序列的经验分布;F0(x)表示指定样本序列的理论分布。

3 结果与分析

本文中,使用了Easyfit软件[18]来对指定样本序列进行分布拟合及优度检验,并最终确定了全国7个典型格点6种分布的概率密度函数,进而绘制出各组合下的年降水量时间序列频率分析曲线。各典型格点各分布函数的参数值如表2所列,各典型格点各分布线型的拟合效果如图2所示。

表2 全国各典型格点各类型分布函数的参数优选值Tab.2 The parameter preferred value of distribution lines in seven typical areas

图2 7个典型格点各分布线型的拟合效果Fig.2 The fitting effects of distribution lines in seven typical areas

从图2中可以明显看出,除Burr分布以外,其余5种分布函数表现接近,频率曲线的走势相对一致,但仍然存在一定的差异;Burr分布在东北、华北、华南和西北典型格点表现尚可,甚至在西北典型格点成为最优分布,但在华东、华中和西南典型格点发生了明显偏离或者严重失控。总的来说,Burr分布表现不稳定,不建议选用。

为了更准确地判断出各分布在各典型格点中的具体表现,通过计算K-S和A-D检验的统计量值来进行相互之间的优劣比较,结果见表3和图3。

表3 7个典型格点各类型分布函数适线结果评价Tab.3 Evaluation of the fitness of distribution functions in seven typical areas

图3 7个典型格点各分布函数拟合效果对比Fig.3 Comparison of fitting effects of distribution functions in seven typical areas

图3中显示的结果从上到下分别为东北典型、华北典型、华东典型、华中典型、华南典型、西南典型以及西北典型。可以直观地看出,在东北典型格点,P-Ⅲ分布和GEV分布表现最佳,在两种检验指标中表现相当、互有高下,Weibull分布表现最差;在华北典型格点,P-Ⅲ分布、GEV分布和LN(3P)分布表现较好,且相差不大,综合来说,P-Ⅲ分布最优,LN(3P)分布稍差,Logistic分布和Weibull分布表现最差;在华东典型格点,GEV分布表现最好,LN(3P)分布次之,P-Ⅲ分布表现较差,Burr分布最差;在华中典型格点,LN(3P)分布表现最好,P-Ⅲ分布次之,Burr分布表现失控;在华南典型格点,P-Ⅲ分布和LN(3P)分布表现最佳,且互有领先,Weibull分布表现最差;在西南典型格点,GEV分布表现最好,Logistic分布次之,P-Ⅲ分布表现不佳,Weibull分布表现最差,Burr分布出现失控;在西北典型格点,Burr分布表现最好,Logistic分布次之,P-Ⅲ分布表现最差。

整体来看,在全国7个典型格点中,Weibull分布始终很差,说明在中国地区其适用性较低;Burr分布表现出很强的极端性,容易出现失控,但在特定地区却又有优秀的表现,考虑到其稳定性较差,不建议在中国地区使用;Logistic分布总体来说表现一般,有趣的是,其在西部地区的表现要远好于东部地区;P-Ⅲ分布和LN(3P)分布在整个过程中表现相差不大,但LN(3P)分布的稳定性要高于P-Ⅲ分布;GEV分布始终表现最优或较优,且稳定性高,综合来说,要优于传统规范所推荐的P-Ⅲ分布。

表4给出了基于本文研究结果的全国7个分区推荐使用线型,需要说明的是,在拟合表现相近的情况下,优先选择P-Ⅲ型分布。

此外,表5还给出了基于全国各地区的最优线型的各重现期的年降水量设计值,计算结果可为各地区水资源工程设计、规划和管理等提供参考。

表4 全国七大分区推荐线型Tab.4 The recommended linestyle for seven national zones

表5 全国七大典型分区推荐线型的各重现期年降水量设计值Tab.5 Annual precipitation design values for each recurring period of the seven typical zones in China

4 结 论

(1)总的来说,P-Ⅲ型分布在全国各分区水文频率适线中的表现并不如预期,GEV分布的表现总体来说最好,在各地区中的适用性与可靠性较高;

(2)本文的研究结果可为全国各地区水文频率线型的选择提供一定参考,但由于水文变量具有极大的区域性与不稳定性,具体应用时还需进行多种方法之间的相互比对。

猜你喜欢
格点线型水文
湘潭高月塘大桥施工线型监控与合拢策略研究
加权融合方法在船型开发中的应用
网格中相似三角形的判定
发展水文经济 增强水文活力
浅谈水文档案的价值和开发利用
格点计算器
一道格点角度问题的解悟
AutoCAD中线型的开发定制技术
江西省水文文化建设的思考
格点和面积