长江流域月季降水量的概率分布特征分析

2018-08-28 01:56杜良敏刘绿柳高雅琦肖莺李杨
关键词:正态峰度概率分布

杜良敏 刘绿柳 高雅琦 肖莺 李杨

(1 武汉区域气候中心,武汉 430074;2 国家气候中心,北京 100081;3 北京师范大学,北京 100875)

0 引言

长江流域位于24°27’—35°54’N,90°33’—122°19’E,流域面积约180万 km2[1],地理跨度大,地势变化幅度大,降水变率明显,导致了长江流域的降水特征无论是在时间上或是空间上都存在较大差异,给降水特征的研究带来诸多不便,这对气候预测中统计方法的使用提出了更高要求。

在气候统计中,如回归分析、判别分析等统计方法模型均要求预报对象服从正态分布[2-3]。对于不符合正态分布的站点,需要观察其频率直方图,通过函数拟合来判断其属于何种分布类型,以便对数据进行正态化处理[4-7]。通常关注的概率分布函数有正态分布和Γ分布。徐尔灏[8]对我国月降水的理论分布进行研究检验,发现我国各地年降水量基本上服从于正态分布。丁裕国[9]从理论上证明了Γ概率分布模型在降水拟合上具有普适性,对任意时段降水量概率分布的拟合效果都较好。梁莉等[10]利用Γ分布拟合了淮河流域日降水量概率分布,吴子君等[6]的研究显示Γ分布函数在月、季降水中有较好的适用性。这些研究表明Γ分布对降水概率分布具有较好的描述能力。

目前针对分析长江流域在月和季节尺度的上的降水在正态分布和Γ分布的对比分析较少,本文利用长江流域1951—2015年的月、季降水资料,采用这两种分布,分析了长江流域降水量分布特征,对通过检验的站点开展了空间分析,这一工作对长江流域降雨分布特征分析和气候预测具有参考意义。

1 资料与检验方法

1.1 资料

本文使用国家气象信息中心提供的1951—2015年长江流域内经过地理信息筛选的712个气象站的逐日降水资料。因20世纪50年代前期观测站点较少,具体计算时以气象站建站时间为起点,剔除缺测降水数据,并将月降水数据处理成季降水数据,形成了月、季节尺度的降水历史数据序列。

1.2 降水概率分布检验方法

1.2.1 偏度系数、峰度系数检验法

目前常用的正态分布检验方法有χ2拟合优度检验、偏度系数峰度系数检验法。χ2检验法虽然是检验总体分布的较一般的方法,但是用它来检验总体的正态性时,没有用到正态的特性,第Ⅱ类错误的概率往往较大[11],为此本文采用偏度系数、峰度系数检验法。

偏度(Skewness)和峰度(Kurtosis)是描述数据分布形态的统计量,偏度描述的是总体取值分布的对称性,峰度是描述总体取值分布的陡缓程度[12]。

样本偏度定义为:

样本峰度定义为:

式中,n为样本长度,m2是二阶中心矩(即样本方差),m3是三阶样本中心矩,m4是四阶样本中心矩,xi是第i个值,是样本平均值。

若总体X为正态变量,则可证得当n充分大时,近似地有

设X1,X2,…,Xn是来自总体X的样本,检验假设

记:

当取显著性水平为α=0.05时,H0的拒绝域为

1.2.2 Kolmogorov-Smirnov 检验法

对于Γ分布通常使用Kolmogorov-Smirnov检验法,该方法是一种非参数统计分析的检验方法,简称为K-S检验法[13-14]。K-S检验法既可以做单样本检验也可以做双样本检验。单样本检验是和特定的连续概率分布函数(正态分布或者其他分布函数)进行比较,而双样本K-S检验是比较两个样本是否来自同一个总体。双样本K-S检验是比较两个样本最有效的而且也是常用的非参数比较方法,其思想是,确定样本的相关经验概率分布方程和累积分布方程之间的距离,或者是确定来自两个样本的经验概率分布方程之间的距离,如果两者之间的距离很小,则可推断样本的概率分布和经验分布拟合得很好。具体步骤如下,假设H0:总体分布X来自理论分布。

K-S统计方程如下:

其中F1,n和F2,n'分别表示两个样本的经验概率分布方程,sup表示极大值函数(supremum function)。

原假设在显著性水平α拒绝域为:

式中,n和n'分别代表两个样本的长度,当显著性水平α取值为0.05时,通过查表得c(α)=1.36。当Dn,n'值不在拒绝域时,接受假设H0。

如果总体分布X的形式或者参数无法定义可以加入蒙特卡罗方法进行K-S检验。本文采用的方法是基于K-S检验的蒙特卡罗检验方法。

Γ函数为:

Γ概率密度方程如下:

式中,A,C和D分别代表形状参数(shape),尺度参数(scale)和阈值(threshold)三个参数。将观测的降水数据定义为n,使用最大似然法对n进行Γ参数拟合,得到三个参数A,C,D。将得到的3个参数代入式(13)生成一组大量符合Γ分布的伪随机数n',将n,n'代入式(10)和式(11)计算出Dn,n'和拒绝域。

1.3 降水量概率分布检验后处理

1.3.1 站点正态分布检验后处理

根据式(1)和式(2)可计算出长江流域712站的偏度和峰度值g1、g2,取信度α=0.05的阈值,再根据式(8)和式(9)来确定该站点是否通过检验,通过检验的站点用“1”标示,未通过站点用“0”标示。

1.3.2 站点Γ分布检验后处理

根据生成的随机数n'和降水数据n做K-S双样本检验,取信度α=0.05的阈值,根据蒙特卡罗的思想来确定站点是否通过检验,通过检验的站点用“1”标示,未通过站点用“0”标示。

1.3.3 空间插值

通过检验的站点赋值为“1”,没有通过检验的站点赋值为“0”。通过Kriging空间插值法得到检验结果的空间分布图,图1~图4中阴影代表通过统计检验的区域,空白是未通过统计检验的区域。

图1 正态分布偏度峰度检验空间分布Fig. 1 Map of stations passed the normality test in monthly precipitation

2 结果分析

2.1 长江流域月降水量分布特征检验

长江流域气象站月降水量正态分布、Γ分布站点通过比例见表1,检验结果空间分布如图1和图2所示,通过检验的站点用颜色标注,没有通过检验的站点用白色标注。

由表1可见,长江流域站点的月降水量历年降水序列正态分布的假设检验通过率在16%~50%,均未过半数,通过率最高的月份是5月,为47.8%;而长江流域通过Γ分布的假设检验通过率在50%以上的月份有11个,通过率最高的月份是11月,比率为75.8%;通过率最低的月份是6月,为47.5%,Γ分布的假设检验通过率明显要好于正态分布的假设检验。

月降水通过正态检验的站点时空分布不均(图1),长江中下干流区间仅在2、4和5月正态性表现较好,而金沙江流域在6—9月的正态性表现较好。同样,月降水通过Γ检验的站点也表现出时空差异(图2),其中两湖流域表现尤为突出,两湖流域在2—6月通过Γ检验的站点很少,但是在1和7—12月Γ特性表现较好。长江上游干流区间Γ特性一直表现较差。

图3 正态分布偏度峰度检验空间分布Fig. 3 Map of stations passed the normality test for seasonal precipitation

表1 站点月降水量检验比例(单位:%)Table 1 The percentage of station number passed the distribution tests for monthly precipitation (unit∶ %)

图1 、图2和表1所示,在2、8、10和11月通过正态检验站点与通过Γ分布检验站点具有一定的互补特征,但在1、3和6月站点既不符合正态分布也不符合Γ分布的比例超过30%,这些站点月降水量分布函数可能更适用于其他特征。同时也有一些站点既属于正态分布又属于Γ分布,这可能是该站点的月降水通过极大似然法估计出的Γ分布的形状系数较大,接近正态分布所致[15]。

2.2 长江流域季降水量分布特征检验

取信度α=0.05的阈值,长江流域气象站季降水量正态分布、Γ分布站点通过比例见表2,检验结果空间分布如图3和图4所示。

结合表1和表2,长江流域季降水量正态性表现要好于月降水的正态性,季降水量通过检验的站点比例平均值在59.8%,其中春季通过正态性检验的比例可以达到74.6%,秋季通过检验的比例最少为49.0%。与正态分布相比,通过Γ分布检验的比例略低,通过率最高季节是春季,春、夏季的表现好于秋、冬季。

对于月降水的分布检验来,大多服从Γ分布,但正态性的表现较差。而季降水的分布检验对比分析,正态表现与Γ特性差异较小,仅在冬季正态表现明显好于Γ特性。这可能是由于月降水年代际的变化大,大量级降水和小量级降水均会出现,更容易为偏态分布,季节降水会平滑掉季节内的变化,年代际差异会较小,正态性和偏态性均有可能。

表2 站点季降水量检验比例(单位:%)Table 2 The percentage of station number passed the distribution tests for seasonal precipitation (unit∶ %)

通过各个季节长江流域降水通过检验站点的空间分布图得出(图3和图4),对于正态分布检验,春季长江全流域大部通过检验;夏、秋两季,通过正态检验的站点主要位于长江中上游;而在冬季,通过正态检验的站点位于下游。对于Γ分布检验,春季长江流域大部通过检验,夏、冬两季在上游流域通过检验比例较高,秋季通过检验的站点分布较为分散。

与月降水类似,季节站点降水也有一些站点既不服从正态分布也不服从Γ分布,可能更适用于其他的分布函数。同时也有一些站点既服从正态分布又服从Γ分布,同时服从两种分布的比例要高于月降水(表1和表2)。

3 结论与讨论

了解长江流域月、季降水的概率特征,可为建立科学的降水预报模型提供可靠的理论依据。本文利用长江流域712个气象站的月、季降水资料,使用偏度、峰度和K-S检验法分别对其进行了正态分布检验与Γ分布检验,并对长江流域的降水量分布特征进行了空间分析。结果表明:

1)长江流域站点月降水分布大都服从Γ分布,而服从正态分布站点的比例不超过50%。通过Γ检验的站点表现出时空差异,两湖流域表现尤为突出,1、7—12月Γ特性表现较好,但两湖流域在2—6月通过Γ检验的站点很少。

2)长江流域季降水量分布特征是正态分布较好于Γ分布。春、冬季的正态性比夏、秋季表现要好;而对于Γ分布,春、夏季表现好于秋、冬季。

3)从空间分布上分析,存在着同时服从和都不服从两种分布函数的情况,同时服从可能是通过降水分布估计出的Γ分布的形状系数较大,接近正态分布所致,同时不服从显示降水可能更适用于其他的分布函数。

本文对长江流域月、季降水进行了正态分布和Γ分布的服从性开展了探讨,但对不同区域内不同分布特征差异的成因分析,以及其他概率分布在长江流域的适用分析等还较为欠缺,这将在今后的工作中继续展开。

猜你喜欢
正态峰度概率分布
酰胺质子转移成像和扩散峰度成像评估子宫内膜癌微卫星不稳定状态
扩散峰度成像技术检测急性期癫痫大鼠模型的成像改变
两个正态总体下关于均值的广义似然比检验
一类摸球问题及其解法
随吟
抽样分布的若干反例
基于自动反相校正和峰度值比较的探地雷达回波信号去噪方法
弹性水击情况下随机非线性水轮机的概率分布控制
关于概率分布函数定义的辨析
风速概率分布对风电齿轮