模糊C均值聚类法在新疆年降水分区中的应用

2013-07-19 10:10王新萍杨青刘志辉李红古丽格娜
沙漠与绿洲气象 2013年6期
关键词:阿勒泰地区气象站南疆

王新萍,杨青,刘志辉,李红,古丽格娜

(1.中国气象局乌鲁木齐沙漠气象研究所,新疆乌鲁木齐 830002;2.新疆大学数学与系统科学学院,新疆乌鲁木齐 830046;3.新疆大学资源与环境科学学院,新疆乌鲁木齐 830046;4.新疆气象信息中心,新疆乌鲁木齐 830002)

模糊C均值聚类法在新疆年降水分区中的应用

王新萍1,2,杨青1,刘志辉3,李红4,古丽格娜4

(1.中国气象局乌鲁木齐沙漠气象研究所,新疆乌鲁木齐 830002;2.新疆大学数学与系统科学学院,新疆乌鲁木齐 830046;3.新疆大学资源与环境科学学院,新疆乌鲁木齐 830046;4.新疆气象信息中心,新疆乌鲁木齐 830002)

利用新疆98个气象站1960—2011年的年降水量资料,采用模糊C均值聚类法,对新疆年降水量进行分区研究;同时利用线性趋势、累积距平、M-K检验、t检验相结合的方法,对新疆年降水量在不同区域上的变化趋势以及突变时间等进行了对比诊断分析,得到了新疆地区年降水量分布的空间特征。结果表明:(1)新疆年降水的分布大致可分为7个区域;(2)根据模糊C均值方法所分区域能够体现出由于地形差异导致的降水分布不均匀的特点,这一结果与其他研究干旱区降水分布差异产生的原因相同。分区结果合理,说明该聚类方法适用于区域气候区划;(3)新疆大部分区域的降水量在20世纪80年代中后期以前偏少,低于多年平均值,自80年代中后期以后才开始偏多;不同区域的降水量依次从70年代初、80年代中后期、90年代初开始增加;整个南疆盆地、阿勒泰地区、准噶尔盆地降水的突变时间较为接近;(4)新疆降水量整体异常表现为降水一致多(或少)、北多南少、西多东少。

模糊C均值聚类法;降水气候分区;变化趋势;突变分析

目前,全球气候经历着以升温为主要特征的显著变化,这种变化正通过加速水循环过程的方式深刻影响着全球水分布格局[1],其中所造成的区域降水不规则性波动对河流、湿地以及天然植被产生明显地影响。

新疆地处亚欧大陆的腹地,是我国面积最大的省区,地貌轮廓鲜明,呈“三山夹两盆”态势,由北至南依次分布着阿尔泰山、准噶尔盆地、天山山脉、塔里木盆地、昆仑山,在远离海洋的情况下,形成了典型的内陆干旱气候[2]。新疆主要的水资源来源于高海拔的山区降水,据研究,山区降水量占全疆年总降水量的84.3%,山区降水和冰雪融水是径流的主要来源,而山区降水在新疆的径流形成中占有重要地位。新疆的降水存在着明显的水平和垂直差异,研究该地区降水量的分布情况对认识和利用新疆水资源有重要意义。

近年来,有关全球变暖背景下新疆区域气候尤其是降水变化的研究已大量开展,众多研究结果表明,新疆的气候经历了以湿润化趋势为主的变化,并呈现出从暖干向暖湿转变的态势[3-5];区域降水明显地呈现增加趋势[6-8],极端降水事件增多[9-10],且多数站点记录的年降水于20世纪80年代中期发生了比较明显的突变[11]。

气候要素分区是气候诊断及预测研究中的主要技术过程。已有许多学者采用分区的方法对新疆降水进行研究,由于研究目的不同,分区方法也不同。在水平方向上,分南疆、北疆和东疆;在垂直方向上,分平原和山区[16,22];水平和垂直方向相结合,分南疆、北疆和天山山区;主成分分析法将新疆分为南疆、伊犁河流域、北疆和东疆[14];还有主成分分析和旋转主成分分析相结合的方法,将新疆四季降水依次分6个、7个、5个和3个分区[15]等;在分析新疆极端降水时,又将新疆分为新疆北部、北疆西部、天山北麓、天山山区、阿克苏地区、焉耆盆地、喀什地区和和田8个区域[6]。

作者采用模糊C均值聚类法对新疆年降水量进行分区,并计算不同区域平均降水量及其线性变化趋势与突变时间,力求揭示出新疆地区降水的时空分布特点。模糊C均值聚类法是依据隶属度较为客观地判定气象站点的归属,这对进一步认识新疆降水的精细化空间分布有积极意义。虽然这种模糊聚类方法的分区个数可以预先给定,但分区个数的多少会受到隶属度的制约,即当取到合适的分区个数时,最后得到的隶属度值才可以明显地确定气象站点的归属。这种分区方法有效地避免了以前人为确定降水分区个数偏多或偏少的情况。

1 数据资料选取与方法

1.1 数据资料

在保证降水数据的同步性与长序列的原则下,选用新疆98个气象站1960—2011年的月降水资料,由此得到各气象站52 a的降水序列。

1.2 分区方法

在很多分类问题中,分类对象之间没有明确的界限,往往具有亦此亦彼的表现,如果用传统的聚类方法(系统聚类法或K均值聚类法等)进行分类,把每个待分类的对象严格地划分到某个类中,这也存在一定的不合理性。为此,借助于L.A.Zadeh(20世纪60年代中期)提出的模糊集理论,人们开始用模糊的方法来处理聚类问题,并称之为模糊聚类分析[12-13]。

给定样本观测数据矩阵

其中,X的每一行为一个样品(或观测),每一列为一个变量的n个观测值,也就是说X是由n个样品(x1,x2,…xn)的p个变量的观测值构成的矩阵。模糊聚类就是将n个样品划分为c类(2≤c≤n),记V={v1,v2,…vc}为c个类的聚类中心,其中vi=(vi1,vi2,…vip)(i=1,2,…,c)。在模糊划分中,每一个样品不是严格地划分为某一类,而是以一定的隶属度属于某一类。

其中,U=(uik)c×n为隶属度矩阵,dik=‖xk-vi‖。显然J(U,V)表示了各类中样品到聚类中心的加权平方距离之和,权重是样品xk属于第i类的隶属度的m次方。模糊C均值聚类法的聚类准则是求U,V,使得J(U,V)取得最小值。模糊C均值聚类法的具体步骤如下:

①确定类的个数c,幂指数m>1和初始隶属度矩阵U(0)=(),通常的做法是取[0,1]上的均匀分布随机数来确定初始隶属度矩阵U(0)。令l=1表示第1步迭代。

②通过下式计算第l步的聚类中心V(l):

③修正隶属度矩阵U(l),计算目标函数值J(l)。

④对给定的隶属度终止容限εu>0(或目标函数终止容限εJ>0,或最大迭代步长Lmax),当max{(}<εu(或当l>1,|J(l)-J(l-1)|<εJ,或l≥Lmax)时,停止迭代,否则l=l+1,然后转②。

经过以上步骤的迭代之后,可以求得最终隶属度矩阵U和聚类中心V,使得目标函数J(U,V)的值达到最小。根据最终的隶属度矩阵U中元素的取值可以确定所有样品的归属,当ujk=max{uik}时,可将样品xk归为第j类。

2 新疆年降水的区域空间特征

2.1 年降水量分区结果

运用模糊C均值聚类法,新疆范围的年降水分布可分为7个区域(图1),分区结果如下:

1区,该区域主要包括南疆盆地的西南部,由22个气象站点计算多年平均降水量为86.6 mm,年降水量稀少。该区降水的水汽来源主要有两部分:一支由大西洋的水汽,经过西风环流,越过帕米尔高原,进入本区;另一支由印度洋北上的西南季风的一部分越过青藏高原,到达昆仑山的西北坡。这两支气流进入本区,为下沉增温气流,导致降水稀少。本区降水的特点是沿昆仑山西北坡自西向东减少。

2区,有17个气象站,多年平均降水量为46.8 mm,年降水量稀少。该区域的水汽来源同1区,1区三面环山,水汽在翻越昆仑山脉时发生了的抬升,具备了一定的降水条件。

3区,位于东疆,由10个气象站点计算多年平均降水量为40.8 mm,年降水量稀少。本区是东亚季风气候与地中海气候两种气候类型的过渡带,具有季风气候和地中海气候的双重性[2],东亚季风和西风环流的水汽都难以到达,致使本区降水稀少。

4区,该区域是天山山区,覆盖了7个气象站点,多年平均降水量为436.1 mm,是7个分区中降水最多的一个区域。水汽可以通过伊犁河谷、特克斯河谷和阿拉山口进入本区,产生较多的降水。

5区,主要包括伊犁和塔城地区,由15个气象站计算多年平均降水量为249.3 mm,是7个分区中降水较多的一个区域。来自于北冰洋和大西洋的水汽,通过阿拉山口等河谷低地进入本区,形成一定的降水强度。

6区,位于阿勒泰地区,包括10个气象站,多年平均降水量为175.5 mm,是7个分区中降水稍多的一个区域。水汽主要来自于北冰洋和大西洋,通过额尔齐斯河谷低地进入本区,向阿尔泰山南坡爬升,雨量随海拔增加。

7区,主要包括准噶尔盆地和天山北麓,该区域中14个气象站主要分布在天山北麓。由于准噶尔盆地内气象站点稀少且降水量远少于阿勒泰地区,故将该盆地和天山北麓划分成一个区域。多年平均降水量为198.6 mm,此值偏大是由该区域中气象站点的分布不均匀导致,主要是利用天山北麓的站点计算出多年平均降水量。

新疆的年降水量主要集中在西天山山区、伊犁河谷、塔城地区、阿勒泰地区、准噶尔盆地。这4个降水较多的区域中,只有西天山山区和准噶尔盆地的降水量增加趋势较为显著,通过了0.01的显著性水平检验,年平均降水的变化倾向率分别为15.3 mm/ 10 a和12.4 mm/10 a(图2);东疆地区的多年平均降水量只有40.8 mm/a,该区域的降水变化倾向率虽然只有2.5 mm/10 a,但也通过了0.05的显著性水平检验;伊犁河谷、塔城地区和阿勒泰地区年降水量相对较多,降水量增加的趋势也较显著,通过了0.05的显著性水平检验。整个南疆盆地一直以来降水相对稀少,但南疆盆地的西南部,即1区,年平均降水量有显著的增加趋势,该区域年平均降水量的变化倾向率为8.3 mm/10 a,通过了0.01的显著性水平检验(表1)。

图1 新疆年降水量分区结果

表1 新疆各区域降水特征

2.2 各区域年降水量的长期变化趋势

年降水量占全疆年降水量绝对比重最多的西天山山区、伊犁河谷、塔城地区、阿勒泰地区、准噶尔盆地构成了新疆的北疆地区和天山山区,这些区域年降水量的平均增率也是较大的(图2),西天山山区的年降水量占新疆全年降水量的比重最多,约为35.35%,是新疆年降水量最多的区域,全疆的大部分水资源集中于此。值得注意的是,全年降水量占全疆年降水量比重相对最少的南疆盆地的西部(1区)年降水量有显著增加。由此可见,新疆全年降水主要集中在北疆、天山山区及其南北坡地带。

从全疆各区域年降水量的5 a滑动平均(图2)可以看出,在20世纪80年代中后期以前,整个南疆盆地的年降水量偏少,低于多年平均降水,从80年代中后期开始,南疆盆地的降水量开始偏多,基本上都超过多年平均降水量的水平。东疆地区降水情况与南疆盆地类似,都是20世纪80年代中后期以前偏少,80年代中后期以后开始偏多,但21世纪初该区域的年降水量又开始减少。而年降水量较多的西天山山区、伊犁河谷、塔城地区、阿勒泰地区、准噶尔盆地的降水量基本上都是20世纪80年代中后期以前偏少,80年代中后期以后才开始超过多年平均降水量。以上结果说明由于地形差异,新疆的年降水量分布并不均匀,但降水的变化具有同步性。

2.3 各区域年降水量的突变时间

根据不同区域年平均降水量绘制了各区域的降水量累积距平(图2),并且结合t检验、Mann-Kendall方法在α=0.05的显著性水平下得到了全疆各区域1960—2011年M-K统计量曲线。

由各区域年降水的累积距平可见,东疆地区和南疆盆地东部多年降水量变化不明显,较为平稳。而南疆盆地西南部、阿勒泰地区、伊犁河谷、塔城地区、西天山山区的降水量距平都经历了从60年代至80年代中后期减少,80年代中后期至今增多的变化过程,表明全疆降水变化的同步性。特别需要指出的是,西天山山区、阿勒泰地区、伊犁河谷、塔城地区的累积距平曲线在80年代中后期至90年代中期发生波动,说明这一时期这些地区的降水变化情况较为复杂。

图2 新疆全年降水量分区及各区域年降水趋势和累积距平

利用M-K检验可知:南疆盆地西南部和东疆地区的降水都是从20世纪70年代初开始出现增多,这两个区域的降水量分别在21世纪初和20世纪90年代初出现了显著的增多;伊犁河谷、塔城地区、阿勒泰地区、准噶尔盆地的降水从20世纪80年代中后期才开始出现增多,这三个地区的降水量在21世纪初出现了显著的增多;南疆盆地东部和西天山山区的降水从90年代初才开始出现增多,较晚于其他区域,西天山山区的降水量在21世纪初发生了显著的增多。

整个南疆盆地降水量的突变出现在1987年,阿勒泰地区和准噶尔盆地的降水量突变分别出现在1986年和1987年,都较为接近。从各区域降水量的突变时间也可以看出全疆降水变化的同步性这一特征。

3 模糊C均值聚类法分区结果与其他方法分区结果的对比分析

过去大量对新疆气候变化的研究是从南、北疆、天山山区分别挑选若干个代表站进行,或是从行政地域、流域等划分上来研究气候变化。这种气候分区的特征具有较强的人为性。而本文采用模糊C均值聚类法对新疆年降水进行分区研究是利用模糊集理论来处理分类问题,该方法是根据研究对象本身的属性而构造一个模糊矩阵,在此基础上依据一定的隶属度较为客观地判定各气象站点的归属,这对进一步认识新疆降水的精细化空间分布有积极意义。虽然这种模糊聚类方法的分区个数可以预先给定,但分区个数的多少会受到隶属度的制约,即当取到合适的分区个数时,最后得到的隶属度值才可以明显地确定气象站点的归属。模糊C均值聚类法有效地避免了以前人为确定降水分区个数偏多或偏少的情况。

与文献[14]相比,本文中天山山区和南疆盆地的分区结果基本上与其一致,但北疆被细化为3个小区域,主要包括阿勒泰地区、伊犁塔城地区和准噶尔盆地沿天山北麓,而文献[14]中将这3个小区域划分为一个区域。事实上,阿勒泰地区、伊犁塔城地区的降水远多于准噶尔盆地。另外,本文的分区方法单独将东疆盆地划分成一个降水区域。与辛渝等[15]采用的REOF/RPCA分区结果相比较,本文对北疆地区的分区结果较为清晰,南疆盆地的分区结果与文献[15]基本一致。两种方法都得出了新疆大部分地区自20世纪80年代以来,新疆年降水出现不同程度的增加趋势。特别需要注意的是,两种分区方法都揭示出南疆盆地东部与该盆地其他地区虽然降水稀少,但降水的变化趋势却各不相同。

4 结论

(1)根据模糊C均值方法对新疆年降水的情况进行分区研究,结果表明新疆大致可分为7个区域。所分区域能够体现出由于地形差异导致的降水分布不均匀,这一结果与其他研究新疆降水分布差异的原因相同[10,11,14,15,23],分区结果合理,说明该聚类方法适用于区域气候区划。

(2)新疆处于西风环流控制区,由于地形差异和水汽补给导致了降水分布不均匀,但降水变化具有同步性。

(3)新疆大部分区域的降水量在20世纪80年代中后期以前偏少,低于多年平均值,自80年代中后期以后才开始偏多;南疆盆地西南部和东疆地区、北疆大部分地区、南疆盆地东部和西天山山区的降水量依次从70年代初、80年代中后期、90年代初开始增加,且依次从90年代初、20世纪末21世纪初开始显著增加。整个南疆盆地、阿勒泰地区、准噶尔盆地降水的突变时间较为接近,分别为1987年、1986年、1987年。

(4)新疆降水量整体异常表现为降水一致多(或少)、北多南少、西多东少。

[1]冯思,黄云,许有鹏.全球变暖对新疆水循环影响分析[J].冰川冻土,2006,28(4):500-505.

[2]张学文,张家宝.新疆气象手册[M].北京:气象出版社,2006:72-156.

[3]姜大膀,苏有峰,魏荣庆,等.新疆气候的干湿变化及其趋势预估[J].大气科学,2009,33(1):90-98.

[4]施雅风,沈永平,张国威,等.中国西北气候由暖干向暖湿转型的特征和趋势探讨[J].第四纪研究,2003,23(2):152-164.

[5]胡汝骥,姜逢清,王亚俊.新疆气候由暖干向暖湿转变的信号及影响[J].干旱区地理,2002,25(3):194-200.

[6]戴新刚,任宜勇,陈洪武.近50年新疆温度降水配置演变及其尺度特征[J].气象学报,2007,65(6):1003-1010.

[7]姜逢清,朱诚,胡汝骥.1960—1997年新疆北部降水序列的趋势探讨[J].地理科学,2002(6):669-672.

[8]赵勇,闵屾,秦贺,等.北疆汛期降水集中程度的特征分析[J].沙漠与绿洲气象,2011,5(3):6-11.

[9]赵勇,黄丹青,朱坚.北疆极端降水事件的初步分析[J].沙漠与绿洲气象,2010,4(5):1-5.

[10]刘琳,陈静,杜古尔加甫,等.新疆地区近50年来极端降水事件年内非均匀特征分析[J].沙漠与绿洲气象,2013,7(1):53-59.

[11]李珍,姜逢清.1961—2004年新疆气候突变分析[J].冰川冻土,2007,29(3):351-359.

[12]R.J.Hathaway,J.C.Bezdek.NERF c-means:Non-Euclideanrelationalfuzzyclustering[J].Pattern Recognit.,1994,3(27):429-437.

[13]Jain A K,Dubes R C.Algorithms for Clustering Data[M]. Englewood Cliffs,NJ:Prentice-Hall,1988.

[14]南庆红,杨舵,杨青.应用EOF方法分析新疆降水变化特征[J].中国沙漠,2003,23(5):554-559.

[15]辛渝,毛炜峄,李元鹏,等.新疆不同季节降水气候分区及变化趋势[J].中国沙漠,2009,29(5):948-958.

[16]薛燕,冯国华.半个世纪以来新疆降水和气温的变化趋势[J].干旱区研究,2003,20(2):127-130.

[17]袁玉江,何清,喻树龙.天山山区近40 a年降水变化特征与南、北疆的比较[J].气象科学,2004,24(2):220-226.

[18]韩萍,薛燕,苏宏超.新疆降水在气候转型中的信号反应[J].冰川冻土,2003,25(2):179-182.

[19]何清,杨青,李红军.新疆40 a来气温、降水和沙尘天气的变化[J].冰川冻土,2003,25(4):423-427.

[20]杨青,何清.西天山山区气候变化与灌区绿洲气候效应[J].冰川冻土,2003,25(3):336-341.

[21]范丽军,韦志刚,董文杰.西北干旱区地气温差的时空特征分析[J].高原气象,2004,23(3):360-367.

[22]杨晓丹,翟盘茂.我国西北地区降水强度、频率和总量变化[J].资源与环境,2005,23(6):24-26.

[23]黄玉霞,李栋梁,王宝鉴,等.西北地区近40年年降水异常的时空特征分析[J].高原气象,2004,23(2):245-252.

[24]刘吉峰,李世杰,丁裕国,等.一种用于中国年最高(低)气温区划的新的聚类方法[J].高原气象,2006,24(6):966-973.

[25]魏文寿,何清,刘明哲,等.准噶尔盆地的气候变化与荒漠环境研究[J].中国沙漠,2003,23(2):101-105.

[26]赵正波,林永波,李博渊.新疆阿勒泰地区大到暴雪日数气候变化特征[J].沙漠与绿洲气象,2013,7(5):14-18.

[27]张家宝,陈洪武,毛炜峄,等.新疆气候变化与生态环境的初步评估[J].沙漠与绿洲气象,2008,2(4):1-11.

Fuzzy C-Means Clustering Method for Climatic Regionalization about Precipitation in Xinjiang

WANG Xinping1,2,YANG Qing1,LIU Zhihui3,LI Hong4,Guligena4
(1.Institute of Desert Meteorology,CMA,Urumqi 830002,China;2.College of Mathematics and System Sciences,Xinjiang University,Urumqi 830046,China;3.College of Resource and Environment,Xinjiang University,Urumqi 830046,China;4.Xinjiang Meteorological inforamtion Center,Urumqi 830002,China)

Based on the annual data of precipitation from 100 meteorological stations in Xinjiang during 1960-2011,spatial distribution of precipitation for the whole region and sub-regions are studied by means of RPCA(rotated principal component analysis)and fuzzy c-means clustering method.At the same time,by using combined methods of linear trend,cumulative departure,M-K test and t-test,the variation trend of the precipitation in different sub-regions and also the abrupt changes are compared and analyzed to find the spatial characteristics of the annual precipitation in Xinjiang.The result showed as follows.(1)It can be roughly divided into 7 sub-regions according to its precipitation in Xinjiang.(2)The sub-regions divided by fuzzy c-means clustering method reflected the features showed an uneven distribution of precipitation caused by terrain differences, which is the same as the results gained by other methods.The reasonable result achieved by this way showed that the fuzzy c-means clustering method can be applied to climatic regionalization.(3)Comparatively speaking,the precipitation in most parts of Xinjiang were less than normal before middle or late 1980s,but more than normal since late 1980s.The precipitation in different subregions increased from early 1970smiddle or late 1980s,early 1990s,respectively.The abrupt changes of precipitation of the whole Southern Xinjiang Basin,Altay Region and Jungger Basin almost took place in the same time.(4)The whole abnormal structures of precipitation appeared in a way of being dry or wet in the whole Xinjiang,or wet only in the North Xinjiang and dry only in the South Xinjiang,or wet in the western part and dry in the eastern part of Xinjiang.

fuzzy c-means clustering method;climatic regionalization of precipitation;change trend;abrupt change analysis

P468

B

1002-0799(2013)05-0030-06

10.3969/j.issn.1002-0799.2013.06.005

2013-01-15;

2013-04-24

国家重大科学研究计划全球变化研究(2010CB951001),国家科技支撑计划项目(2012BAC23B01)和新疆大学博士启动基金(BS100103)共同资助。

王新萍(1980-),女,在站博士后,从事干旱区气候变化研究工作。E-mail:wangxinping313@sina.com

猜你喜欢
阿勒泰地区气象站南疆
珠峰上架起世界最高气象站
阿勒泰地区大果沙棘营养成分研究
南疆木棉红似火
南疆最美是春天
心灵气象站
筑梦南疆
自动气象站应该注意的一些防雷问题
阿勒泰地区哈萨克族民俗文化的研究
阿勒泰地区1961-2007年夏季平均最高气温及高温日数变化特征
阿勒泰地区冬季降水变化特征分析