基于云模型的典型水文年选取研究

2016-03-26 06:25胡斌奇伍永刚
中国农村水利水电 2016年5期
关键词:定性水文径流

胡斌奇,伍永刚,成 涛

(1.湖南省电力公司电力调度通信局,长沙 410007;2.华中科技大学水电与数字化工程学院,武汉 430074)

水文典型年是流域水利工程规划设计前的基础性工作,也是水电站经济运行的基本依据之一。在水利水电规划设计中,常选择有代表性的枯水年、平水年和丰水年作为设计典型年,分为称为设计枯水年、设计中水年和设计丰水年。在水库调度运行中,年径流过程是制定中长期计划的基础。由于受现阶段预报水平的制约,很难得到准确的中长期预报,但对于定性预测效果还比较理想,故选择不同典型年过程对实际调度也具有很好的借鉴意义。

传统基于频率法[1-3]的典型年确定方法首先对径流时间序列进行频率分析得到其频率分布曲线,再用设定的频率值分别代表枯水年、平水年、丰水年进行曲线查询得到对应的设计值,最后根据此值到历史资料中选择最为接近的一年作为典型年。但实际操作中,由于边界的不确定性,上述方法存在着较大的人为性及经验性, 如不同年份的两径流过程相像和不相像, 年径流量中丰水、中水和枯水之分等并没有明确的分界点。因此,相关学者提出采用模糊数学方法进行典型水文年的提取[4-6]。而在自然语言中,许多概念的不确定性包含了随机性和模糊性两个方面。这两方面通常有很强的关联性,不能分开。传统的模糊本体中所涉及的模糊概念过多地强调了概念的模糊性,而忽略了其随机性的特征。云模型方法[7,8]是在传统模糊集理论的基础上,引入概率统计思想,将隶属函数的精确性拓展为具有统计分布的不确定性,能够同时反映概念的模糊性和随机性。显然,用一个随机变量来表示某个对象属于某个不确定性概念的隶属度,比传统的确定隶属度函数更符合实际。因此,将云模型方法应用于典型水文年的选取具有积极的意义,目前尚未见此类相关文献报道。

本文运用云模型来描述水文年的定性概念,通过云变换的方法提取径流时间序列的不确定性概念;再引入一种考虑概念云幅度系数影响的概念云合并算法实现定性概念的跃升,实现了对数据的自动划分。相比传统的频率法,该方法避免了其计算过程中人为确定分类标准的主观性;而与传统的模糊理论构建方法比较,该方法不需要人为地统计对象属于某个概念的隶属度,可以直接从隶属云中抽取概念,且兼顾模糊性和随机性,更能反映流域水文的丰枯特性。

1 径流时间序列云变换

1.1 云模型的引入

云模型能够实现定性概念与定量值之间的不确定性转换。设U是一个精确数值表示的定量论域,C是U上的定性概念,若定量值x∈U,且x是定性概念C的一次随机实现,则x对C的确定度μ(x)∈[0,1]是有稳定倾向的随机数。其中,上述定义中所提及的随机实现,是概率意义下的实现;而确定度是模糊集意义下的隶属度,同时又具有概率意义下的分布。取若干个x∈U,则x的分布就构成了云,而每一个x称为一个云滴。

云由云滴组成,一般用期望Ex、熵En和超熵He这3个数字特征来整体表征一个概念[8]:①期望表示云滴在论域空间分布的期望,是概念在论域中的中心点;②熵表示定性概念的不确定性度量,由概念的随机性和模糊性共同决定,反映了该定性概念的模糊程度,通常情况下,熵越大,定性概念可接受的云滴取值范围就越大,定性概念越模糊;③超熵是熵的不确定性的度量,也就是熵的熵,揭示了在论域空间中所有点不确定度的凝聚性,也间接反映了云的厚度。

1.2 云变换实施步骤

云变换是一种定量数据到定性概念转换的 方法。传统定性概念挖掘中大多采用等距离区间法和等频率区间法,但由于其依凭主观划分的,且没有考虑划分边界的模糊性,称之为“硬划分”[9]。本文中云变换是指将径流数据转换成由多个云叠加而成的定性概念,以实现对数据的“软划分”。给定径流时间序列的频率分布函数f(x),采用基于峰值的云变换算法,其数学表达式为:

(1)

式中:ai为幅度系数;n为变换后生成的离散概念的个数;C(Exi,Eni,Hei)为变换后的其中一个云概念。具体的峰值云变换过程如下[7]:

(1)对属性U论域中的每一个可能属性值x,计算数据库中含有该属性值的记录个数,得到U的频率分布函数f(x)。

(2)寻找数据分布函数f(x)分波峰所在位置,将其属性值定义为云的质心位置(期望) ,计算用于拟合f(x)的、以Exi为期望的云模型的熵,计算云模型的分布函数fi(x)。

(3)从f(x)中减去已知云模型的数据分布fi(x),得到新的数据分布函数f′(x),并在此基础上重复(2)、(3)得到多个基于云的数据分布函数。

(4)根据已知的f(x),最后得到的拟合误差函数f(x)及各个云模型的分布函数,计算基于云模型的定性概念的3个特征值。

2 概念跃升及数据集划分

2.1 概念跃升

尽管通过云变换能够很好地拟合原始数据分布,但由于没有考虑云模型之间的关系,得到的云模型集较为粗糙。通常会出现下列2种特殊情况:云模型之间的交叠关系过于复杂,有些云模型之间的距离过近,所表达的定性概念非常近似;云模型之间过于稀疏,甚至出现概念“真空地带”,所以要对这些基本概念进行跃升。所谓概念跃升,是指将云变换得到的基本概念作为泛概念树的叶结点,逐步合并距离最近的两个概念,以得到想要的概念层次。本文采用人机交互的跃升策略,即用户预先指定跃升的概念粒度(即概念个数)进行概念跃升,同时根据挖掘结果多次干预并具体指导概念跃升。

设C1(Ex1,En1,He1)和C2(Ex2,En2,He2)是论域U上的两个相邻的基本云概念,若Ex1≤Ex2,则C1和C2按照文献[10]基于“软或”方式的概念跃升得到的云概念C3(Ex3,En3,He3):

(3)

He3=max(He1,He2)

(4)

通过上述“软或”操作,可以将相邻的两个基本概念提升为能概括它们的较高层次的新概念,形成具有不确定性的泛概念树。值得说明的是在泛概念树中,同一层次的各个概念之间的区分不是硬性的, 允许一定的交叠。文献[7]提出了另一种“积分”概念跃升算法,如下:

(5)

En3=E′n1+E′n2

(7)

设概念C1和C2的概率密度期望曲线相交于点d(xd,yd),截断熵E′n1和E′n2的计算如下:

(9)

可以看出,“积分”云综合法得到的综合云更靠近熵较大的概念,但上述方法并没有考虑其幅度系数对合并的影响。实际运用过程中,对于幅度系数大的概念应该有所倾斜,即合并后的综合云期望应该距幅度系数大的期望值更近。设相邻两个概念云的幅度系数分别为r1和r2,改进后的概念跃升算法如下[11]:

(12)

计算合并后概念云的幅度系数得到:

(13)

2.2 数据集划分

将概念跃升到合适的概念粒度或概念层次后,剩下的问题就是判定所有的属性值xj与云概念Ci的隶属度。对于径流时间序列的某样本点而言,首先生成以Eni为期望,H2ei为方差的正态随机数E′ni,然后得到其对Ci的隶属度hi为:

hi=e-(xj-En)2/[2(E′ni)2]

(14)

隶属概念的判定有2种方法:随机判定法和极大判定法[12]。随机判定法是根据属性值对概念集中所有概念隶属程度比例关系,在隶属程度大的前几名中随机选择隶属概念。极大判定法则是根据属性值对概念集中所有概念的隶属程度的大小,选择最大隶属度的概念作为隶属概念。本文采用极大判定法,即根据属性值对概念集中所有概念的隶属程度的大小,选择最大隶属度的概念作为隶属概念。

本文所述方法其原理如图1所示。首先按照2.1节方法提取径流时间序列不确定性概念,并采用概念跃升方法进行云综合,实现了对径流数据定性概念的自动划分;然后根据式(14)得到各输入年径流相对典型年概念集的隶属情况,基于极大判定法得到其隶属云和隶属度;最后根据上述隶属度值得到典型年份。值得注意的是,对于同一属性值,以往模糊理论的方法只给出某一确定的、一成不变的隶属概念。而基于云模型的典型年分析将给出随机的、以一定分布出现的隶属概念,综合体现了定性概念的模糊性和随机性,以及不同概念层次之间的多隶属关系。

图1 基于云模型的典型年选取原理

3 实例分析

3.1 数据来源及分析

以湖南省资水流域柘溪水电站1930-2010年实测年径流序列为例,验证本文所述预测模型的有效性。柘溪水电站装机容量44.7万kW,是一座完全年调节的水库。对原始数据首先对径流资料进行归一化处理。按照等距离区间法,图2给出了年径流数据的分布图(区间数20)及正态分布拟合结果。从中可以看出,年径流时间序列概率分布与正态分布函数并不吻合。对年径流序列采用云变换,可以得到7个初始模糊概念,如图3所示。

图2 年径流序列概率分布

图3 年径流时间序列云变换结果

图4 云综合后得到的云概念

从图3可以看出,采用云变换进行径流属性的离散化,所得到的定性概念更可以反映论域中径流值的实际分布。按第2.1节中的概念云合并算法,对上述获得的初始不确定性云概念进行合并,最终得到3个粗粒度的不确定性概念,如图4所示。其中经过合并后的综合云即分别对应着水文特性中的典型枯水年、平水年和丰水年的特征分布。

3.2 仿真分析结果

从图4中可以看出,最终得到的3个不确定性概念较为客观地反映了柘溪水电站的年径流时间序列的分布情况,这3个概念可分别被称为枯水年、平水年、丰水年。为对比分析本文方法与传统频率法的结果,表1给出了基于频率法的水电站设计典型年计算结果。首先对年径流量资料系列按皮尔逊III型理论频率曲线进行适线, 得到所要求5种频率(其对应设计频率为10%、20%、50%、80%、90 %)的理论年径流量值。在传统的频率法中,一般选取频率为20%、50%和80%作为典型特征年。按照此思路,在径流历史序列中,选取了与之最接近的两个年份作为备特征选年份,如表1所示。可以看出,传统的频率法中存在较强的人为确定分类标准的主观性。

不同于上述方法,采用基于云模型的典型年选取过程中,整个过程不受参数的影响, 避免了人为确定参数的主观性。表2给出了不同方法得到的设计典型年径流,可以看出采用考虑幅度系数的云模型得到的概念中心较原始云综合法更贴近传统的频率法的计算结果,这也验证了本文概念跃升方法的有效性。但同时也可以看出,本文方法与传统频率法结果存在一定差异,产生这种差别的原因在于年径流序列本身边界的模糊性和不确定性。传统频率法得到的结果受人工主观性影响较大,而基于云模型的选取方法中通过计算不同年份下的年径流值对于上述概念云的隶属度来得到历史序列中最为接近的年份作为典型年。依据式(14)对给定的历史序列进行分析,最终得到的柘溪水电站的典型枯水、平水、丰水年分别为1983年,1976年和1969年。

表1 基于频率法得到的设计典型年

表2 不同方法得到的设计典型年径流

此外,对于特定的某水文年,为分析其丰枯特性,可根据该年径流对于上述概念云的隶属度直接推求。与传统的模糊构建方法比较,云变换方法的优点在于它使用云模型来描述概念,克服了人为确定分类标准的主观性, 使选取的丰枯典型年更加合理;且对于特定的输入对象,其对概念的隶属度采用条件云发生器得到,更能反映对象的随机性。依据式(14),计算2008-2010年径流量的隶属度,经过多次运行得到的结果是一系列不确定的、在某个范围内变化的离散点的集合。采用其数学期望作为最终隶属结果,如表3所示。从中可以看出,基于云模型的水文特性分析,不仅能给出典型设计年径流量,且采用具有随机概念的隶属度来描述特定年的水文丰枯特性,更符合实际情况下不同人对于相同属性值在同一模糊概念下隶属度差异性的情形。

表3 不同年份的水文丰枯特性分析结果

4 结 语

针对传统基于频率法确定典型水文年计算过程中人为确定分类边界的主观性和确定性,本文引入云模型来描述年径流的定性概念,从而更好地体现水库水文丰枯特性的随机性与模糊性。通过采用云变换和云概念跃升措施,自动提取年径流序列的典型概念中心,并通过条件云发生器产生不同年份的水文丰枯特性隶属度。相比于传统的频率法和模糊法,由于基于云模型的水文特性分析得到的结果是模糊的、不确定的,更符合人类对定性事物的判断方式。

[1] 唐德善. 黄河流域水文典型年和典型系列优选[J]. 河海大学学报, 1994,22(2):15-19.

[2] 陈利群, 蒋 咏. 典型年法的修正及其在城镇给水规划中的应用[J]. 水利水电技术,2011,42(10):22-24.

[3] 左其亭, 陈耀斌. 具有多个水文站的多支流河流典型年选取方法[J]. 水文, 2012,32(2):1-4.

[4] 夏莉敏, 张 玮. 基于模糊聚类迭代模型的典型水文年选取研究[J]. 武汉理工大学学报(交通科学与工程版), 2009,33(4):695-698.

[5] 易淑珍, 严远玲. 模糊优选方法在降水典型年选择中的应用[J]. 广东水利水电,2005,(2):81-83.

[6] 宋亚娅,张 振,黄振平,等. 基于模糊识别理论的无资料地区设计径流典型年选择[J]. 河海大学学报(自然科学版), 2014,42(1):19-23.

[7] 李德毅, 杜 鹢. 不确定性人工智能[M]. 北京: 国防工业出版社, 2005.

[8] 刘常昱,李德毅,潘莉莉. 基于云模型的不确定性知识表示[J]. 计算机工程与应用,2004,(2):32-35.

[9] 栗 然,崔天宝,肖进永. 基于云模型的短期电价预测[J]. 电网技术,2009,33(17):185-190.

[10] 蒋 嵘,李德毅,范建华. 数值型数据的泛概念树的自动生成方法[J]. 计算机学报,2000,23(5):470-476.

[11] 孟 晖,王树良,李德毅. 基于云变换的概念提取及概念层次构建方法[J]. 吉林大学学报(工学版), 2010,40(3):782-787.

[12] 张家精,王焕宝,陈金兰,等. 基于云模型的隶属概念判定算法的改进[J]. 计算机技术与发展,2007,17(10):65-68.

猜你喜欢
定性水文径流
格陵兰岛积雪区地表径流增加研究
基于SWAT模型的布尔哈通河流域径流模拟研究
分裂平衡问题的Levitin-Polyak适定性
继往开来 守正创新——河北省水文工程地质勘查院
雅鲁藏布江河川径流变化的季节性规律探索
水文
水文水资源管理
变化环境下岩溶区流域径流变化特征研究
当归和欧当归的定性与定量鉴别
水文