基于毫米波测云雷达的云粒子相态识别研究

2019-03-17 01:56刘光普周亭亭
沙漠与绿洲气象 2019年6期
关键词:相态冰晶反射率

任 雍,梁 莺,刘光普,周亭亭

(1.福建省气象科学研究所,福建 福州350001;2.福建省大气探测技术保障中心,福建 福州350008;3.北京无线电测量研究所,北京100854)

云内部微物理特征的演变过程是影响各类天气过程产生、发展、消亡的核心因素,云内水凝物热力学相态是主要的云微观物理参数之一[1]。作为重要的云微物理参数,云中粒子相态的分布和演化对人工影响天气、飞机积冰等方面研究有十分重要的影响[2-3],是云微观探测的重点关注领域。

目前对云的遥感探测手段主要包括气象卫星、激光云高仪、天气雷达、毫米波测云雷达等。前3 种装备观测的主要是云的宏观特征,而毫米波测云雷达则可同时兼顾云体宏观特征和云粒子的半径、数量、分布等微观特征。毫米波测云雷达波长与云粒子尺度最为接近,具有高灵敏度和高时空分辨率,是目前对云粒子最敏感的探测设备[4],双极化毫米波雷达通过接收水平和垂直方向的电磁波,能够得到回波的强度、速度、谱宽、线性退极化比信息,从而揭示云内粒子的形状、相态、空间分布,为气象研究和气象保障提供准确的数据支持[5]。目前对于云粒子相态和过冷水的研究均基于厘米波天气雷达,其主要用于探测大范围降水天气,对云内微观状态不敏感,且云内部探测结果会受到强降水过程的干扰影响[6-7]。

Shupe[8]提出了联合激光雷达、8 mm 云雷达以及微波辐射计等判断云水凝物相态的算法,可得到云水凝物相态的垂直分布,其中考虑利用激光雷达退偏振比以及毫米波雷达的反射率因子、Doppler 平均速度和谱宽、温度等阈值判断粒子相态及形状。国内外也有相关研究利用微波雷达退偏振因子分析降水云粒子的相态及形状[9-10],认为在零度层以上降水粒子的空间取向和介电特性很复杂,退偏振因子信息较差分反射率信息更有意义,但退偏振因子的利用要求雷达系统具备较高的灵敏度。为改进阈值法过于刚性的分类方法,许多研究采用模糊逻辑法[11-14],充分利用双偏振天气雷达的各种参量对降水系统中的粒子进行分类。彭亮等[15]利用2008 年寿县站点大气辐射测量项目(ARM)3 mm 云雷达的观测资料以及探空资料,根据前人观测试验总结的不同种类粒子的阈值,建立隶属度函数,然后利用模糊逻辑法进行水凝物相态垂直分布反演试验。

本研究中首次采用了工作于Ka 波段的毫米波测云雷达回波数据,能够识别非降水云和弱降水云内粒子相态和过冷水分布特征,从而为天气过程演变研究、民航保障和人工影响天气研究提供决策依据。

1 Ka 波段毫米波测云雷达系统性能分析

Ka 波段毫米波测云雷达的波长介于厘米波和激光之间,使其兼具两者的特点:毫米波波长短的特点,使其比厘米波雷达对云粒子更敏感;而与激光雷达相比,毫米波又具有更好的穿透能力。

毫米波雷达技术优势主要体现在以下几点:雷达后向散射截面σ 与λ-4成正比[16],毫米波雷达工作在Rayleigh 散射区[17],对小粒子敏感性强,具有很高的灵敏度,Ka 波段与S 波段天气雷达相比,具有40 dB以上的增益;雷达体积小、重量轻、功耗低,适合配置在移动平台上;多普勒效应明显,速度分辨率高,测速精度高;可基于较小的天线口径得到窄波束,方向性好,空间分辨率高。

本文应用设备为北京无线电测量研究所研制的HMB-KST 型全固态毫米波测云雷达,试验期间雷达系统架设于北京南郊,其主要技术参数如表1 所述。

表1 HMB-KST 毫米波测云雷达主要技术参数

2 云粒子相态识别原理

云粒子相态识别主要依据不同类型粒子反映的雷达探测参数值不同。根据试验需要,本文对云粒子相态分类如下:干冰晶、湿冰相和融化层、混合相与降水、过冷水滴、暖云滴。各类粒子特征如下:

(1)干冰晶,主要集中在冷云中上部至云顶,是云内主要凝结核。干冰晶的平均半径较小;作为单一粒子层,具有较小的速度谱宽;线性退极化比较小。冰晶向下运动遇到过冷水时形成雪和霾,雪和霾经过融化层形成降雨。

(2)湿冰相和融化层,相态最为多变,包括冰晶和过冷水碰并后的雪和霰,以及冰相粒子经过零度等温线后的融化相。其含水量远高于冰晶,雪的含水量高于霰。雪和霰生成于冰晶与过冷水混合层,向下运动延伸至融化层。在雷达探测参数表征方面,雪和霰有较大的速度谱宽和线性退极化比,而融化层具有最大的线性退极化比。

(3)混合相与降水,混合相意味着在一个距离库内同时存在着冰相和液相粒子,降水粒子有明显的下落速度,二者都具有最大的速度谱宽。

(4)过冷水滴,主要集中在冷云中下层,温度在-20~0 ℃,是影响降水丰沛程度的主要云粒子。过冷水滴由强上升气流将暖云滴抬升而产生,在遇到更高处的冰晶时迅速消耗[9]。过冷水滴平均直径小,运动速度统一,在冷云层中有最小的反射率因子、线性退极化比和速度谱宽。

(5)暖云滴,温度高于零度的暖云的主要粒子形态,主要集中于云体下部,对于非降水云,暖云滴具有最小的反射率因子、谱宽和线性退极化比;对于降水云,暖云滴直径大,反射率因子多大于过冷水滴[18]。

根据上述分析,虽然各类型粒子有其自有特征,但这些特征不具备排它式的门限值特征,而是互有耦合的综合反映结果。这种情况下,选用决策树算法可以得到较好的识别效果。算法选择的直接探测参量包括:雷达得到的反射率因子、速度谱宽、线性退极化比,以及同期探空资料插值得到的温度信息。

3 基于决策树的识别算法分析

基于决策树的云粒子相态识别算法根据半物理规律的统计特征,应用机器学习的思想进行算法设计,为各雷达探测要素分配不同层级的决策函数,构成决策空间的多个纬度,完成相态判别。

决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。

在机器学习中,决策树是一个预测模型,其代表的是对象属性与对象值之间的一种映射关系。相比近些年应用日趋广泛的支持向量机算法,决策树是相对简单的机器学习算法,但是在面对输入数据维度较少的情况时,具有很高的效率。并且,在面对某些复杂决策问题时,基于单决策树算法可以构建随机森林,可以大幅拓展其应用领域[19-20]。

本应用的算法包括决策因子分析、规则推导、决策空间建立、逻辑判别等几部分。

3.1 决策因子分析

反射率因子的公式为:

式(1)中D 为粒子直径,反射率因子Z 与粒子的直径密切相关,故不同相态的粒子大小的差异会呈现不同的反射率因子值;速度谱宽SW 是下落过程中不同相态粒子大小、形状、密度等差异使粒子的下落速度不同导致速度谱宽的不同;退偏振因子LDR 与粒子的非圆形程度和介电常数有关,不同的粒子的非圆形程度和介电常数不同,因此会呈现不同的LDR 值,故反射率因子Z、速度谱宽SW、退偏振因子LDR 作为粒子相态的识别参数,探空数据温度T的相关变化也能够反映粒子相态的变化。不同相态粒子的反射率因子Z、速度谱宽SW、退偏振因子LDR 的特征在第三部分云粒子相态识别原理中有具体说明。因此选择反射率因子Z、速度谱宽SW、退偏振因子LDR、探空数据温度T 4 个参量作为决策树算法的决策因子。

3.2 规则推导

在确定好决策因子后,将其作为决策树学习算法的属性,根据这些属性进行云粒子相态分类和识别。算法利用训练数据集合B(包含各训练数据的云粒子相态) 和对应的样本属性集合A ={a1,a2,…,ad}(包含对应的4 种决策因子的值)来进行训练。该部分主要是确定好各属性的结点位置及该属性判别时的阈值。划分属性主要是依据信息增益和增益率的大小来进行。由于训练样本中的属性大多为连续值,因此先将属性的样本集合进行分段,即对四类属性分别进行合适的分段,则有集合:

式(2)中i=1,2,3,4 表示4 类属性,j 表示在第i 类属性中根据该类值的大小划分的第j 段,该段内的值所在区间为,共分为ni段。

划分好分段后,则可按照离散属性值来进行划分:

式(3)中Ent 表示信息熵,Pk表示属于该相态的概率,式(4)中Gain 表示属性在当前层级的信息增益,式(5)Gain_ratio表示相应的信息增益率,式(6)中IV表示该类属性的固有值。

由式(3)~式(6)可得到各个属性的增益率,然后从中找出信息增益率高于平均水平的增益,再从中选择增益率最高的作为决策树当前层级的结点,同时选取增益率最高时的阈值。确定好当前层级的结点后,可再下一层级将继续利用公式(3)~式(6)来求取,此时公式中的属性计算不包含上一层级的属性。以此类推,直到属性的全部划分完毕。

3.3 决策空间建立

决策树属性及相关阈值划分好之后,基于训练数据的决策空间初步建立。在决策树学习中,为了尽可能正确分类训练样本,结点划分过程不断重复,有时会造成决策树分支过多,此时容易把训练集自身的一些特点当作所有数据都具有的一般性质而导致过拟合。此时需要进行“后剪枝”处理,即在训练集生成一个完整的决策树后,自底向上地对非枝叶结点进行考察,若将该结点对应的子树(置信度不高的情况)替换为叶结点能带来决策树泛化性能提升,则将该子树替换为叶结点,降低过拟合的风险。

3.4 逻辑判别

经过训练数据生成的决策树空间包含相应的属性层级分类和相关的阈值判断标准,则在新数据(实测数据和对应的决策因子)输入的情况下,可以按照决策树模型等逻辑判别来进行云粒子相态的分类和识别。

在经过大量的训练数据训练后,决策树的模型及相关参量已构建完成。在本应用中,输入数据仅包含了反射率因子Z、速度谱宽SW、退偏振因子LDR和温度T 4 种参量,应用决策树算法具有较高的效费比。

根据云相态识别应用的特点,设计决策树模型。算法输入决策域包含:回波强度、速度谱宽、线性退极化比、大气温度4 类数据。输出域为5 种云粒子相态:干冰相、湿冰相、混合相和降水、过冷水、暖云滴。算法的输入的温度数据经过三阶样条插值处理与测云雷达的距离库相匹配。

4 相态识别结果与过冷水分布

本文选择试验期间的3 次典型天气过程分别为:2017 年1 月19 日、2017 年2 月7 日、2017 年3 月20 日。对雷达观测的回波进行分析,雷达数据选用RHI 扫描模式的数据,雷达数据和相态识别结果的横纵坐标均表示探测范围,探空数据的横坐标是温度,纵坐标为高度。云体反射率因子、探空数据、相识别结果如图(2~4)所示。

2017 年1 月19 日小雪天气过程观测产品如图2 所示,探空温度显示地表以上各层温度均低于零度。雷达扫描仰角范围为20°~90°。相态识别结果表明:此次小雪过程中云顶表现主要为一薄层干冰晶相,过冷水主要分布在3000~5000 m 高度处,二者交汇处多表现为湿冰相和混合相。近地面处识别为干冰晶,表明当天降雪中的液态水含量较低。

图2 1 月19 日反射率因子(a)、相态识别结果(b)和探空数据(c)

2017 年2 月7 日北京入冬以来出现的明显降雪天气,图3 为该时间段观测产品。雷达扫描仰角范围为20°~90°。根据识别结果可知:5000 m 以上高空云体主要由冰晶构成;过冷水主要分布在1500~5000 m 高度间,分布范围较广,与探空资料中的逆温层强相关;过冷水与冰晶交汇处出现混合层和带状湿冰相。本次过冷水区回波强度较大,判断本次降雪形成机制为冰晶与过冷水碰并生长的贝吉隆过程,丰富的过冷水是本次降雪形成的关键。探空温度数据的逆温层表明可能存在上升气流,上升气流促进了下部过冷水与上部冰晶的碰并凝结,而凝结过程中释放的热量也导致逆温现象更加明显。近地面处识别为降水态和冰晶态,表明当天的降雪湿度比2017 年1 月19 日明显偏大。

图3 2 月7 日反射率因子(a)、相态识别结果(b)和探空数据(c)

图4 3 月20 日反射率因子(a)、相态识别结果(b)和探空数据(c)

图4 展示了2017 年3 月20 日的试验数据,当天天气情况为阴天、层云,伴有间歇性小雨和毛毛雨。雷达扫描仰角范围为5°~90°。相态识别结果为:云顶5000 m 以上有一薄层的干冰晶,云体中下部存在少量过冷水,云体大部分区域为混合相。云底在1100 m 附近识别为带状融化层、湿冰,其下为降水。根据相关文献的历史统计结果,典型的融化层亮带多发生于降水过程即将结束时,而过冷水层耗尽是层状云降水结束的主要原因,因此强亮带上方过冷水含量应该较少,本识别结果中,左侧近区典型强亮带上方基本无过冷水,而右侧远区弱亮带上方则含有过冷水,与统计结论吻合较好。根据历史统计,华北地区层状云降水强度与过冷水丰度高度相关,本次识别结果中,过冷水分布区域相对较小且所在区域回波强度较低,表明过冷水丰度不高;本次降水过程表现为小雨和毛毛雨,雨强与过冷水识别结果相吻合。

上述3 次天气过程的分析表明,利用毫米波测云雷达回波数据分析得到的粒子相态结果与实测天气状况吻合较好,也符合天气学微物理过程原理。

5 结论

毫米波测云雷达作为一种新型气象遥感装备,综合利用了毫米波波长短、穿透力强的特征,弥补了厘米波雷达和激光雷达的不足,表现出对云粒子微观特征高度敏感的优势。

本文基于毫米波测云雷达的探测数据和探空仪获取的温度数据,设计了云粒子相态识别的决策树算法。该算法以反射率因子Z、速度谱宽SW、退偏振因子LDR 和温度T 等4 种参量作为输入,具有较高的效费比。

采用该算法,本文对2017 年1 月19 日、2 月7日、3 月20 日的毫米波测云雷达探测数据,进行云粒子相态识别和过冷水等数据产品的反演和分析。分析结果表明:

(1)逆温层与过冷水层高度正相关,过冷水层通常伴随着逆温层一同出现;

(2)过冷水和冰晶交汇区附近通常会出现湿冰相和混合相;

(3)过冷水含量与融化层亮带会呈现出一定的负相关关系。

整体上来讲,采用本文提出的决策树算法得到的相态识别结果,与实际物理机制相吻合,验证了该识别算法的有效性。空中水凝物的相态识别,尤其是过冷水相态的辨识,对采用遥感手段分析降水特征、估计降水参量具有重要意义,后续将进一步开展深入研究。

猜你喜欢
相态冰晶反射率
翼面结冰过程中的冰晶运动相变与黏附特性
近岸水体异源遥感反射率产品的融合方法研究
具有颜色恒常性的光谱反射率重建
为什么会下雪?
基于集成学习的风云四号遥感图像云相态分类算法
煮不熟的鸡蛋
基于地面边缘反射率网格地图的自动驾驶车辆定位技术
乌鲁木齐城区季节转换降水相态的识别判据研究
冰晶奇域
PS/PLA共混物的相态结构及其发泡行为研究