基于BP 神经网络的大气温度廓线分层反演

2021-10-18 08:58李洪辉吴昌哲
科学技术创新 2021年27期
关键词:温湿度反演大气

吴 鹏 李洪辉 于 雷 吴昌哲*

(哈尔滨工程大学,黑龙江 哈尔滨 150001)

目前大气的探测三种主要手段分别是探空气球、卫星遥感和地基微波辐射计。探空气球可以获取较为精准的大气温湿廓线信息,但其每次观测需要等待气球升空,耗费时间太长且具有时空不一致性大大局限了探空气球的应用[1]。卫星遥感通过星载感知设备测量上行大气辐射能量信息(即亮温谱线),之后将亮温谱线反演得到大气温湿度廓线实现大气温湿度廓线遥感观测。卫星遥感的工作原理决定了:所观测地区穿越云层越厚所受到的吸收和散射就越强,则大气温湿度廓线反演结果的精度就越低,导致卫星遥感技术在近地面反演的大气温湿度廓线误差较大,无法满足对温湿度廓线高精度的需求[2,3]。为满足对温湿度廓线高精度的需求,大量专家、学者将目光投向地基微波遥感技术。与卫星遥感相反,地基微波遥感技术利用辐射能量观测设备测量下行大气辐射信息,从原理上减少了云层吸收和散射所带来的误差,也使得其在低空大气观测领域有更好的表现。微波辐射计将辐射信号转化为电信号以实现对不同通道大气辐射能量的观测获得亮温谱线,再通过算法反演获得大气温湿度廓线[4,5]。

1 研究背景

大气温湿度廓线反演的算法主要可以分为以下三类:统计回归法、物理反演法以及神经网络法[6]。作为最早被使用的方法,统计回归法建模简单、容错性较低、对异常处理能力不足。物理反演算法依托于大气辐射传输方程、从物理规律出发具有较强的细节处理能力,但是算法迭代时间较长不具有实时性。神经网络是一种模仿生物神经系统的机器学习算法,该算法目前已经广泛应用于气象处理领域,该算法建立观测亮温谱线与大气温湿度廓线之间的非线性网络,利用大量的大气参数历史数据对网络权值进行大量训练,最终得到最能体现两者之间关系的网络模型。神经网络算法的优势在于容错性好,高精度、稳定性好以及算法效率高[7]。本文主要是对0~10km 低空大气温湿度廓线在训练网络时不同分层方案进行优劣势分析。

2 BP 神经网络反演原理

本文采用的是BP(Back-propagation,反向传播)神经网络进行网络模型训练。BP 神经网络是传统的神经网络,该网络是一种监督的机器学习算法,它包括信号的前向传播和误差的反向传播两个过程。

计算输出误差时按从输入到输出的方向进行,而调整权值和阈值则反过来从输出到输入的方向进行。正向传播时,输入信号通过隐藏层作用于输出节点,经过激活函数运算求和产生输出信号,计算实际输出与期望输出的误差值,将误差传入反向传播过程。误差反向传播是将输出误差通过隐藏层向输入层逐层反向传播,以从各层获得的误差信号作为调整各单元权值的依据。调整输入节点与隐藏层节点、隐层节点与输出节点之间两组联接强度和阈值,采用梯度下降法经过反复学习训练相对应的网络权值和阈值。

3 数据处理和网络构建

多通道地基微波辐射计MP3000A 产自Radiometric 公司研发的,该地基微波辐射计共包含35 个测量通道,工作时采用扫频法对大气微波辐射每个频点进行测量。设备集成度高体积相对较小,可进行多角度的大气参数观测[9,10]。

神经网络输入端数据包括:微波辐射计MP3000A 所测得22.235GHz、22.500 GHz、23.035 GHz、23.835 GHz、25.000 GHz、26.235 GHz、28.000 GHz、30.000 GHz、51.250 GHz、51.760 GHz、52.280 GHz、52.800 GHz、53.340 GHz、53.850 GHz、54.400 GHz、54.940 GHz、55.500 GHz、56.020 GHz、56.660 GHz、57.290 GHz、57.960 GHz、58.800 GHz 共22 个频点的亮温数据以及地表测得的温度、气压、相对湿度、红外数据,总共26 组数据。在0-10km的低空想要得到垂直分辨率较高的大气温湿度廓线,那么就需要增加输出层节点的数量。方案一中输出端高度分辨率为100 米一层将0-10km 分成了100 层,这样就使得输出节点数量过于庞大;方案二将0-10km 分成0-2、2-6、6-10km,各层输出层节点分别为20、40、40;方案三将0-10km 分成0-3、3-7、7-10km,各层输出层节点分别为30、40、30;方案四将0-10km 分成0-2.5、2.5-5、5-7.5、7.5-10km,各层输出层节点分别为25、25、25、25;各神经网络隐藏层节点数量的选择由经验公式确定,表1。

表1 方案分层情况

方案二神经网络分层示意图如图1,分层高层、中层和底层,其他方案的分层形式同理。

图1 方案二分层示意图

本文这四个方案神经网络训练统一使用样本为台州地区2015-2019 年共6 年的大气参数历史数据,实验中去除数据中的空数据和不合格数据,75%作为训练集,25%作为测试集。然后从台州地区2020 年数据中选取200 组数据来验证这些网络的表现。

4 实验结果分析

神经网络的预测性能直接由网络训练结果决定,训练得到网络模型后对网络训练结果进行分析。将检验样本代入各方案网络进行计算,各方案大气温度廓线输出的平均误差和均方根误差结果如表2 所示。

表2 各方案大气温度廓线输出的统计结果

从数据上来看,分层方案二、三反演得到的大气温度廓线的均方根误差和平均误差均小于方案一反演结果,但是方案四的均方根误差和平均误差与方案一相差不大。由此说明分层方案在网络训练中能一定程度上更为精准的提取出数据特征,但是分层方案四也表明分层时需要有一定考量。

整体来看在4km 以下各方案结果都比较接近探空真值,误差波动较小,然而在7km 以上各方案的差距慢慢拉大,方案二和方案三更为接近探空真值,方案四与方案一表现差距不大。方案四说明一味地多分层效果不一定会更好。总体上分层方案表现优于不分层的方案一,特别是在7km 以上的高层。

最后,可以从各个方案训练使用的时间对比直方图(图2)可以看出,方案一平均耗时65 小时左右,方案二、方案三、方案四分别为1.53 小时、1.62 小时、1.12 小时。由此可见分层可以极大的缩减网络训练所用时间,原因主要是减少隐藏层节点数会极大地提升网络迭代计算的速度,减少算法执行周期的时间。输出节点过多会使得网络数据特征提取困难,导致网络迭代速度下降。并且大气层分层处理并没有导致分层方案的结果廓线的不连续性。

图2 各方案训练时间对比图

5 结论

本文基于MP3000A 进行低空大气温度廓线反演,在BP 网络的基础上采用多种方案构建网络,并比较了各分层网络反演结果。方案二和方案三较之不分层的方案一在精度与网络训练效率方面都要更具有优势,特别是在高层大气优势明显。分层方案反演所需时间的减少,极大地提升了用用的灵活性。同时分层越多并不代表会得到更好的结果,而且不同的分层方案得到提升效果也不尽相同。由于云层会直接影响辐射传输的,接下来的研究方向是如何结合云层特点来分层使得分层网络有更好的性能。

猜你喜欢
温湿度反演大气
反演对称变换在解决平面几何问题中的应用
基于ADS-B的风场反演与异常值影响研究
Meteo-particle模型在ADS-B风场反演中的性能研究
宏伟大气,气势与细腻兼备 Vivid Audio Giya G3 S2
长期运行尾矿库的排渗系统渗透特性的差异化反演分析
文物展柜内环境温湿度的调控与监测
蛋鸡育雏育成舍环境控制技术
温湿度独立控制空调系统在医院建筑中的应用研究
如何“看清”大气中的二氧化碳
大气光学现象