基于机器学习的偏振遥感云检测优化算法研究

2024-04-16 20:02吴艳平
信息记录材料 2024年1期
关键词:偏振反射率波段

吴艳平

(安徽亳州新能源学校 安徽 亳州 236700)

0 引言

云是地球水循环的中间环节,是水汽在高空遇冷液化凝集而形成的一种可见聚合物,对地球水循环、地表辐射平衡的调节均有着重要意义。 通过遥感偏振技术对云进行检测,是去除陆地气溶胶物理特性的关键步骤,随着研究的不断深入,计算机算法应用于云的检测已较为普遍,通过计算机算法和大气遥感技术、人工智能技术的结合,能够实现智能化、自动化的大气监测。 基于机器学习的云检测算法逐渐成为研究的热点[1]。 但现有偏振遥感云检测中算法及数据在识别高反射率地表环境以及高反射云像时存在偏差,容易出现判定模糊等问题。 本文在现有偏振遥感云检测算法基础上,基于机器学习构建一种更具泛用性、实用性和可靠性的偏振遥感云检测算法模型,以期为偏振遥感云检测工作的优化提供启发与参考。

1 基本原理

1.1 偏振遥感的基本理论

在云和气溶胶检测与分析中,偏振信息更具特异性和灵敏性,检测偏振信息更能够体现云和气溶胶的特性,我国广泛应用偏振遥感技术实施云检测。 目前,偏振遥感技术的常用偏振算法主要有两种,分别是多角度偏振(polarization and directionality of the Earth’s reflectances,POLDER3)卫星载荷和多角度偏振成像仪(directional polarimetric camera,DPC)卫星载荷[2]。 基于490 nm、670 nm、865 nm 三个偏振频段的托克斯矢量I、Q、U检测来识别和鉴定陆地气溶胶特性,算法规则为式(1)、式(2)所示:

式(1)、式(2)中,R代表反射率,RP代表偏振反射率,而I、Q、U则是对应的托克斯矢量数据,θS代表天顶角(太阳),将遥感数据代入对应算法,可得到与云有关气溶胶的特质信息,同时这两个基本算法均支持可逆计算。

1.2 PSO⁃BP 神经网络模型

误差逆向传播算法(back propagation,BP)训练的多层前馈网络是一种常见的人工神经网络模型,用于解决分类、回归和模式识别等问题。 它由输入层、隐藏层和输出层组成,每个层都由一系列神经元(或称为节点)组成。每个神经元都与前一层的所有神经元相连,并且每条连接都有一个表示连接强度的权重系数。

粒子群算法(particle swarm optimization,PSO)是一种元启发式优化算法,灵感来源于鸟群或鱼群等群体在搜索食物或栖息地时的行为。 它通过模拟粒子在解空间中的移动和信息共享来寻找最优解。 算法基本思想是将解空间看作是粒子的运动空间,每个粒子代表一个潜在解。 粒子在解空间中通过速度和位置进行搜索,通过与其他粒子的交互,不断调整自己的位置和速度,以找到更优的解。

虽然BP 神经网络和PSO 算法的核心规则不同,但两者的连接权值与粒子群维度一致,能够使用统一的计算公式计算权值。 如式(3)所示。

式(3)中,m、l、q分别代表输入层、输出层、隐藏层的节点数量;d为连接权值。 在迭代过程中,适应函数需要与BP网络中的均方差保持一致,它不仅可以用于计算适应度值,还可作为评价函数[3]。 适应度函数E为式(4)所示:

式(4)中,N表示样本总数,和分别表示样本数据在第k个输出节点的网络输出值和网络期望输出值。

2 基于机器学习的云检测算法

2.1 算法基本流程

在POLDER3 卫星载荷和DPC 卫星载荷两种算法基础上进行算法构建,利用卫星观测数据进行测算,具体构建思路如下:

(1)首先对卫星观测数据进行提取和处理,其次遵循偏振遥感的基本原理[式(1)和式(2)]进行数据截取,最后共提取出4 个矢量方向上14 组有效数据,再根据算法公式分别计算出90 nm、670 nm 和865 nm 通道的偏振反射率。

(2)首先以像元的经纬度为依据对卫星信息数据进行分类和匹配,识别和鉴别不同地表环境下的偏振遥感数据参数;其次建立典型数据模型,并基于其建立机器学习模型,初步完成识别和鉴别不同条件下气象云或气溶胶现象。

(3)首先对训练好的偏振遥感云检测模型进行测试,其次通过将卫星观测数据输入机器学习模型;最后通过比对实际数据和机器学习模型运算数据来检验算法的准确性,再根据结果进行调整与优化,直至调试至最佳状态。

2.2 多特征量数据集的选取

为提高算法构建效率,确保算法模型有效性,有必要就POLDER3 载荷和星载激光雷达(cloud⁃aerosol lidar with orthogonal polarization,CALIOP)载荷在云检测中的特性进行分析。 依据偏振遥感的算法规则,从以下几方面对算法特性进行描述[4]:

(1)反射率

不同波段代表了不同的地表条件,如443 nm 波段的反射率能够有效区别晴空和云的像元,两个不同的像元在这一波段有着最大的对比度,因此想要识别与鉴别两个像元,可选用该波段;而在670 nm 的波段中,云的反射率最高、地表的反射率最低,因此想要降低复杂地表对云检测结果的影响,可在该波段下进行遥感信息分析,也可将参数设定在670 nm 来寻找对比度较低图像中的亮云。

(2)偏振反射率

通过调整偏振反射率能够识别和鉴别图像中的不同构成,490 nm 的波段偏振反射核心对象是大气分子,670 nm 的波段偏振反射核心对象是云和晴空,而在865 nm 波段的偏振反射核心则是云,因此选择不同的偏振反射率可以使图像显示不同的要素,可根据实际数据分析需要来设置合适的偏振反射率参数。

(3)多角度观测

POLDER3 载荷搭载于卫星时,支持从多个角度对同一目标进行观测,通过多角度观测能够获得更具代表性和典型性的图像数据,因此POLDER3 载荷在识别云与地表信息上有着极高的灵敏度和特异度。

(4)波段组合

通过不同的波段组合能够定向获取遥感信息,比如云在670 nm 和865 nm 的波段有着较高的反射率,在近红外波段的670 nm 和可见光波段的865 nm 处,云的反射率非常接近,而无云的晴空在这两个波段的反射率则相对较低,因此可以通过波段组合的方式来更高效地识别云和晴空。

3 云检测模型的搭建与测试

根据特征变量的性质和数据规模,选择适合的机器学习算法模型,如支持向量机、人工神经网络等。 使用训练集对选定的模型进行训练和调优,以得到较好的云检测模型。 使用独立的测试数据集对训练好的模型进行测试和验证,评估云检测算法的准确性和效果,并进行调整和优化[5]。 将训练好的模型应用到实际,并根据实际情况进行优化调整,以进一步提高准确性和效率。

3.1 PSO⁃BP 神经网络云检测模型搭建

选择偏振遥感数据,通过将经算法处理的数据与实际数据进行比对,以检验算法的有效性。 本研究中所用数据集包共包含了22 270 个像元点,在数据规模上可保证数据分析结果的普遍性。

在云检测模型上综合PSO 和BP 两种检测规则,建立一个具有5 层神经网络、以sigmoid 函数为激活函数的具有启示性和自我优化能力的云检测模型,经过46 次迭代时系统提示达到了最佳适应度。 初始化BP 神经网络权值和阈值,然后遵循混合算法的一般运行逻辑进行反复训练,直至训练精度达到偏振遥感云检测的灵敏度需求[6]。

采用交叉验证法进一步优化网络模型和超参数,从预先准备的数据集包中随机选取15%的数据量进行模型测试,通过反复演算来检验最佳效果,检验新构建模型算法的有效性。 设定云检测概率阈值为60%,随机从数据集包中选取15%的数据再进行测试,结果显示测试的拟合率达到0.919,该结果说明了构建的PSO⁃BPNN 算法具有较高的鲁棒性、灵敏度,在理论上是一种较为优质的偏振遥感云检测模型。

基于机器学习的优化算法可以有效地提高偏振遥感云检测的准确性和效率,并且可以根据实际情况进行调整和优化,以适应不同的遥感数据和场景。 从而在遥感数据处理和应用中有更好的应用前景[7]。

3.2 基于POLDER3 数据的云检测结果

选取POLDER3 -L1B 在2007 年8 月1 日的数据,其中包含了常规地表环境以及高反射地表环境,将这些数据提交到构建的PSO⁃BPNN 云检测算法进行重复检测,将检测结果与已知数据进行比对,以此来检验PSO⁃BPNN 云检测算法的灵敏度和可靠性。

为了验证实验的有效性和科学性,进行了多种算法的试验结果对比验证,主要有POLDER 官方算法、中分辨率成像光谱仪(moderate resolution imaging spectroradiometer,MODIS)官方算法、BP 神经网络法以及经过PSO 优化的BP 神经网络法。 其中,POLDER 官方算法和MODIS 官方算法采用传统的阈值法进行云检测。 POLDER 算法是根据单个像元的反射率、偏振反射率、表观压强和方向等多个阈值进行云检测,而MODIS 官方算法则利用多通道反射率和亮温的阈值法进行云识别。

在本研究中,选择相同的地区和时间范围,对比POLDER3 官方云检测产品和MODIS 卫星的MOD06_L2云检测产品进行对比验证。 其中,MOD06_L2 数据的空间分辨率为1 km,高于POLDER3-L1B 的6 km,每个像元的尺寸约为POLDER3-L1B 的1/36。

为了便于观察和鉴别,遵循目视法的基本理念,对不同区域进行着色标记,官方确认的云像元、晴空分别标记为蓝色和黄色,而官方未确认的像元则标记为绿色。 通过目视观察发现在官方卫星的遥感图像中,未确定区域主要存在于云像元和晴空的交界处,主要原因是存在阈值模糊的问题,这提示卫星载荷算法无法有效识别偏振遥感阈值模糊的部分,导致这一结果的原因主要与云的反射率有关,当云层较厚时,云的反射率明显提高,而云的边缘区域厚度较低,因此反射情况并不理想,最终导致边缘模糊的问题。 出现这一现象,说明官方传统阈值算法可以有效筛选出云像元,但如果云本身厚度不足或处于高反射性的地表上时,传统阈值算法的不确定性增加,最终可能导致云像元识别错误的问题。 本研究构建的PSO⁃BPNN 云检测法能够避免这一问题,提高反射性云和地表的识别能力,因此能够识别出更多的云像元。

为了便于观测与统计,在测试时以MODIS 云检测结果中每36 个像元为一个比对窗口,如果一个比对窗口内云像元的数量占半数以上,则将该比对窗口标记为云,如果一个比对窗口内云像元数量占半数以下,则将该比对窗口标记为晴空。 使用新构建的算法对每一个比对窗口进行重新识别与检测,通过对比检测结果来评价PSO⁃BPNN云检测算法的灵敏度和准确度,结果显示在对比对窗口像元的评价上,新算法与MODIS 云检测保持着高度的一致性,符合率大于90%,而在具体的图像上,PSO⁃BPNN 云检测算法的结果对比度与分辨率更高,在云像边缘和薄云识别上仍保持着较高的灵敏度与准确度[8]。 因此,PSO⁃BPNN 云检测算法比当前广泛应用的偏振遥感云检测算法更加高效,在像元识别上与常规算法保持高度一致,在高反射区域的识别上却优于常规算法。

4 结语

传统偏振遥感经验阈值云检测测算规则在高反射云层和地表同时出现时存在识别模糊的问题,为了解决这一问题,本文提出了一种同时结合主动和被动遥感卫星载荷的机器学习云检测算法,利用BP 网络和PSO 算法的启示性和可训练特点,不断提高算法在偏振遥感云检测中的鲁棒性,最终建立了一种适用于多种地表上空云的检测模型。 测试结果表明,基于PSO⁃BPNN 的云检测算法有更高的精度和灵敏度,与官方数据保持高度一致性。

猜你喜欢
偏振反射率波段
影响Mini LED板油墨层反射率的因素
近岸水体异源遥感反射率产品的融合方法研究
具有颜色恒常性的光谱反射率重建
偏振纠缠双光子态的纠缠特性分析
基于LabVIEW的偏振调制激光测距测量控制系统
化学腐蚀硅表面结构反射率影响因素的研究*
偏振旋转效应在全光缓存器中的应用与实现
M87的多波段辐射过程及其能谱拟合
日常维护对L 波段雷达的重要性
基于SPOT影像的最佳波段组合选取研究