基于残差网络的泥石流孕灾沟谷快速识别

2022-08-20 09:21徐繁树王保云

现代计算机 2022年12期

徐繁树，王保云

（1.云南师范大学信息学院，昆明 650500；2.云南师范大学数学学院，昆明 650500；3.云南省高校复杂系统建模及应用重点实验室，昆明 650500）

0 引言

我国是受泥石流威胁人口最多的国家之一，泥石流对人民的财产安全和社会经济发展带来严重威胁，因此对泥石流灾害区域进行快速识别十分重要。

目前，对泥石流沟谷的识别方法大致有以下四类：第一种是通过实地考察，对沟谷的地形、地貌、冲积扇特征、植被情况等进行调查识别，此类方法准确率高，但需要投入较大的人力和时间成本。第二种主要基于遥感技术，通过构建沟谷的目视解译特征进行泥石流的识别。第三类使用统计学的方法，对泥石流流域面积、相对高差、松散物源面积等进行建模，通过计算出的危险因子大小，判别沟谷的危险程度。第二、第三类方法存在的问题在于构建特征或对危险因子进行选取时，主要依赖研究者的主观判断，需要一定的专业知识，且模型结果受参数选取的影响较大。最后一类方法是基于机器学习的方法，该类方法往往需要大量数据作为支持。

为了解决实地考察费时费力，以及基于遥感或统计方法中，人的主观判断对模型的影响，本文结合数字高程模型（DEM）图与深度残差网络，以怒江地区为例，对该地区的泥石流沟谷进行了识别。

1 实验数据

1.1 研究区域概述

怒江傈僳族自治州（下简称怒江州）位于云南西北部，有怒江、澜沧江、独龙江三条河流自北向南流经。其中怒江流域沟壑纵横、地形复杂、高差大，是泥石流灾害的高发地区。怒江流域属于亚热带山地湿润季风气候，降水丰富，极易诱发泥石流；此外，怒江流域两侧沟谷落差大、形态狭窄，均是形成泥石流的有利条件。研究区域如图1所示。

图1 研究区域位置图

1.2 数据

通过DEM获取地表形态特征，比人工实地考察更加快速便捷，且许多泥石流相关的参数都可以通过对DEM计算后得到，如流域纵比降、土石量、冲淤面积等，我们希望这些泥石流相关特征能被残差网络所捕获，从而完成对泥石流孕灾沟谷的快速识别。

为了适应模型的训练要求，需要先区分出发生过泥石流灾害和未发生过灾害的沟谷，数据筛选方式如下：对于发生过灾害的沟谷，我们查阅了《云南减灾年鉴》，并结合相关新闻报道，将泥石流的发生地精确到村，在怒江流域共筛选出50条确认发生过泥石流的沟谷。对于无泥石流记录的沟谷，我们通过卫星地图筛选出沟谷旁有村庄或农田，但是没有泥石流记录的沟谷作为负样本，通过这种方法选取出了50条无泥石流灾害记录的沟谷作为负样本。这种负样本的构造方式与过去直接将无泥石流记录的沟谷视为负样本的数据构建方式不同，因为只有造成了人员伤亡或经济损失的泥石流才会被作为灾害被记录，而对于没有人烟的沟谷，其是否发生过泥石流实际上是难以确定的。

在确定了要提取的沟谷后，我们使用Arc-GIS软件，从DEM图中提取出这些沟谷。本实验所用的DEM图来自USGS的公开数据集，分辨率为30米。

2 实验方法

2.1 实验数据的划分与预处理

泥石流是多种因素共同作用的结果，与当地的土壤、岩体、植被覆盖率，及沟谷的长度，汇流面积，坡度等几何形态等均有关联。本文所研究的区域为怒江流域，在这一区域内，可以近似认为该区域的土壤、岩体、植被等条件是近似的，各条沟谷的主要差异在于主沟长度，坡度，汇流面积等几何特征，可以作为识别孕灾沟谷的决定性条件。这些特征均可通过DEM图的大小和灰度等属性描述。

首先，我们根据是否发生过泥石流，将100张DEM图划分为2大类——发生和未发生；又根据流域大小和主沟长度，将每大类再划分为3小类，具体划分方式见表1。

表1 数据的分类方式

各类样本DEM示例图片如图2所示。

图2 样本示例

由于原始样本量较少，为了适应残差网络训练要求，以达到较好的训练效果，需要通过图像增强的方式扩充数据集。因为几何结构特征是本研究中的关键因素，故所选取的图像增强方法不能破坏原DEM图所表现的沟谷的形状特点，因此并非所有扩充方式均适用于本实验所用的DEM图像。最终采用的变换方式为：随机旋转变换（90°，180°，270°）、水平翻转、垂直翻转，伽马校正。

2.2 实验模型与流程

残差网络（Resnet）于2015年被提出，其独特的残差结构解决了普通深度神经网络随深度增加而导致的梯度爆炸或消失的问题，使得层数较高的网络也能取得较好的性能，在各种图像分类任务上表现优异。

残差模块的结构如图3所示。

图3 残差模块示意图

考虑到所使用的DEM图的大小与公开数据集不同，为了减小图像缩放对输入数据造成的损失，故在进入网络前将图像缩放大小设定为512×512，将最后的全连接层替换为两个线性映射以适应修改后的图像输入大小，具体网络结构见图4。

图4 调整后的Resnet18示意图

对该模型进行训练和测试的过程为：每次实验从100张图片中随机选取33张，并且保证每类图片至少有5张作为测试集，不作增强，另外67张图片作为训练图片，采用图像增强的方式扩充到402张作为训练集，训练/测试集构建方式与实验流程如图5所示。

图5 实验流程图

3 实验结果与分析

3.1 训练环境与超参数设置

模型的训练与测试均在Pytorch框架下完成。硬件环境：Intel Xeon Gold-6271@2.60GHz CPU，NVIDIA Tesla P100 GPU；软件环境：Ubuntu 18.04操作系统，Python 3.6，CUDA 9.0，Pytorch 0.4.1，以及图像相关的第三方库。

模型训练时使用GPU加速，具体训练设置如下：最大训练数设置为100个epoch，batch size设置为8，学习率设置为0.002，优化方法为随机梯度下降法（SGD），损失函数为交叉熵损失（Cross Entropy Loss），每轮训练后使用测试集进行测试，保存最好的测试结果。

3.2 训练结果

本文共进行了30组平行实验，各组实验结果较为相近，我们选取其中一组实验结果，绘制了以下图像。

训练迭代100次，训练过程中模型的损失值随迭代次数变换的曲线如图6所示。

图6 损失值变化曲线

训练准确率、测试准确率如图7所示。

图7 正确率变化曲线

从图6可以看出，损失函数波动较大，但最终能达到收敛；结合图7，在训练集上的准确率最后收敛到100%，在测试集上的准确率与在训练集上的准确率变化趋势基本一致，并在过拟合前取得最好的测试准确率。

3.3 性能评估

根据神经网络在测试集上的测试结果，通过以下四个指标衡量模型的性能：召回率、准确率、受试者操作特性曲线（ROC）以及。

首先给出所有实验结果汇总后得到的混淆矩阵，再给出各项性能指标，六分类得到的混淆矩阵如表2所示。

根据表2给出的混淆矩阵，可以得到各性能指标的值，具体见表3。

表2 混淆矩阵

表3 召回率和准确率

观察混淆矩阵可以发现，分类错误的图片往往被误分到流域大小近似的类别中，如对于大流域且发生了泥石流的图片，有114张被正确预测，预测错误的36张中，32张被分类为大流域但未发生泥石流，这一方面说明模型的确具有区分沟谷是否发生泥石流的能力，另一方面也说明流域面积大小对模型的分类结果有着较大的影响。

通过计算召回率和准确率，发现模型对大流域沟谷是否发生泥石流的识别效果较好，其准确率和召回率均能达到70%以上，且随着流域面积变小，模型的效果变差，这说明高差、坡度、形态等几何特征在大流域沟谷是否发生泥石流上有着较为显著的特征，差异比较明显，而随着流域面积变小，几何特征相似度变高，因此，仅通过DEM图较难区分其是否发生过泥石流。

为了进一步验证模型的可靠性，将图片分类为发生泥石流和未发生泥石流两类，根据实验结果可绘制出ROC曲线（见图8），计算得的值为0.70，说明模型具有一定的准确性。

图8 ROC曲线图

4 结语

本文以怒江州为研究区域，以单沟流域为识别单元，针对沟谷的长度、高差、坡度及汇流面积等几何形态特征对泥石流灾害进行了识别，通过召回率、准确率等指标对模型的准确性和稳定性进行验证。结果表明，通过DEM图结合残差网络的方法可以快速识别出沟谷是否发生过泥石流，且对于流域面积较大的沟谷具有较好的识别准确率，简单易行且节省了人力物力。在后续工作中，应进一步扩充所使用的图像，添加多光谱影像作为新数据，进一步提高模型的准确率。