人工智能在海洋工程地质领域的应用

2023-01-03 10:54孙永福杜星宋玉鹏胡光海

海岸工程 2022年4期

孙永福，杜星，宋玉鹏，胡光海

（1.国家深海基地管理中心,山东青岛 266237；2.自然资源部第一海洋研究所,山东青岛 266061；3.青岛海洋科学与技术试点国家实验室海洋地质过程与环境功能实验室,山东青岛 266061）

海洋工程地质调查是海洋地质学领域研究的基础，可获取海底沉积物类型、土层结构、物理力学性质、沉积分布特征、地质灾害分布等一系列信息。海洋工程地质调查方法主要有地球物理调查、地质钻探、表层沉积物取样等。在处理海洋工程地质调查数据时，如何高效、精准地进行数据分析和解译，具有非常重要的科学研究意义和实际应用价值。

地球物理探测方面，传统的地球物理调查后处理主要依靠本领域专业技术人员和专业处理软件，对技术人员的工作经验要求较高[1-2]。地球物理探测数据结果具有多解性，因此不同人员解译的结果会存在一定差别。进行地层剖面划分、侧扫声呐地貌圈定等处理时，数据量通常较大且重复性较强。地质钻探方面，传统方法为通过钻探编录、土工试验绘制沉积物剖面图，再定性定量描述海底地层分布情况[3-4]。钻探资料存在较多文字性的描述，且不同单位、项目、人员进行处理时资料格式和标准不一致，导致后续汇总分析时难以进行统一处理。海洋地质灾害方面，传统研究方法主要为通过地球物理调查、沉积物取样，综合考虑各类地质影响因素并进行定性分析，或将物理过程简化为较理想的情况后数值建模计算力学关系[5-6]。定性描述和分析与实际情况容易存在偏差，简化后的数值建模也与真实情况存在一定区别。因此，海洋工程地质领域需要利用新技术和新方法来解决以上问题。

人工智能（Artificial Intelligence,AI）是通过数学的方法模拟生物神经元间信息传递的方法，即通过模拟自然界生物神经来解决现实问题。目前，人工智能算法已被成功地用于分类、回归、聚类或降维任务尤其是高维输入数据的问题中，在视觉处理[7-8]、图片识别[9]、网络搜索[10]、海洋科学[11]等多个方面都得到了广泛的应用。近年来，深度学习方法作为新兴的人工智能方法在许多科学领域的表现已超过了其他机器学习技术，如在化学、物理学、生物学、材料科学、地质学等许多科学领域[11-17]。

人工智能方法在海洋工程地质领域中的应用仍然刚刚起步，并且尚未针对其发展潜力和应用价值进行充分的探讨。人工智能算法在图像、时间序列、大数据方面处理具有天然的优势，因此它可以为传统的地质领域研究带来全新的解决问题的思路和方法。因此，归纳、总结、探讨人工智能算法在海洋工程地质领域的应用价值及前景非常重要。

1 人工智能概述

人工智能是通过机器和数学算法模仿人类智能的方法，能够对人的意识、思维以及信息传递的过程进行模拟[18]。人工智能是计算机科学的一个分支，它企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。机器学习（Machine Learning,ML）是人工智能的一个子集，它能够让机器自动地从大量的数据中通过学习得出规律，并利用该规律对未知的数据做出预测。而深度学习（Deep Learning,DL）则是机器学习的一个子集，它从生物大脑中获得灵感，并使用多层神经网络来解决机器学习任务，与普通机器学习算法相比所使用的网络层数更多、解决复杂问题的能力更强。人工智能、机器学习和深度学习三者的关系见图1。

图1 人工智能、机器学习和深度学习关系示意图Fig.1 Schematic showing an overview of AI,ML,and DL methods

1.1 神经网络

当前普遍使用的神经网络结构是由Rosenblatt[19]在1958年提出的，表现形式为多层或单层感知器。神经网络的核心思想是模拟人类神经元之间信息传递的过程：首先是接受各类信号，然后处理并将信号传递到相邻的神经元。当时由于神经元模型较为简单且结构单一，在一些逻辑函数的使用上效果不佳[20]，因此到1970年左右相关研究大幅减少。到了20世纪80年代，BP神经网络[21]和反向传播理论[22]的提出再次迎来了神经网络研究的热潮。BP神经网络模型是具有多个层次的模型，通常具有输入层、隐藏层和输出层，每层之间均通过全连接的方式进行信息传递[23]。如图2所示，数据首先从输入层开始传递，数据与不同权重相乘后传递到隐藏层，最后再传递到输出层。输出结果与实际结果相比较，将误差再反向传播可校准权重值，多次校准后可达到较为准确的状态。

图2 BP神经网络示意图Fig.2 Schematic diagram of BPneural network

1.2 机器学习

机器学习是人工智能的重要方法，可以让计算机从已有数据、资料中通过训练获取规律，并对结果进行预测，进而利用训练好的机器学习模型对未知数据进行预测[22]。机器学习大致分为有监督学习、无监督学习、半监督学习和强化学习。有监督学习利用已知结果的数据进行模型训练，再利用这些数据去预测新的数据，分为回归问题和分类问题两大类，常见的有监督机器学习算法有线性回归、决策树、随机森林、支持向量机等。无监督机器学习需要对没有已知结果的数据集进行分析处理和建模，用于处理没有明确对应关系的问题。常见的无监督机器学习算法有K-means、高斯混合模型、谱聚类等。半监督学习介于有监督和无监督之间，指的是训练数据中只有部分数据具有已知结果标签时的算法，用于解决部分问题中已标记数据不足的问题。强化学习是一种学习如何从状态映射到行为以使得获取的奖励最大的学习机制，模型需要不断在环境中进行实验，通过环境给予的反馈（奖励）来不断优化状态-行为的对应关系，因此，反复实验(trial and error）和延迟奖励（delayed reward）是强化学习最重要的2个特征。

1.3 深度学习

深度学习泛指由多个人工神经网络层组成的算法，与传统的神经网络算法相比，深度学习网络算法具有更多、更深的网络层（部分网络大于100层），因此它可以解决更加复杂的非线性问题。深度学习的主要算法为卷积神经网络（Convolutional Neural Networks，CNN）和循环神经网络（Recurrent Neural Networks，RNN）。CNN主要应用于图像、视频的处理问题，将图像像素点数据进行卷积处理与全连接算法相比，可以极大地降低运算量。像AlexNet[24]、LeNet-5[25]、GoogleNet[26]等经典卷积神经网络模型在多学科、多领域的研究中的预测准确度很高。RNN主要应用于时间序列问题的分析和处理（图3），可在不同时间节点上输出需要的结果。当研究问题（例如气象、波浪、沉积物孔隙水压力变化等）的结果随着时间变化而变化时，不仅需要考虑当前影响参数的作用，还需考虑不同时间点影响参数的作用，因此RNN应运而生。RNN主要应用于自然语言处理（Natural Language Processing, NLP）、机器翻译、语音识别、智能推送等方面。

图3 循环神经网络（RNN）示意图Fig.3 Schematic diagram of Recurrent Neural Network (RNN)

2 海洋工程地质应用概述

尽管人工智能方法在解决地质类的非线性问题上有着独特优势，但目前其在海洋工程地质领域的应用仍处于起步阶段。学者们的主要研究方向为探索人工智能算法在海洋工程地质领域上的应用适宜性[16-17,27-28]，即能否用人工智能算法解决工程地质问题和不同问题的讨论尚未形成统一的研究体系。本节将对一些人工智能方法在海洋地质勘察研究中的应用实例进行概述。

2.1 海洋地球物理调查

地球物理调查的主要工作原理为通过向目标物体发射不同频率的声波并接受反射信号，进而来获得所需要的信息。水深测量（使用单波束、多波束测深系统）、海底地形地貌测量（使用侧扫声呐）、地层剖面测量（使用地层剖面仪）等均采用了同样的物理原理，主要区别为发射源的能量和频率不同、所要接收的信息不同。其中，海底地形地貌测量和地层剖面测量的后处理需要依靠专业人员的经验对逐图对声呐图像进行识别，重复性高且工作量大。使用深度学习方法可以基于已有数据训练得到能够识别声呐信息的人工智能网络，实现探测图像自动化后处理。

2.1.1 侧扫声呐调查

侧扫声呐主要应用场景为从船后向周围发射声波，声波按照球面波的方式向外传播，碰到海底或海底构筑物时产生散射，反向散射波被换能器接收后转换为一系列电脉冲。当声呐载体不断前进、发射和接收后，可以逐行显示每次发射的回波数据，不同底质类型和海洋构筑物的回波数据均不相同。回波数据经过专业侧扫声呐软件后处理，可获得海底地形地貌的反射图像。专业技术人员依靠经验可从反射图像上确定海底构筑物的类别（管道、电缆、沉船等）以及海底地形地貌。为了能方便、高效地识别侧扫声呐图像包含的信息，减少人为经验区别导致的误差和重复性图像后处理的工作量，可以利用深度学习的卷积神经网络（CNN）来实现。CNN可以通过卷积处理图片上像素点数据，提取所蕴含的有效信息，识别不同图片所包含的海洋工程地质信息。

使用侧扫声呐图像训练CNN网络时，可以使用通用的成熟网络框架来进行训练。Chandrashekar等[2]使用VGG-19、ResNet50等多种预训练模型基于侧扫声呐图像对海底沉积物类型和海底地貌形态进行了识别研究，可以识别出海底矿物、岩石、黏土和淤泥等沉积物。训练完成后的网络模型可以将其封装为可直接使用的程序[29]，方便后续进行侧扫声呐图片的识别。

除直接使用现有CNN模型进行研究外，还可以针对特定的问题对现有模型加以改进和升级。例如将图像分割算法与CNN模型结合来进行大范围多物体的自动识别，也可以将传统CNN模型的内部网络结构进行重构以适应特定研究问题。Song等[30]将深度学习算法与图像分割进行结合，并成功运用于侧扫声呐图像识别技术（图4），图像被分割后能够增加识别的效率。Zhu等[31]将灰度共现矩阵（Gray-level Co-occurrence Matrix，GLCM）和无监督极端学习机（Unsupervised Extreme Learning Machine，US-ELM）结合在一起，用于侧扫声呐图像分割和识别。

图4 基于CNN的侧扫声呐图像处理框架Fig.4 Framework for processing side-scan sonar images based on CNN

侧扫声呐的图像处理和物体识别问题非常适合使用CNN来解决，但目前对其的应用仍处于起步阶段。现阶段研究主要有2个方向：一是直接利用现有CNN模型识别不同研究区的侧扫声呐图像；二是将经典CNN模型与其和各类图像处理算法结合，再进行侧扫声呐图像识别。然而，2种研究方向均未提出创新的网络结构，其模型的根本框架仍然为经典CNN网络模型。经典CNN网络模型多以生活中的动物、植物、人类、交通工具等为对象进行训练和建立的，而生活中图片所蕴含的信息及图片特点明显与海底侧扫声呐图像不同。今后研究人员应该以侧扫声呐图像特点为基础，开发出专门适用于解决侧扫声呐图像识别问题的新型架构CNN网络。

2.1.2 地层剖面探测

海底地层剖面探测主要应用场景为根据所需探测的地层深度不同，发射不同频率和能量的声信号，反射后结合地质钻探资料划分研究区地层层序。传统的地层剖面解译方法需要专业技术人员参考测量区域的地质钻孔分层情况，在后处理软件中人工划分地层层序。传统处理方法对人员经验依赖性较强，不同人员划分的地层层序不尽相同。同时，技术人员在划分地层层序时需要手动划分层序位置，工作量较大且效率不高。使用CNN可以通过已有地层剖面资料的训练来实现自动划分地层层序，对人员经验依赖性弱且能够大幅增加划分地层层序的效率。Huang等[32]在2020年利用CNN对地震反射数据进行了训练和预测，展现了CNN应用于地层剖面研究的可行性。Zhang等[33]在2021年将三维反射地震和机器学习进行结合，使用反射地震学的序列整合，确定了Bushveld地区西部综合体中被称为坑洞的凹陷结构，并建立了经验关系模型，研究认为机器学习数据分析是传统地质统计分析的可行替代方法。

由此可见，人工智能方法可较好地应用于地球物理调查研究，在数据解译和图像处理方面实现智能化、自动化、流程化的作用。同时，目前人工智能方法在陆地上地球物理调查研究中应用案例较多[34−37]，而在海洋上的应用相对较少。海洋调查研究中的数据获取成本高且难度大，相比之下数据量也少。以后的研究中应更加注重海洋数据库的建设，形成统一的海洋地球物理测试流程和标准，并将各类海洋地球物理调查资料系统归纳、整理并建设海洋地球物理资料数据库。

2.2 工程地质取样

工程地质取样可以获得土层结构、沉积物物理力学性质、地层分布情况等特征信息，主要以钻机钻探取样、重力取样等方式将沉积物以柱状形式取出，再进行各类物理力学性质测试或地质年代测定等一系列工作，从而帮助工程技术人员了解最真实的地质地层状况。目前，人工智能已被应用于地质钻探的钻孔数据信息处理、工程地质建模、岩土体性质分析等方面。

2.2.1 岩性、参数预测

迄今为止，钻孔信息处理的研究在油气开发领域中应用较多，如钻孔安全性检测、沉积物岩性预测等方面。在钻孔安全性检测分析方面，Lin等[38]基于机器学习的元模型技术对垂直钻孔的水平应力进行了预测。Dias等[39]使用单一的基于快速区域的卷积神经网络自动检测井眼声学图像记录中的裂缝和断裂，可以显著提高声学钻孔图像记录中地质构造的自动检测精度。

沉积物岩性预测方面，其原理是建立CNN模型并使用钻孔的图像信息与机器学习方法相结合，对沉积物岩性进行预测[40-41]。然而图像预测也存在一些不确定性，为了提高准确率，Bom等[42]基于深度学习和贝叶斯方法，对图像测井中渗透率和孔隙度进行预测，使用得到的概率密度函数对岩层储层进行了分析。

钻孔信息涉及到沉积物岩性识别、地层划分、安全性检测等方面，较为适合使用深度学习方法进行研究。今后研究的重点应放在钻孔资料数据库的标准化建设上，增加钻孔资料数据量并制定统一的资料处理标准有助于深度学习模型的准确率提高。

2.2.2 信息提取及建模

钻孔数据的特点是数据多以文字描述的形式储存，如沉积物类型、物理力学性质等，这使得后续数据处理和分析比直接处理数字更繁琐且精确度低。针对这一问题，可以将深度学习的自然语言处理（Natural Language Processing, NLP）技术用于钻孔描述性资料分析[43]。NLP技术是用于处理自然语言的技术，可以从文本数据中提取信息。将其应用在钻孔资料处理时，可自动识别钻孔数据的文字性描述资料并提取相关信息，能够减小钻孔资料处理难度。

地质建模方面，Kim等[44]基于多层感知机(MLP,Multilayer Perceptron)网络对钻孔和DEM数据进行了分类，建立了voxel模型并提取了地理信息特征，最后绘制了首尔的三维岩土层图。另外，针对钻井工程的井筒塌孔问题，Jin等[45]提出了一种基于SURF和2D-DWT的定量描述孔洞形态的新方法，建立了一个基于机器学习的孔洞解释工作流程，该方法被应用于新疆某油田，准确率为90.9%。

由此可见，人工智能方法在地质钻探领域具有广泛的应用价值，一方面是利用深度学习的图像处理方法，可从钻孔图像中获取各类地质参数并进行地层自动划分，另一方面可以进行描述性资料识别和处理。另外，还可以使用人工智能方法对钻井过程中的风险和灾害进行实时监控和预测。

2.3 地质灾害评价

地质灾害评价能够对研究区遭受地质灾害的危险性或工程建设的难易程度进行评价和估量。评价需同时考虑地质、水文、气象、工程等影响因素，并结合现场调查情况进行综合分析。地质灾害的一大特点为各影响因素之间具有非线性相关性，如地震、水深、海底沉积物类型等对海底滑坡会产生影响，影响因素与灾害危险性之间存在相关但难以量化的关系。人工智能算法由于其善于处理非线性问题的特点，较为适宜解决地质灾害评价的问题，近年来随着机器学习和深度学习的发展，在砂土液化、地震监测、滑坡评价等多个地质灾害领域都进行了应用。砂土液化方面，可以使用地震震级、沉积物类型、CPT锥端阻力、侧壁摩擦力等数据作为输入参数，建立机器学习模型进行训练，对地震液化是否发生进行预测评价[46]。地震监测方面，Mousavi等[47]提出了1个用于同时进行地震检测和相位选取的全局深度学习模型，该模型被应用于2000年日本鸟取地震期间记录的5周连续数据时，挑选P相和S相的精度接近分析员人工挑选的精度。在滑坡预测评价方面，Qi等[48]基于亚马逊公司提出的AutoGluon机器学习框架，使用了其中的11个机器学习模型对九寨沟的山体滑坡危险性进行了预测评价。与之前的研究相比，AutoGluon框架可以实现机器学习模型的自动计算和选择，大大提高了计算效率与准确度。Ji等[49]基于高分辨率卫星图像使用卷积神经网络的分析方法，能够实现根据卫星图像自动准确识别滑坡。以上述地震检测和滑坡危险性预测研究为基础，可以将对应的研究方法应用于海底地震检测和海底滑坡危险性预测评价的研究。

由此可见，人工智能方法适用于解决传统地质分析方法难以解决的非线性地质灾害评价问题。无论是基于卫星遥感图像的灾害识别，还是基于多参数的灾害综合分析，都已取得了一定成果。尽管目前人工智能应用在陆地地质灾害的研究比海洋地质灾害丰富，但二者研究的主体均为地质环境与人类活动的相互作用关系，其研究方法和成果可以相互借鉴。今后应在人工智能-陆地地质灾害研究的基础上，进一步将人工智能方法应用到海洋地质灾害领域中。

3 限制和挑战

尽管人工智能方法在地质领域已经取得了很多成功应用，但是受算法本身和地质问题特点的影响，仍然存在一定的限制和挑战。本节将对目前人工智能方法在地质领域应用时存在的主要限制和挑战进行阐述。

3.1 海洋地质调查数据库

目前制约人工智能在海洋地质调查领域发展的主要原因是数据量不足且没有数据格式统一的数据库。尽管众多学者都运用了自己勘察或收集到的资料进行了机器学习模型训练，并表示取得了较好的效果，但均在文章中表达了数据量对模型准确率的重要性。为了获得更精确的人工智能地质模型，建立格式统一、数据量大的海洋地质调查数据库必不可少。

人工智能建模是由巨大的数据量驱动的，数据量的丰富程度决定了训练模型的适用程度。因此，数据量少、范围分布小的数据训练出的模型即使准确率很高，也只是代表了在有限数据量上的准确率，并不具有普遍适用性。海洋地质调查数据的数量和分布范围直接决定了人工智能模型最终的有效性。然而，无论是与相对容易获得大量数据的互联网行业、交通运输行业、金融行业相比，还是与陆地地质勘察行业相比，海洋地质调查获得数据的难度大、费用高、数据完整和连贯度低。不同年代、不同单位、不同项目要求条件下的海洋地质调查数据均存在较严重的不统一性。因此，将现有调查数据进行整合，建立数据格式统一的海洋地质调查数据库，是非常必要的。

3.2 模型算法的选择

人工智能算法数量众多，除了各类经典算法外（如决策树、支持向量机、K-means等），新的算法也在不断涌现和发展。如何针对明确的海洋地质调查目的选择合适的人工智能模型非常重要。针对各类机器学习模型的选择，Pedregosa等[50]使用多种机器学习模型进行了不同数据量、不同研究问题的试验，通过归纳总结提出了一个机器学习模型选择推荐图（图5）。使用该推荐图可以帮助研究人员在数据量不同、使用场景不同时参考。目前，虽然人工智能算法在海洋调查领域的应用越来越多，但对于各类研究问题的算法选择仍然没有达成统一，不利于开展海洋地质调查研究。因此，不同海洋调查研究问题上的机器学习模型选择应该进行规范化和统一化，针对不同问题给出统一的推荐机器学习模型，方便研究人员高效工作。另外，除了使用成熟的人工智能模型库进行计算外，学者们应结合海洋工程地质领域问题的特点，在现有机器学习模型基础上进一步开发和探究适合解决专属问题的新模型。

图5 传统机器学习模型选择推荐Fig.5 Traditional machine learning model selection recommendations

3.3 人工智能算法的可解释性

对于各类人工智能算法来说，当前的困难是模型运算的可解释性，即各类人工智能的模型是如何通过数据训练准确预测结果。以基础的BP神经网络为例，其中间构成的隐藏层被学者们称为“黑箱”，数据从输入层进入后，经过隐藏层的一系列处理最后到达输出层。虽然在不同问题上均产生了较好的结果，但是其训练的物理过程仍然难以解释。尽管目前学者们已尝试对模型的中间过程进行展示[47,49]，并取得了一定的成果，但难以解释神经网络内部工作过程这一问题的存在，这也导致了部分学者对其计算结果的不信任。

神经网络的结构来源是对人类神经之间信息传递的生物学模拟，用较为简单的数学表达式来模拟复杂的生物过程。但神经传递和人脑工作的原理至今尚未明确，因此模拟其工作原理的神经网络也难以被解释。

4 结论与展望

本文介绍了人工智能方法的基本概念和相互之间的关系，并总结了人工智能在海洋工程地质领域的应用最新进展，以及存在的问题和限制。对当前人工智能在海洋工程地质领域应用现状进行了归纳分析，主要研究结果表明，人工智能算法可以较好地应用于海洋工程地质调查领域，有着较高的科学研究和工程应用价值。目前，人工智能在海洋地质调查领域的应用仍处于起步阶段，限制因素主要是数据量、数据质量、模型选择等，有待于更加全面、系统地进行研究和应用。随着海洋地质调查数据量的增加、数据库的建设和人工智能算法的不断发展，人工智能算法将更好地解决海洋地质调查的各类问题。

地质类学科的许多问题具有经验性和多解性的特点：各类地质灾害评价、物探资料解译等方面的研究往往无法建立确定的数学关系，需要凭借研究人员的经验和专业知识将没有明确数学关系的物理量结合起来进行分析以得出结论。同时，由于海底沉积物、松散岩土体的各向异性、不均匀性等特点，目前尚无法用严格的数学公式精确表达海底沉积物的完整物理力学过程。工程地质领域在描述海底沉积物物理力学过程时均有着不同程度的近似以及经验公式表达，致使地质学现象的数值表达与实际情况存在一定客观差异。人工智能以其独特的算法特点，特别适合解决非线性和经验性的问题，因此在地质领域的研究问题上非常适用。随着海洋工程地质数据的增加、工程地质调查设备的升级、人工智能算法的不断创新，应将人工智能方法更多地应用在海洋工程地质领域。

人工智能算法与传统的技术手段有着本质上的不同，需理性地看待这种方法。既不能机械地将数据进行计算后得到较高准确率后就认为非常适用，也不能盲目地进行排斥，难以接受颠覆传统思维的新方法。现阶段人工智能无论是自身的技术和算法，还是在海洋地质调查领域的应用都处于初级阶段，未来仍有很长的路要走。科学的做法是将传统技术方法和人工智能方法二者相结合，互相取长补短。