基于改进LSTM神经网络的测井曲线重构方法

2022-06-29 12:33尚福华卢玉莹曹茂俊
计算机技术与发展 2022年6期
关键词:测井重构神经网络

尚福华,卢玉莹,曹茂俊

(东北石油大学 计算机与信息技术学院,黑龙江 大庆 163318)

0 引 言

测井曲线作为连接地震与地质的桥梁和纽带,在测井资料解释和反演过程中发挥着至关重要的作用,但是在实际测井过程中时常会因为仪器测量或者井眼原因等造成部分测井曲线失真或缺失,然而重新测井不仅成本较高,且对已经完井的井眼难以实现。为解决该问题,廖茂辉等人[1]提出基于多元回归分析的测井曲线重构方法,然而由于地质情况的复杂性很难用确定的函数表达[2],故该方法通常精度较低;蔡大伟等人[3]提出了一种基于视觉原理的曲线重构方法;Salehi等人[4]利用多层感知机预测了密度测井和电测井曲线,可接受的精度和使用常规测井数据是其所提出的智能模型的突出优点;金永吉等人[5]针对测井曲线重构问题,提出利用遗传算法对传统神经网络的拓扑结构、权重和阈值进行优化,有效克服传统神经网络的冗余结构和局部最小化趋势等缺点;王俊等人[6]提出了利用门控循环神经网络重构声波时差测井曲线的方法,预测准确度较高,但重构的测井曲线与真实曲线之间亦存在一定的偏差;张东晓等人[7]构建了串级长短期记忆神经网络用于重构测井曲线,该方法生成的曲线兼顾了测井信息随深度的变化趋势和前后关联。但是,目前表现较为优异的测井曲线重构模型大多基于数据驱动,深度学习神经网络模型与工程实践的结合过于直接,很少参考具体的领域知识,事实上通过引入领域知识可以打破深度学习模型效果提升的瓶颈[8]。因此可参考测井领域知识提高测井曲线重构准确度。

长短期记忆神经网络(LSTM)[9]通过三种“门”结构进行信息的传递,在循环神经网络[10]的基础上通过增加细胞状态实现了长期状态信息的记录,对于具有长期依赖关系的样本数据具有较好的分类效果。因此,提出基于改进LSTM神经网络的测井曲线重构方法,在善于处理序列数据的LSTM网络中引入测井领域知识和注意力机制构建DK-LSTM测井曲线重构模型。以大庆油田某工区水平井数据为例,根据已知水平井的测井曲线通过使用DK-LSTM测井曲线重构模型预测缺失的测井数据。

1 原理与方法

1.1 相关性分析

相关性分析指的是对测井曲线之间的相互依存关系进行分析,从而找出其内在关系。测井曲线数据之间不仅存在线性相关性,而且存在很大的非线性关系,基于大庆油田某工区三口水平井(分别为A、B和C井)的真实测井数据,假设声波时差测井曲线(HAC)存在缺失,采用统计学Pearson相关系数进行测井数据之间的相关性分析。从图1相关性分析结果不难看出,中子(CNL)、密度(DEN)、井径(CAL)和电阻率(RT)与声波时差(HAC)测井曲线之间的相关系数较高,其中井径测井曲线与声波时差测井曲线间存在最强的依赖关系,其他曲线与之则存在相对较弱的线性关系和非线性关系。

图1 HAC与其他测井曲线之间的相关性

1.2 长短期记忆网络

长短期记忆网络(LSTM)是一种具有更为复杂和强大的渐变处理能力的循环神经网络(RNN),在LSTM网络中记忆单元c可以在某个时刻捕捉到某个关键信息,并可以将此关键信息保存一定的时间间隔[11],其保存信息的生命周期要长于短期记忆h,但又远远短于长期记忆,因此称为长短期记忆,其可以有效地解决RNN的长程依赖问题[8]。

长短期记忆神经网络的内部单元结构如图2所示,其在简单循环神经网络的基础上主要有两方面的改进:其一,LSTM网络引入门控机制来控制信息传递的路径,三个门动态控制内部状态应该遗忘多少历史信息、输入多少新信息以及输出多少信息,整个网络可以建立较长距离的时序依赖关系;其二,LSTM神经网络通过引入一个新的内部状态ct传递循环信息,并输出给外部状态ht,并记录到当前时刻为止的历史信息。主要通过下述公式进行计算:

(1)

ht=ot⊙tanh(ct)

(2)

图2 LSTM网络的循环单元结构

由于测井曲线的采样间隔大多为0.125 m,并且测井数据中存在前后相关性,LSTM神经网络可沿深度分别从前向和后向提取测井序列特征数据,充分利用前后序列中的依赖信息对声波时差测井曲线进行预测。因此,LSTM是生成人工测井数据的理想模型架构。

1.3 测井领域知识

领域知识(DK)是指某一个特定领域内的集合,该集合具体包括这一领域的相关概念、概念之间的某种关系以及对部分概念的约束[12]。测井领域知识涉及到的知识内容复杂,具有多种类型。可划分为事实型知识、过程型知识、实例型知识和元知识[13]:

(1)事实型知识是指测井资料中的参数、模板和图版等基础信息;

(2)过程型知识是指在测井过程中的业务逻辑以及领域规则等;

(3)实例型知识是指概念的个体实例,例如某口井的数据;

(4)元知识是对上述几种类型进行描述的知识。

结合专家经验,针对测井曲线重构模型引入事实型知识。利用地层岩性特征指数(GS)作为过滤离散数据的优化策略,从而筛选得到高质量的训练样本并作为重构测井曲线的依据;在标准长短期记忆神经网络模型中构建一个全连接模拟层添加测井领域知识约束,通过引入统计学Pearson函数分析中影响因子较大的测井领域知识对测井曲线重构模型添加先验约束。据此,充分考虑到测井领域的先验知识构建测井曲线重构模型以期提升模型的预测精度。

1.4 注意力机制

注意力机制通过构造一个简单的注意力神经网络,该网络负责接收与注意力有关的输入向量,从而达到对特征自适应关注的目的,进一步提高深度学习模型的特征提取能力[11]。注意力机制的神经网络结构如图3所示。

图3 简单的注意力机制网络结构

其中,H为特征矩阵[h1,h2,…,hn],A是表示注意力机制所使用的输入向量[a1,a2,…,am,…,an],en∈Rn,α是输入特征矩阵H的注意力权重向量,r是表示特征矩阵H的加权和,是网络最后的输出特征[14]。下述公式是描述注意力机制神经网络的函数:

(3)

α=softmax(WTM)

(4)

r=HαT

(5)

依据声波时差测井曲线与井径之间的强相关关系,在测井曲线重构模型中添加一个简单的注意力机制神经网络,通过该机制实现对特征的自适应关注,从而进一步对数据中存在的长期依赖关系建模,从而提高模型的特征提取能力。

2 基于DK-LSTM网络的重构模型

2.1 数据标准化

为减小输入测井曲线值异常造成的实验误差,采用z-score标准化方法对输入数据进行归一化处理,以保证测井曲线数据处于合适的范围,有利于提高地层划分准确度[6],即按照下述公式进行标准化:

(6)

2.2 DK-LSTM测井曲线重构模型

DK-LSTM测井曲线重构模型主要包括DK-LSTM神经网络和注意力机制两部分,其中,DK-LSTM神经网络是对长短期记忆神经网络的改进,在网络输入层同时考虑测井曲线和地层岩性特征指数,并构建一个全连接模拟层用于引入测井领域知识中的先验信息;此外,注意力机制作用于DK-LSTM神经网络的输出层,对HAC测井曲线数据中的长期依赖关系进行建模。

该模型包含一种改进的长短期记忆神经网络DK-LSTM,其网络结构如图4所示,与标准的长短期记忆神经网络的不同主要在于,通过改变网络结构引入领域知识约束层,将测井领域先验信息添加到重构模型中,约束层在本质上是对数据进行先压缩再扩展,即做非线性变换。与此同时,结合相关性分析结果将部分特征再次输入模型,以期提高模型的预测准确度。需要明确的是,其中知识约束层的神经元仅在结构上仿照测井曲线数据,并不参与模型的拟合与训练。

图4 DK-LSTM神经网络结构

另外,基于声波时差测井曲线对井径的强依赖关系,DK-LSTM测井曲线重构模型在DK-LSTM神经网络的末端添加一个简单的注意力机制神经网络。注意力机制作用在DK-LSTM单元的输出层,用来模拟数据间的长期依赖关系,依据声波时差测井曲线缺失的问题使用井径测井曲线(CAL)构造输入向量A,由注意力机制神经网络可以即可得到特征向量H的注意力权重,并计算其权重加权和,相关原理如1.4节所述。DK-LSTM测井曲线重构模型算法流程如图5所示。

图5 DK-LSTM测井曲线重构模型算法流程

Step1:输入测井曲线相关的序列数据,包括CAL、RT、DEN测井曲线和地层岩性特征指数(GS),采用z-score方法对数据进行标准化,并划分数据集和测试集,对应图5中的Input layer层。

Step2:将每个输入传入图4的DK-LSTM神经网络,训练后得到特征向量H=[h1,h2,…,hn],对应图5中的LSTM layer层。

Step3:在DK-LSTM神经网络的输出单元以端对端的形式添加注意力机制,根据任务构造井径测井曲线向量A,利用公式(3)和(4)计算特征向量H的注意力权重值α=[α1,α2,…,αn],通过所得的注意力权重α利用公式(5)对所有特征向量H进行加权求和得到r,对应图5中的Attention layer层。

Step4:预测输出器位于DK-LSTM测井曲线重构模型的末端,为一个单层的全连接网络,按照公式(7)、(8)进行计算,其中,Wp、Ws∈Rd×2d和bs=Rd均可在训练期间通过学习获得,对应图5中的Output layer层。

hs=tanh(Wpr+Wshn)

(7)

(8)

3 实际数据应用与结果分析

3.1 数据准备

实验数据来源于大庆油田某工区的三口水平井(分别为A、B和C井),每口水平井均包含五条测井曲线,分别为电阻率(RT)、密度(DEN)、中子(CNL)、声波时差(HAC)和井径(CAL),分别选取测井曲线662 m~930 m数据段(采样间隔为0.125 m)进行实验。

3.2 样本筛选

基于测井领域知识对实验数据进行筛选,引入地层岩性类别(GS)特征指数,通过设置不同岩性类别提取值,可对测井曲线数据进行划分。为保证数据的充分性,需要通过对自定义提取值取进行分析,从而得出较为合理的提取值集合,并选择该集合下的标记数据作为最终实验数据[15]。

提取值的确定以地层岩性类别为基准,在各种类型的岩性区间(001、010、100)内,其中001代表泥岩,010代表粉砂岩,100代表细砂岩,以参考变化结果为依据,对所有设定提取值下的样本标记结果进行统计,综合考虑所有地层岩性类别筛选得到高质量的数据集。部分具有代表性的样本数据如表1所示。

表1 部分学习样本数据

3.3 实 验

结合大庆某工区的三口水平井数据的相关性分析结果设计三组实验,分别根据两口已知井的测井数据和地层岩性特征指数估计未知井缺失的声波时差测井曲线。在模型的训练过程中,把DK-LSTM神经网络获得的特征矩阵H添加到注意力机制的输入中,在注意力机制神经网络中根据HAC对井径测井曲线的强依赖关系构造输入向量A,从而获得矩阵H的注意力权重,更加准确地预测未知测井曲线(HAC)。以本实验中的数据和问题为例,由DK-LSTM测井曲线重构模型分别得到的三口水平井HAC测井曲线如图6所示。

3.4 结果分析

由图6可以看出,采用DK-LSTM神经网络模型进行测井曲线重构取得了较好的效果,其充分利用测井曲线之间的线性关系和非线性关系,很好地学习到测井曲线随深度变化的特性,可以根据已知测井数据生成补全未知的曲线,基本能够反映失真或缺失段测井曲线的变化趋势。为证明DK-LSTM测井曲线重构模型的稳定性和准确度添加对比实验,根据文献[7]构建标准长短期记忆神经网络(LSTM)和串级长短期记忆神经网络(CLSTM)针对筛选后的数据样本进行测井曲线重构。采用均方误差(MSE)作为评价重构效果的标准,具体公式如下:

图6 声波时差测井曲线重构结果

(9)

表2 测井曲线重构精度MSE值

由表2可知,利用DK-LSTM测井曲线重构模型较标准长短期记忆神经网络和串级长短期记忆神经网络重构缺失或失真部分测井曲线的结果精度更高、定性更强。

4 结束语

经过仿真实验表明,利用改进的长短期记忆神经网络融合注意力机制很好地生成补全了声波时差测井曲线,与标准长短期记忆神经网络和串级长短期记忆神经网络对缺失段测井曲线重构效果相比,DK-LSTM测井曲线重构模型具有较高的准确性和鲁棒性。提出的基于改进的长短期记忆神经网络生成人工测井曲线的方法精度较高且成本低,该方法有助于更全面地认识地层并创新钻完井策略,为测井曲线重构提供了一种新思路。

猜你喜欢
测井重构神经网络
基于神经网络的船舶电力系统故障诊断方法
青少年劳动教育实施的认知与策略重构
基于人工智能LSTM循环神经网络的学习成绩预测
“双减”能否重构教育生态?
MIV-PSO-BP神经网络用户热负荷预测
长城叙事的重构
资源勘查工程专业《地球物理测井与解释》课程的教学改革
我国测井评价技术应用中常见地质问题分析
用四维的理念重构当代诗歌
三次样条和二次删除相辅助的WASD神经网络与日本人口预测