气体钻井随钻安全风险智能识别方法

2022-05-12 10:21胡万俊夏文鹤李永杰蒋俊李皋陈一健
石油勘探与开发 2022年2期
关键词:产气钻井卷积

胡万俊,夏文鹤,2,李永杰,蒋俊,李皋,陈一健

(1. 西南石油大学电气信息学院,成都 610500;2. 油气藏地质及开发工程国家重点实验室,成都 610500;3. 西南石油大学石油与天然气工程学院,成都 610500;4. 西南石油大学计算机科学学院,成都 610500)

0 引言

钻井是油气勘探开发必不可少的关键工程技术,也是一项非常复杂的地下工程,如何在复杂的现场施工条件下及时识别出卡钻、井壁失稳、钻具断裂等随钻安全风险并做出相应处理,预防大型事故的发生,是提升钻完井成功率、降低钻完井成本的关键环节[1]。目前钻井过程中钻井风险的识别主要依靠人工,判断结果具有较强的主观性和时间滞后性,同时因不同井况发生安全风险的特征差异巨大,现场人工辨识的难度大,准确性低。

近年来,随着人工智能技术在全球范围内迅猛发展,油气勘探开发智能化成为全球油气行业发展的热点,也成为保障中国能源战略安全的变革性技术[2]。2015年,李皋等[3]建立了气体钻井过程中井壁失稳、产水、产气、井下燃爆、钻柱失效等主要风险因素与对应参数变化的关系模型,基于已有的地面监测技术,形成了有效的气体钻井随钻安全风险辨识方法;2017年,邱少林等[4]分析了影响井下事故风险的7种因素,包括钻井液密度、流变性、滤失量、岩石类型等,建立了井下事故风险评估指标体系,实现了井下事故风险的模糊综合量化评估;同年,管志川等提出了基于粒子群算法的BP神经网络钻井风险评估方法[5-6];2020年,王茜等提出采用钻井模型与专家系统相结合的方式进行井下安全风险识别[7]。综上所述,钻井技术正由传统模式向机器学习与人工智能相结合的方向发展[8],目前主要以专家系统结合BP神经网络为主[9],但由于经验及样本的限制,目前成功应用于钻井工程随钻实时识别的案例较少。

本文针对目前智能钻井技术在样本收集、数据预处理以及数据特征提取方面的不足,使用少样本学习方法扩充样本数据,通过对抽象特征提取更有效的卷积神经网络对随钻监测数据进行训练学习,实现参数隐含特征的提取,并设计了与当前随钻监测数据形式相匹配的卷积神经网络结构模型与训练方法,进而实现随钻安全风险智能识别。

1 钻井安全风险表征及关联参数

1.1 随钻监测参数

钻井过程中的监测仪器种类众多,数据采集时间间隔多为 1~5 s,单日单井钻井监测数据可超过 4×104条,数据量大且繁杂。不同井况钻进过程中,同类安全风险所表现出的参数变化特征有着极大的差异。如图1为A、B两口井钻遇产层时的近似工况,A井甲烷体积分数与管线排压大幅上升,氧气体积分数大幅下降,而顶驱转速与顶驱扭矩无明显异常;B井甲烷体积分数与管线排压小幅上升,氧气体积分数小幅下降,但由于诱发卡钻导致顶驱转速与顶驱扭矩异常。现场人员如不具备丰富的经验,难以及时准确地通过随钻监测参数判断出产气安全风险。因此,识别精度高且实时性强的智能随钻安全风险辨识方法对钻井工程有重要的意义。

图1 气体钻井钻遇产层过程相关参数变化示意图

1.2 气体钻井重要安全风险表征关联参数

以气体钻井为例,其重要的钻井安全风险主要包括地层产气、地层出水、卡钻、钻具断裂、井下燃爆、产硫化氢、井壁失稳等。由于随钻监测参数种类繁多,若全部用于随钻安全风险分析,则模型复杂度高,网络训练难度大,故需先对安全风险与随钻监测参数之间的对应关系进行宏观把控。本文整理、清洗10余口井随钻监测历史数据,筛选出13种核心监测参数进行相关系数分析,并以热力图的形式展示(见图2,图中数值代表两对应参数的相关性系数,包括正、负相关)。

图2 Pearson系数相关性分析结果图

基于相关性分析结果,结合现有的随钻安全风险理论模型与多个专家经验,对历史数据中的各类安全风险数据变化规律进行整理,得到部分重要安全风险对应的特征关联参数如下:地层产气风险关联参数为立管压力、氧气体积分数、甲烷体积分数、管线排压,地层出水风险关联参数为大钩载荷、返出气体温湿度,卡钻风险关联参数为顶驱转速、顶驱扭矩、立管压力、管线排压,钻具断裂风险关联参数为大钩载荷、顶驱扭矩、立管压力、管线排压,井下燃爆风险关联参数为立管压力、氧气体积分数、二氧化碳质量浓度、甲烷体积分数、返出气体温度、管线排压,井壁失稳风险关联参数为大钩载荷、顶驱转速、顶驱扭矩。

2 安全风险随钻监测数据样本

随钻监测参数多以时间为序进行采集,多参数组成二维数组进行存储。根据二维数组中参数的变化趋势以及各参数间的变化关系能有效识别大多数安全风险。因此,智能安全风险识别方法的样本结构应为一段时间内安全风险特征关联参数构成的二维数组。

2.1 样本时间跨度分析

在将监测数据转换为神经网络输入数据时,需要确定单个样本的时间跨度。针对该问题,本文对每一种随钻安全风险分别构建 3种不同时间跨度的样本数据,用 3个网络同时进行随钻安全风险识别训练,并进行性能对比,确保最终的样本形式既能包含随钻安全风险的大部分特征,尽可能地提升识别可靠性,又可降低系统时延性。4类安全风险样本时间跨度分布情况如表1所示,构建后的部分样本数量如表2所示,样本库包括安全风险类样本和正常钻井样本,表中第2列、第 3列数据仅为具有安全风险特征的样本数量。以地层产气时间跨度40 s样本为例,采集时间间隔为2 s,表3为提取后的单个样本,为20×5的二维数据。

表1 样本时间跨度分布概况

表2 部分随钻安全风险样本数目概况

表3 单次样本示意表

虽然随钻监测数据单井单日数据量可超过 4×104条,但其中能够表征发生安全风险的有效数据段较少,构建的安全风险类样本数量十分有限。此外,为了避免样本失衡,需确保样本库中安全风险与正常工况样本数量比例不超过1∶2。

2.2 随钻安全风险识别少样本扩展方法

根据英国统计学家威廉·西利·戈塞特的少样本理论,样本容量小于50则属于少样本条件[10]。本研究利用10余口井20余井次监测数据建立样本库,4种风险有效样本总数不超过 200个,与其他领域动辄上千样本数量的样本库相比,该样本数量少,网络难以高效提取到数据的有效特征。故本文使用少样本学习方法对样本数据进行预处理,以扩展样本数量(见图3)。在少样本条件下,本文主要采用数据增强与迁移学习算法[11],利用数据增强中缩放、裁剪、插值以及SMOTE算法[12]处理样本,在一定程度上增加有效样本数量。

图3 少样本学习示意图

由于每个随钻监测参数的变化方式以及参数的整体变化规律比数值大小更为重要,因此针对部分变化特征明显的数据段可使用数据缩放方式将变化过程中的部分数据提取并扩展至标准的时间跨度(如20,40,60 s),以形成新的训练样本。随后利用拉格朗日分段插值法[13]对缩放后的数据段进行填充,使其与标准样本具有相同的数据长度:

数据缩放插值后,再采用 SMOTE算法对个别标志性样本进行分析,进而人工合成新样本,并添加到样本库中,进一步提升网络的识别性能。SMOTE合成算法如下[14]:

经样本扩展处理后,部分安全风险训练集样本与测试集样本分布情况如表4所示,与表2对比可知,各类样本数量都有了显著提升。此外,在进行网络训练时,优先训练如地层产气这类样本丰富、样本特征明显的风险类型,然后采用迁移学习算法将训练后的网络权重迁移至地层出水这类样本数量较少、样本特征不明显的风险类型训练中[15],增强后者神经网络的学习效率[16]。在迁移过程中,如某种安全风险的数据样本特征提取难度较大,则一般应锁定隐含层或输出层,重点训练卷积层(特征提取层)[17]。

表4 样本扩展后部分随钻安全风险样本数目概况

2.3 数据归一化

另一方面,由于样本中监测参数数值范围差太大,影响网络训练效果,需对部分参数进行归一化处理。在提取出的参数中,甲烷体积分数、氧气体积分数、相对湿度等参数数值范围均在 0~100%,故以上述参数为标准,对其余参数按此范围进行归一化。

综上所述,本研究中,训练前期完整的数据样本构建方法如图4所示,其中历史监测参数共包含了新疆博孜A井、迪A井,四川大邑A井、龙岗B井等多区块的10余口井,样本来源地区跨度大,样本特征足够丰富,不同井位之间存在的共性与差异性能保证模型的泛化能力。

图4 数据预处理示意图

3 安全风险智能识别卷积神经网络

随钻监测的数据样本可视为二维数据,若使用目前数据处理过程中常用的全连接神经网络,输入层仅支持一维数据,则会摒弃掉数据间所有的位置关系[18]。根据卷积神经网络输入层、卷积层、激励层、隐含层和输出层的基本结构,结合安全风险数据样本特征,构建出安全风险智能识别神经网络结构(见图5)。为了提高识别准确率,安全风险单个样本选取 20,40,60 s为时间跨度,同时为了降低系统计算量,提高网络识别效率与实时性,单个样本数据采集时间间隔选为2 s。使最后的输入层数据为10×n、20×n或 30×n的二维矩阵。接立柱工况时间长,对识别流程有一定影响,故将该工况样本时间跨度设为3 min,作为特例处理,输入层数据为90×n二维矩阵。

图5 随钻安全风险智能识别卷积神经网络结构图

利用卷积神经网络进行特征提取的过程中,往往采用多个不同层的卷积核提取输入数据的多重特征,以提高网络学习效率和泛化能力。对于钻井施工过程而言,大部分安全风险特征主要体现在两个方面:①各参数自身的变化趋势;②不同参数间的相关关系。为了充分提取多个随钻监测参数上述两方面的有效特征,本文卷积神经网络模型使用两层卷积层进行特征提取。

卷积层 1负责提取各参数自身的变化趋势,由于输入层为p×n(p=10,20,30)的二维数组,且数组中每一列的元素为某随钻监测参数随时间变化的数值,故卷积层1采用m×1的一维纵向卷积核,分别在n个参数上进行单独的卷积计算。同时,由于不同安全风险其参数变化特征的时间跨度有所不同,为了更好地兼容大部分安全风险特征,卷积层1采用m×1卷积核对 3种时长样本进行运算,即以多个不同长度的卷积核对每一个参数进行单独特征提取,不同时间跨度样本所用卷积核长度(m)与移动步长(s)的值如表5所示。在具体运算过程中,采用多个具有相同m值但初始系数不同的卷积核,每个卷积核设置不同的权重系数,该方法可更加全面地对输入数据进行特征提取。由图5可知,卷积层1共计使用20个卷积核。

表5 卷积层1参数m、s取值表

卷积层 1处理后,其输出矩阵中所有元素均是对应监测参数随时间推进的特征值。在此基础上,卷积层2提取参数间的相关关系,使用1×n的一维横向卷积核对矩阵中每一行进行单独特征提取,n为该类安全风险关联参数个数。卷积核生成方式与卷积层1类似,卷积层2共计使用20个卷积核,所有步长为1。

由于卷积层1中使用了3种不同长度卷积核,卷积后的特征数据至少具备3倍的重复特征,因此卷积完成后需采用数据降维处理,将卷积后的数据维度降低为原维度的1/3,否则会大幅增加后续网络输入节点数,也降低学习效率和收敛性。为充分保留主要特征,本架构采用主成分分析法进行降维处理[19],最终得到l个特征值,将其作为常规全连接神经网络的输入节点,使用一个含有150个节点的隐藏层进行学习训练。所用激活函数同为ELU函数。输出节点采用二分类的形式,即节点数为2。为了利于定量化描述,输出层采用Softmax函数将网络输出的结果转换为安全风险发生概率。

4 神经网络训练结果与现场应用

4.1 部分安全风险神经网络训练结果与分析

将各安全风险不同时长样本进行训练,将训练结果进行对比分析,以确定和验证最佳样本时长,并验证卷积神经网络性能[20],训练集样本训练和测试集样本测试同步进行。

4.1.1 地层产气风险网络训练

在地层产气风险 3个不同时间跨度的样本中,首先利用数据量小的 20 s样本完成神经网络训练过程(见图6)。

图6 地层产气风险20 s样本网络训练结果

由图可知,约6 000次训练后,网络模型输出值与真实值之间的差值(loss值)已很难下降,整个训练集样本准确率达到 90%后也基本不再上升,测试集样本准确率也仅约为83%。且两类样本在训练过程中,其准确度变化趋势不完全一致,说明20 s时长难以充分展现地层产气风险的变化规律和特征,该时长样本所含有效数据特征较少,导致网络学习存在一定的过拟合现象,故不能采用此长度样本作为地层产气风险识别依据。

40 s样本与60 s样本数据量较大,样本所含数据特征丰富,最终训练效果更优。尤其是60 s样本7 000次训练后最终loss值已不足0.1,训练集与测试集准确率均高于95%,如图7所示。

图7 地层产气60 s样本网络训练结果

4.1.2 地层出水风险网络训练

地层出水风险网络训练过程中,对 3个时长样本训练约5 000次后,loss值与准确度趋于平稳。与地层产气样本类似,随着地层出水单个样本时间跨度的增加,样本所含数据特征更加丰富,网络训练效果更好,最终60 s样本的网络识别准确率最高,训练结果如图8所示。训练集准确率与测试集准确率变化趋势基本同步,大小也非常接近,基本排除过拟合的可能性。但由于该风险工况在现场获取样本数相对较少,导致测试集最终准确率稍低,只达到 87%,后续可采用增加风险样本数量的方法进一步提升准确率。

图8 地层出水风险60 s样本网络训练结果

4.1.3 卡钻风险网络训练

卡钻风险40 s样本与60 s样本在网络训练过程中均迅速收敛,loss值下降快,且最终训练集和测试集准确率基本一致。图9为60 s样本训练结果,可以看到大约仅1 000次训练后,loss值已不足0.1,训练集准确率高于95%,最终接近99%,测试集准确率达到90%且趋于平稳。

图9 卡钻风险60 s样本网络训练结果

60 s样本3种安全风险对应神经网络测试集最终准确率分别为95%、87%、90%,识别准确率接近或超过 90%,说明该智能识别方法在钻井安全风险识别中具有良好的识别效果,能满足智能识别需求。尤其是卡钻风险,其识别网络训练快速收敛,说明对本卷积神经网络结构而言,网络能较为轻松地提取并学习到有效特征,做到高效识别和预测,有利于避免或快速解决钻井现场风险,也充分体现了卷积神经网络架构在智能钻井领域的适用性。若能提高样本数量,还可进一步提高模型的泛化能力和辨识准确度。

4.2 现场应用

将所有训练完成的神经网络模型进行整合后,编制气体钻井随钻安全风险智能识别预警软件系统,并进行了多次现场随钻识别预警应用。

以大邑A井为例,成功辨识数次地层产气、地层出水、卡钻风险以及接立柱工况。当现场钻井施工至测量井深5 149.22 m时,识别系统第一时间警示地层产气概率达到97.25%,现场监测人员随后确认钻遇小股甲烷气体,系统成功识别风险;钻至测量井深5 254.58 m时,识别系统提醒地层出水概率达83.54%,现场监测人员报告决策人员并根据后续排砂状况确认钻遇水层,系统成功预警风险;钻至测量井深5 254.69 m时,识别系统提醒卡钻概率达到96.54%,随后现场监测人员判断钻具遇卡并通知司钻处理,系统再次成功识别风险。钻井施工完成后,将系统智能辨识结果与随钻监测时报中的专家结论进行对比,结论具有一致性(见表6)。

表6 大邑A井识别结果与监测时报对比

5 结论

与传统的BP类全连接神经网络架构相比,本文设计的随钻监测数据样本建立方法,以及与样本数据形式相匹配的卷积神经网络结构及其训练方法,能更深入有效地感知多个随钻监测参数在钻进过程中抽象的变化规律及隐藏的关联关系,有效辨识出随钻监测参数所表征的安全风险特征。以此为基础形成的气体钻井随钻安全风险智能识别系统,能在一定程度上解决钻井领域安全风险样本少、智能化程度偏低的难题。经现场多次应用证实,气体钻井施工过程中各类随钻安全风险识别准确率为90%左右,具有良好的实用性。

符号注释:

A——输入节点;B1,B2——输出节点;H——隐含层节点;i——第一个参与计算的已有样本编号;j——第二个参与计算的已有样本编号;l——输入节点总数(主要特征维数);m1,m2,m3——卷积核 1-1、1-2、1-3纵向长度;n——各类安全风险特征参数数量;p——样本纵向长度;q——参与计算的样本点总数;r——隐含层节点数;rand(0, 1)——区间[0,1]内的随机数;s1,s2,s3——卷积核 1-1、1-2、1-3卷积过程移动步长;u——插入点横坐标值;vi——已有样本的纵坐标值;ui,uj——已有样本的横坐标值;Vq(u)——插值法输出纵坐标值;(x,y)——原始样本点;(xnew,ynew)——新的样本点;(xn,yn)——原始样本点的最近邻点。

猜你喜欢
产气钻井卷积
海洋石油钻井中的缺陷以及创新措施
湿垃圾与病死猪混合厌氧消化产气性能研究
自升式钻井平台Aker操作系统应用探讨
基于3D-Winograd的快速卷积算法设计及FPGA实现
羊毒素型产气荚膜梭菌临床症状及病理变化
加温加碱预处理对污泥厌氧消化产气量影响研究
卷积神经网络的分析与设计
Meso-mechanical model of concrete under a penetration load
从滤波器理解卷积
基于傅里叶域卷积表示的目标跟踪算法