基于图版法决策树在流体识别中的应用

2019-01-19 07:29赵倩杨斌李星王少龙魏杰
测井技术 2018年6期
关键词:气层图版交会

赵倩,杨斌,李星,王少龙,魏杰

(成都理工大学能源学院,四川成都610059)

0 引 言

YD油田英东一号构造位于青海省柴达木盆地西部茫崖坳陷区英雄岭冲断隆起带南缘油砂山—大乌斯构造带。该油田存在油气并存,受异常流体性质、储层物性、地层水矿化度等因素影响,下油砂山组常规测井油气识别存在较大困难,射孔解释与生产矛盾,流体识别存在较大困难。

该地区流体识别研究主要有常规的图版法识别结合核磁共振测井、模块式地层动态测试仪(MDT)测压进行识别[1]。最新研究方法提出利用电阻率和声波时差之间的相关系数与两者重叠时的包络面积可识别出流体类型(不适合气层)[2]。前者因运用特殊测井技术,识别准确度有所提高,但由于该地区井数量较多,运用特殊测井仪器进行测量的井数量有限,难以普及;后者使用比较新颖的方法,但没有对重要的气层进行识别。当有多个图版法识别流体,识别结果出现差异时,以及当数据点落在图版分界线时,得到的判别结果存在主观性。

为了解决这些难题,考虑采用数据挖掘算法。数据挖掘算法包括神经网络,支持向量机,贝叶斯判别,决策树等,其中神经网络[3-5]在流体识别中的应用已经比较广泛和成熟,但神经网络属于“黑盒”模型,样本数据的拟合过程方式无从知晓[6]。而决策树是一种“白盒”模型,可以清楚了解分类器是如何工作以及各种参数的相对重要性,在测井解释方面有很好的指导作用[7]。

1 建立流体识别解释图版

图版法在流体识别中非常实用与常见,不同流体的测井响应特征可以在图版上显示出来。但建立图版需要选择的曲线以及曲线组合的形式需根据不同流体类型变换。通过多口井多次试油结论得出,该地区有纯气层、纯油层、含油水层、油水同层、油气同层、水层、干层等7种流体,各流体测井响应特征见表1。

表1 流体测井响应特征

根据不同类型流体的测井响应特征可以发现,反映流体性质的关键参数主要包括:孔隙度、含水饱和度、声波、密度、中子、电阻率和录井气测参数等。

以这7类参数为依据,综合利用测井、录井资料,采用了幅度值法、比值法、差值法、曲线校正法等建立不同参数类型的交会图版。经过多次试验优选出了8个有效的测井及录井气测参数:DEN、RHT09、RHT09/RLLd、|φD-φN|、C2/C3、ΔAC、φ、Sw,建立了4个图版。其中,RHT09为阵列感应测井的最深探测电阻率值,RLLd为深侧向电阻率,φD与φN分别为计算的密度孔隙度和校正后中子孔隙度,C2与C3分别为录井气测乙烷含量和丙烷含量,ΔAC为声波时差幅度差。

图1 ΔAC—RHT09/RLLd交会图

(2)图版2:|φD-φN|—RHT09/RLLd交会图。由于地层水矿化度异常高且油气层因受到钻井液浸泡,阵列感应测井电阻率呈现高侵入的特征,且电阻率绝对值较低,为解决这一难题,引入了密度孔隙度与校正中子孔隙度差值的绝对值,再与电阻率的比值进行交会,能够较好地区分出气层。密度孔隙度计算公式为[9]

φD=(ρb-ρma)/(ρf-ρma)

(1)

式中,φD为密度孔隙度,%;ρb为曲线密度值;ρma为岩石骨架密度,取值2.666 g/cm3;ρf为流体密度,取值1.0 g/cm3。

补偿中子孔隙度进行了泥质校正[10]

φN′=(φNma-φN)/(φNma-φf)-

Vsh(φNma-φNsh)/(φNma-φf)

(2)

式中,φN′为校正后的中子孔隙度,%;φNma为砂岩骨架中子孔隙度,取值-3.5;φN为校正前的中子孔隙度;φf为流体中子孔隙度,取值100;Vsh为泥质含量;φNsh为泥岩中子孔隙度,取值27%。

图2 |φD-φN|—RHT09/RLLd交会图

从图2可见,油层:|φD-φN|<3.5%;气层、油气同层:|φD-φN|≥3.5%。该图版同时可以较好地区分出油气同层。

(3)图版3:DEN—C2/C3交会图。气测总烃与其他气测值是油气判断较直观的参数,该图版选用密度与气测比值C2/C3[10]进行交会(见图3)。在气测总烃含量较高(>45%)时,能够较好地区分油层与气层。其中,气层为:C2/C3≥2;油层为:C2/C3<2。

图3 DEN—C2/C3交会图

(4)图版4:φ—RHT09交会图。该图版综合考虑了孔隙度、阵列感应测井电阻率和含水饱和度这3个参数(见图4),通过不同的含水饱和度区间,可定性判别油气层类和水层类。其中,水层、含油水层、油水同层Sw≥50%,气层、油层、油气同层Sw<50%。

图4 φ—RHT09交会图

2 流体识别的决策树数据挖掘

图版法识别流体存在多解性和不确定性。整个识别过程繁琐,特别是对整个区块的所有井进行识别时,工作量十分庞大。为了解决以上问题,运用数据挖掘中的决策树法。构造决策树的目的是找出属性(测井输入曲线)和类别(流体类别)间的关系,用它来预测未知的类别。这种具有预测功能的系统称为决策树分类器[7]。

2.1 决策树原理

决策树是一种常用的数据挖掘方法,是类似流程图的树型结构[11-12]。

决策树算法主要包括2个过程:构造过程和分类过程。构造决策树分为建树和剪枝2个阶段,前者归纳出决策树,后者防止过度拟合。目前决策树算法有ID3(Quinlan 1986)、CART(Breman 1984)、FACT(Loh 1988)、C4.5(Quinlan 1993)等算法,本文采用CART算法。

CART(Classification And Regression Tree)算法是一种二分分类回归树。若目标变量是离散的,则是分类树,否则是回归树。CART算法是在给定输入随机变量X条件下输出随机变量Y的条件概率分布的学习方法。构造过程和ID3、C4.5的构造上大致相同,只是在属性选择过程中不是使用信息增益或信息增益率,而是使用基尼指数(Gini index)最小化准则进行特征选择。采用二分递归分割的方法,不断将当前的样本集分为2个子集,使得每个非叶子节点都有2个分支,最后产生1棵二叉决策树[12-13]。

设1个样本集合S,有A属性参数,有K类,若属于第i类的样本子集为Ci,则其基尼指数为

(3)

若集合S根据特征A是否取某一可能值a被分割为S1和S2两部分,即

S1={(x,y)∈S|A(x)=a}

(4)

S2=S-S1

(5)

则以特征A作为判别条件时,基尼指数定义

(6)

Gini(S)、Gini(S,A)分别表示集合S的不确定性以及通过A=a分割后集合的不确定性。基尼指数值越大,样本集合的不确定性也就越大CART算法可判断属性变量的重要性,自动忽略对目标变量没有贡献的属性,对于样本集中不合适的孤立点、缺失值可自动处理[13]。可使用自动的成本复杂性剪枝来得到归纳性更强的树。CART算法得到的为二叉树模型,相比ID3与C4.5得到的多叉树更简洁。

2.2 流体识别数据挖掘

通过以上各流体的测井响应特征及流体识别建立的图版,对测井数据进行处理,选择CNL、DEN、感应电阻率(RHT09)、φ、Sw、RHT09/RLLd、|φD-φN|、C2/C3、ΔAC,这9个参数作为决策树输入参数,

试油结论作为输出结果。CART算法采用(Gini index)作为划分度量,选择基尼指数最大的属性作为划分节点。对输入的9个参数计算,进行权重判断,参数权重见图5。图5柱状图表示从9个参数中挖掘出对流体敏感的DEN、RHT09、Sw、RHT09/RLLd、|φD-φN|、C2/C3、φ等7个参数,CNL、ΔAC这2个参数几乎不敏感,所以不参与建树。选出的7个参数中C2/C3与Sw的参数权重最大,敏感性最高;φ、RHT09和RHT09/RLLd次之。为了能将7种类型的流体均能识别出,同时使识别结果更为准确,考虑加入敏感度不是特别高的|φD-φN|和DEN,|φD-φN|能有效区分油类与气类;DEN是有效区分出干层的重要参数。

图5 流体识别数据挖掘权重图

通过决策树识别生成的规则具有高准确率,88个流体样本,生成的决策树模型可正确识别83个,模型正确率达94.32%。运用生成的决策树模型识别预留出的12个检验模型的样本,其正确个数为11个,正确率达91.7%,表明模型可用(见表2)。图6是流体识别的决策树识别模型树状图,模型从根节点即含水饱和度开始对数据样本进行测试,至上而下共4个层次。树的每个分枝代表一类流体的识别规则,叶节点表示构成该识别规则的属性参数以及每个参数的数值区间。通过对模型的分析可以清楚地看出流体类型识别的参数组合和关联规则,例如油层根结点往下需要同时满足4个条件Sw<0.516 3、C2/C3<2.159 6、DEN<2.509 5、|φD-φN|<8.353 22%。该方法易理解分类准确,不仅在流体识别方面提供了新的有效方法,也为地球物理其他方面的研究提供思路和指导。

表2 流体识别决策树模型检验表

图6 流体识别的决策树模型图

图7 XD112井流体识别结果图

3 应用实例

以XD112井为实例(见图7),对XD112井Ⅶ-4、Ⅶ-5、Ⅶ-8这3个未参与模型建立的实际试油小层运用决策树图版法进行流体识别。Ⅶ-4层测井曲线特征:自然伽马为83.153 API,电阻率为5.123 Ω·m、声波时差为256.259 μs/m,中子为21.526%,密度为2.373 g/cm3,总烃高达84%,Sw为0.449,φ为15.475%。Ⅶ-5层测井曲线特征:自然伽马为85.435 API,电阻率为5.054 Ω·m,声波时差为273.925 μs/m,中子为21.526%,密度为2.373 g/cm3,总烃高达33.75%,Sw为0.389,φ为20.032%。对这2个小层运用决策树模型识别得出均为气层,且2个小层的中子曲线和密度曲线有充填支持了气层结论。经实际射孔验证,Ⅶ-4、Ⅶ-5小层日产气5 143 m3,属于气层,模型识别正确。

Ⅶ-8层测井曲线特征:自然伽马为72.858 API,电阻率为5.123 Ω·m,声波时差为277.528 μs/m,中子为18.966%,密度为2.327 g/cm3,总烃4.23%,C2/C3为17.155,φ为10.503%,Sw为0.724。对这个小层运用决策树模型识别结果为干层,与射孔结果相符。

4 结 论

(1)图版DEN—RHT09对于干层、油气层大类和水层大类识别较高;对于气层类,可用|φD-φN|—RHT09/RLLd交会图版进行识别,当录井气测全烃Tgas>45%时,使用DEN—C2/C3图版能够较好地区分油层和气层;对于油层类,ΔAC—RHT09/RLLd交会图进行识别;对于水层类使用RHT09-φ图版。图版法在定性划分流体性质时具有很好的作用,但是当流体类型落在2类流体分界线附近时则带有一定的人为主观性;面对大量数据时图版法识别效率太低。

(2)YD油田油气并存,流体性质、储层物性、地层水矿化度异常高等因素导致流体测井响应特征复杂,不同流体类型识别困难。决策树法很好地解决了图版法存在的缺陷,通过决策树数据挖掘的分析,根据各属性参数之间的关系,选出DEN、RHT09、Sw、RHT09/RLLd、|φD-φN|、C2/C3、φ等7个对流体识别最敏感的参数,使得识别更有效快捷。

(3)运用决策树进行流体识别只是数据挖掘方法与地球物理学相结合方法的其中一种,但这一方法的实现为地球物理其他方面的研究提供了一种新的思路和方法。

猜你喜欢
气层图版交会
A New Record of Eritrichium (Boraginaceae) in China
基于高中地理教材人教版和中图版比较的教学设计研究
基于谓词逻辑的飞机线束工装图版设计
基于孔、裂隙理论评价致密气层
2019年,水交会来了!
涪陵页岩气层构造变形量化研究获新进展
立方体星交会对接和空间飞行演示
船底凹槽气层流动特征及影响因素研究
苏里格气田致密砂岩气层识别难点及方法评述
一切以交易的名义——首届黑马创交会揭秘