基于FCM的地震波形聚类方法研究

2021-12-16 10:11朱乾菲柴变芳硕良勋
河北地质大学学报 2021年6期
关键词:层位工区均值

朱乾菲,柴变芳,韩 红,硕良勋

ZHU Qian-feia, CHAI Bian-fangb, HAN Hongb, SHUO Liang-xunb

河北地质大学 a.地球科学学院,b.信息工程学院,河北 石家庄 050031

Hebei GEO University, Shijiazhuang 050031, China

0 引言

原始地震记录中包含了大量的地下介质的响应信息,而地震记录与储层有着极其复杂的非线性关系[1],要想在两者之间直接建立具有量化的关系非常有难度。为了使用地震数据来表征储层非均质性,通常引入地震相分析技术来生成描述储层范围并识别其地质特征的地图[2-3]。波形分类是地震相分析中常用的一种储层预测技术波形分类技术是解决地震相问题和储层预测的重要方法[4]。地震波形具有直观的解释意义[5],地震波形变化及其分布规律是重要的地震参数之一[6]。沿解释层位提取的波形带有振幅、频率和相位信息。因此,波形分类技术已被证明是地震相分析的有力方法[7-9]。

地震波形分类属性的分析方法最早于1982年由Naaman Keskes等提出, 并应用于二维地震测网的追踪研究[10]。1984年, Sibille[11]较为系统地提出了波形聚类分析基本原理, 即根据地震反射界面中同相轴排列组合的多种属性(杂乱、波状、平行和复合波形),采用多元统计方法进行归类, 并将其初步用于地震相分析研究。1990年,Kohonen提出自组织神经网络(SOM);2003年,Saggaf等人[12]提出了一种竞争神经网络来分类波形,用于无监督地震相分类和储层相的自动识别;2012年,Priezzhev I等[13]提出了应用基于K平均值和SOM的三维波形地震相分类方法;2014年,Chopra和Marfurt[14]使用生成地形图进行地震波形分类。由于地质结构普遍复杂与多样性,某些不同地质体过渡范围反射的波形通常应该是以一定的模糊值属于各个波形模式类别,而不应以一个确定值属于一个类。本文引入模糊C均值聚类(FCM)对地震相进行分类,可以使不同相之间的界限变得平滑。采用FCM的结果会让地震相变得更好解释,即地质结构展示的更丰富,为相关地质解释人员提供更多的参考依据。

1 基于FCM的地震波形聚类算法

1.1 FCM介绍

模糊C均值聚类算法( Fuzzy C-Means algorithm)也称FCM。FCM算法在聚类算法中应用最广泛且较成功。本质是利用每个样本点对所有类中心的隶属度来优化目标函数,以此决定样本点的类属以达到自动对样本数据进行分类的目的。

1.1.1 隶属度函数的概念

隶属度函数是表示数据集中任何一个元素对象x属于该集合A程度,其自变量范围是A中任一对象,取值范围为[0,1],即0≦µA(x)≦1。即为定义了一个在空间X={x}上的隶属度函数就等同于定义了一个模糊集合A可以表示为:

1.1.2 模糊C均值聚类FCM

模糊C均值聚类(FCM),是利用隶属度函数来确定样本点属于某个类的程度的一种算法。假设样本集合为D={x1,x2,…,xn}代表的是n个样本的特征向量集,对于D进行模糊聚类得到c个簇C1,C2,…,Cc,P=(P1,P2,…,Pc)代表所有子集的聚类中心集合,其中U=(uij)代表隶属度矩阵,隶属度uij是用来表明样本Xi与其子集Cj的隶属关系,应该满足:

FCM聚类算法进行模糊聚类,它的非相似性指标的目标函数可以定义为:

其中,J代表实例数据和聚类中心的距离平方和;dij代表的第i个数据点与第j个聚类中心是一种距离度量函数,聚类中心分布状况不同,所选择的函数种类也许不同,一般采用欧式距离。

构造如下新的目标函数,使式(3)达到最小值的必要条件:

这里λj,j=1到n,是式(2)的n个约束式的拉格朗日乘子。m:用来决定隶属度矩阵U模糊水平的系数,通常也叫做平滑因子,U的模糊水平与m值呈正相关。对所有输入参量求导,使式(4)达到最小的必要条件为:

迭代过程中聚类中心和隶属度是持续调整的,一直到符合迭代条件。FCM聚类算法的隶属度没有硬性规定属于1或0,而是能够在不同类别之间模糊取值。由这两个必要条件,FCM算法可以理解为一个简单的迭代过程[15]。

1.2 基于FCM的地震波聚类算法

FCM算法是一种无监督学习方法,可以识别多维空间中的数据点组或聚类。波形分类利用FCM算法,首先将波形样本集分为C类找到每类的聚类中心,根据每一道波的隶属度进行划分,将所有道波划分为最佳类别,形成地震相。详细描述如表1所示。

表1 基于FCM的地震波聚类算法Table 1 Seismic wave clustering algorithm based on FCM

2 算法测试

首先利用人工合成的地震数据验证FCM算法在波形分类中的有效性,然后利用实际工区的地震数据实现基于FCM的地震波形聚类。

2.1 合成地震数据的测试

由于获取标注地震波数据较难,下面通过正演模型构造人工地震波数据。假设人工模型的相关数据如图1所示。(模型中每一层的厚度为500 m,采样率:0.001 s)

图1 人工模型的速度数据信息Fig.1 Velocity data information of artificial model

图1中可以看出在深度500~1 000 m时,可以看到该数据有三大类的地震数据,地震波的速度分别为:vp=3 100 m/s、vp=3 200 m/s、vp=3 300 m/s。检波器间隔设为3 m,所以总共生成900道波。图2可以看出解析层位取常数0.6 s处,层位上下各取0.1 s,得到的地震波形每道200个点。

图2 正演合成记录Fig.2 Forward synthetic record

图3可以看出,利用FCM算法将900道地震波分为了3类,每类含有的地震波约为300道,与合成地震数据的参数相符合。

图3 FCM聚类结果Fig.3 FCM clustering results

2.2 工区地震数据测试

2.2.1 工区数据介绍

本文用到的数据是dGB地球科学公司的荷兰北海F3的叠后地震解释数据集,该数据集包含384 km2的地震数据,共有951条inline,651条Xline,采样率是4 ms,记录1 848 ms,生成了9个不同的层位,现作为地质方面的一个公开的数据体[17]。选取了F3工区的其中一个层位作为分析层位,该区域的时间切片如图4;层位显示如图5.沿着该层位上取20 ms和下取20 ms作为分析的数据范围,Xline号:304—1246,Inline号:104—696。

图4 工区 928 ms切片图Fig.4 928 ms section map of work area

图5 工区层位图Fig.5 Horizon map of work area

2.2.2 算法应用

FCM属于划分聚类方法,是K均值算法在模糊数学和可能性理论下的自然扩展。所以本文也使用了K均值算法对地震波形进行聚类,与FCM算法形成对比。因为K均值算法中的K值不好确定,所以使用肘部法则确定K值。

应用肘部法则确定K-means聚类算法的最佳K值为10,结果如图6。分别使用K均值方法和FCM算法对研究区域数据处理,处理结果如图7和图8。

图6 肘部法则确定K值Fig.6 Determination of K value by elbow rule

图7 基于K均值聚类结果(运行时间:78.069 s)Fig.7 Clustering results based on K-means

图8 基于FCM聚类结果(运行时间:89.506 s)Fig.8 Clustering results based on FCM

实验工区所选波形数据是647×949总共614 003个波形数据,基于FCM算法分为了10类。在这个10类波形数据中,选出来每一类波形中隶属度最大的一条波如表2所示,每条波都会有十个隶属度值,最大隶属度值则对应其类别。同时画出所选数据中数据522 522和511 682,从图9中可以看出波形相似,但是因为隶属度不同,所谓将其分为了两类。

表2 数据隶属度Table 2 Data membership degree

图9 数据波形图Fig.9 Data waveform diagram

2.3 实验小结

FCM聚类算法在人工合成数据中的应用,证明了基于FCM的地震波聚类方法的有效性。同时通过FCM和K均值两种聚类方法在荷兰F3工区数据进行波形分类可以得到以下结论:

1.FCM聚类算法是在K均值算法的基础上进行发展,可以对缺少先验知识的对象进行分类,通过人脑思维信息,使分类结果更符合客观实际,可以给出相对的最优分类结果,因此具有一定的实用性。然而该算法也有一些缺点,主要有:聚类结果取决与参数的初始化选取,这些参数的设定,会影响聚类结果的正确性。

2.速度比较:从上述两种聚类结果分析中可得,FCM聚类代码运行时间和K均值聚类代码运行时间分别为89.506 s和78.069 s。因为FCM聚类比K均值聚类的迭代次数更多,从而计算量更大,以至于数据处理的更加细腻,所以速度会慢一些。

3.FCM算法在分类结果上根据每个数据的隶属度进行划分,即使数据不完全相似,但是所属隶属度相同也可以划分为一类;反之,数据波形可能相似,隶属度不同也可能被分为不同类别。所以FCM算法更加精细,由该方法获得地震相的种类刻画的更加细致,为相应地质解释人员对沉积相的解释提供了更加可靠的参考依据。

3 结论

本文提出了一种用于波形分类的模糊C均值算法。此方法使用模糊值来计算波形之间的相似性。将此算法应用于人工合成数据和实际工区数据,并在实际工区数据中使用K均值算法和FCM算法得到的结果进行比较,发现不同的地质特征在FCM产生的分类结果中容易区分,而从传统的K均值算法得到的结果是较差的。

虽然波形分类方法在地震相分析方面已经取得了一定的成果,但是想要得到突破,还需要进一步探索。在接下来的研究工作中,会继续学习利用其他算法使波形分类效果更好。

猜你喜欢
层位工区均值
基于样本选取和多种质控的地震层位智能拾取
纳米陶瓷基铝电解阳极防氧化技术的工业应用
浅析高速公路养护工区布局与标准化建设
涡北煤矿综采放顶煤运输巷层位布置的探讨分析
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
浅谈均值不等式的应用
均值不等式的小应用
铁路线上别样的春节
顶板走向高抽巷层位布置的合理选择