大数据时代的现代测井解释技术探讨

2016-12-19 03:45邹德江谢关宝
石油地质与工程 2016年6期
关键词:测井资料数据库

邹德江 ,谢关宝

(1.中国石化石油勘探开发有限公司,北京 100029;2.中国石化石油工程技术研究院)



大数据时代的现代测井解释技术探讨

邹德江1,谢关宝2

(1.中国石化石油勘探开发有限公司,北京 100029;2.中国石化石油工程技术研究院)

大数据分析技术已经成为时代变革的力量,国内外一些石油公司及科研院所也开始尝试着在石油勘探开发中使用这种技术。在测井资料解释领域是否可以应用大数据分析技术,以提高测井解释精度与勘探开发效益,是当代测井从业人员值得思考的问题。在分析传统测井资料处理解释技术与大数据分析技术特点的基础上,论述了测井资料处理解释大数据分析面临的挑战与技术难点,同时提出一种基于大数据分析技术的测井资料处理分析方法,并给出了详细实现过程。展望未来,测井从业人员需要从理论、技术、实践三个方面来面对大数据分析技术对传统测井解释技术的挑战。

大数据;测井解释;数据驱动;数据挖掘;云计算

传统测井资料处理解释方法是通过实验、经验、数学物理统计等方式建立模型,测井资料处理解释人员根据资料所处地层不同、选择合适模型与参数,然后进行资料的处理与综合解释;处理分析过程一般可以分为数据的获取、数据预处理、服务性程序、数据处理、成果显示与输出等五个步骤。每个步骤都产生不同类型的信息,如处理流程的选择、处理模型的选择与优化、处理参数的选择、解释结果的确定与优化等[1],这些信息是具有大数据的显著特点(大量(Volume)、高速(Velocity)、多样(Variety)、价值(value))。在现有的测井资料处理解释软件中,这些宝贵信息有些被储存下来了,但大部分信息还没有储存或者利用起来。如何储存、加工、利用这些宝贵的大数据,使这些信息及数据实现“增值”,是现代测井解释工程师在大数据时代面临的机遇与挑战。

1 大数据定义与技术特点

维基百科、Gartner、IDC及一些咨询公司给大数据有不同的定义,总的来看,大数据是指在互联网、云计算等技术飞速发展的背景下,产生的需要新的技术和手段才能处理的,具有规模大、速度快、类型多且价值密度低等特点的各类数据资源。

数据资源是现代社会的一种新的自然资源,只有经过提炼才能发挥其最大价值,大数据的分析方法是决定最终大数据是否有价值的决定因素。大数据分析一般具有以下五个方面特征。

(1)预测性分析能力。数据挖掘可以让分析员更好地理解数据,预测性分析可以让分析人员根据可视化分析和数据挖掘的结果做出一些预测性的判断。

(2)数据质量和数据管理。数据质量和数据管理是一些管理方面的最佳实践。通过标准化的流程和工具对数据进行处理可以保证一个预先定义好的高质量的分析结果。

(3)可视化分析。不管是对数据分析专家还是普通用户,数据可视化是数据分析工具最基本的要求。可视化可以直观地展示数据,让数据自己说话,让观众听到、看到结果。

(4)语义引擎。非结构化数据复杂性与多样性给数据分析带来了新的挑战,需要一系列的新工具去解析、提取、分析数据。语义引擎需要被设计成能够从“文档”中智能提取信息。

(5)数据挖掘算法。可视化是给人看的,数据挖掘就是给机器看的。集群、分割、孤立点分析还有其他的算法让我们深入数据内部,挖掘价值。这些算法不仅要处理大数据的量,也要处理大数据的速度。

2 大数据分析与石油勘探开发

大数据分析技术的战略意义不在于掌握这些庞大的数据信息,而在于对这些含有特定意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

2.1 石油勘探开发大数据应用趋势

石油勘探开发是一个认识与再认识的过程,其中涉及到多学科与多专业的协同工作。在勘探开发过程中产生的数据具有学科复杂、类型多样及规模巨大的特点,具有天然的大数据特征。目前国内外石油勘探开发已经在这方面做了许多有益的尝试,如钻井作业中的套管卡管预测、采油生产状态预测、生产设备预见性维护、管道腐蚀预见性维护、测井数据预测产量等,综合国内外应用看,石油勘探开发行业大数据引用有如下趋势:

(1)越来越多的油公司开始关注大数据自动采集和设备远程控制;

(2)据统计,国际石油公司约75%信息投入与大数据有关,经过大数据分析与优化,油公司至少可以提高6%的采收率和8%的产量(数据来自IBM);

(3)国际油公司在开展大数据业务时,一般按“大数据—小场景—高回报”的策略,快速实现业务价值。

2.2 测井解释与大数据分析

测井解释评价软件是测井资料处理与评价的重要工具与载体,是运用各种现代技术综合解决地质问题的重要手段,是测井解释技术能力的综合体现,也是衡量测井技术水平的一个重要指标。

国内外石油服务公司都十分注重相关专业软件的开发工作,相继开发了自己的测井资料处理解释系统。国外具代表性的公司有斯伦贝谢、贝克休斯、哈里伯顿、帕拉代姆、IP,各家解释软件及相应处理平台如表1所示,国内具有代表性的公司有中国石油、中国石化、石大油软和吉奥特等几家公司,各家解释软件及相应的处理解释平台如表2所示。

综合国内外测井处理解释软件来看,测井资料处理解释软件发展具有以下趋势:

表1 国外测井资料处理解释平台统计

表2 国内测井资料处理解释平台统计

(1)系统应用平台由Unix系统向Windows系统转变;

(2)处理系统从针对单一厂商研发向适应多厂商发展;

(3)多学科融合,测录井评价从单井储层参数分析为主,向工程应用、地质分析和区域评价等方向拓展;

(4)资料解释从二维剖面解释向三维化参数评价发展;

(5)系统数据采用数据库与文件管理并存;

(6)系统功能模块多以图标+菜单式管理,且提供丰富的二次开发工具。

3 大数据分析与测井解释

在面对大数据时代对传统测井资料处理解释带来理念冲击的同时,针对测井解释大数据,还需要积极做好技术准备。对测井数据进行大数据处理分析,首先需要构建可以进行大数据分析的数据基础,其次要研究针对测井行业数据的大数据分析方法,最后形成可以对测井大数据进行查询、使用、分析等进行智能触发机制或数据驱动软件平台,以良好的人机交互,发掘测井解释大数据的最大价值。

3.1 关键技术分析

3.1.1 分类信息数据采集

测井数据库:存放野外采集到的各种测井数据。

综合数据库:地质、钻井、录井、测试、实验等数据(可借助现有各专业数据库)。

业务流程库:梳理测井处理解释及综合研究流程,建立对研究目标适用的、有效经验的测井处理解释综合研究流程库。

分析基础库:记录测井处理解释对数据的访问、对应的人员、处理流程、服务程序及其相应的变化(参数、服务程序、模型的选择、解释结果的确定等变化)。

人员信息库:存放处理解释人员个人信息,包括个人成功案例与失败案例、研究成果、多个服务程序的熟练程度等。

分析成果库:将大数据分析的结果进行记录,累积丰富的大数据分析经验。

数据驱动库:在测井数据库、综合数据库、分析基础库、人员信息库、分析成果库中进行数据查询和使用之前增加简捷的询问,如本数据用于什么区域、什么井、服务程序等,为进行数据驱动提供大数据分析的基础。记录其数据使用足迹,在使用该数据前使用了哪些数据,在使用后又使用了哪些数据,最终又产生了哪些数据[2-3]。

3.1.2 数据的存储与导入

存储系统是大数据应用中最核心的数据基础,它不再是传统分散、单一的底层设备,除具备传统数据存储的高性能、高安全、高可靠等特征之外,为满足大数据处理应用的需要,还应具有虚拟化、自动分层、并行分布、全局缓存加速、弹性扩展、异构资源整合等多方面的特点。

在测井分类信息数据采集中,还要大量导入其他专业数据库,把这些综合数据导入到一个集中的大型分布式数据库,或者分布式存储集群,在导入基础上做一些简单的“清洗”和预处理工作。这些都给测井解释大数据库的建立与管理带来巨大挑战。

3.1.3 数据分析技术

针对需要进行的地质任务,需要自动梳理数据集、服务程序及工作流程,并根据以往处理进行参数选择,同时需要记录访问的数据,在进行数据访问时,依据关联进行访问提示。对各阶段的成果,依据数据使用的流程、分析的流程和对目标的认知程度进行评判,并提示。根据成果的检验,确定是否累积到大数据库中。

3.1.4 数据挖掘

数据挖掘与数据分析技术的分析过程与传统统计分析不同,一般不预先设定主题,主要根据现有数据进行基于各种算法的计算,从而起到预测的效果,实现一些高级别数据分析的需求。比较典型算法有用于聚类的K-Means、用于统计学习的SVM和用于分类的Naive Bayes。

3.1.5 智能应用测井处理解释软件平台

国内外现有测井处理解释平台都还未能采集、分析测井解释大数据,需要根据测井解释大数据的特点,研发面向大数据时代的新一代测井处理解释平台:一是可以采集、记录、导入测井解释大数据,并具备大数据数据库管理功能;二是在具备传统测井处理解释功能基础上,具备大数据测井数据处理解释功能;三是具有大数据分析的良好交互能力。

3.2 测井资料大数据分析方法

从大数据分析的技术特点可知,需要新的处理模式才能具有更强的决策力、洞察发现力和流程优化能力,面对处理海量、高增长率和多样化的数据资产。假设现在已经拥有这些大数据信息,我们可以采用如图1所示的方法进行测井资料的大数据处理及分析工作。

图1 测井资料大数据分析流程示意

首先需要确定地质处理任务的工作区及目标井,然后设置该地质处理任务有关的区域资料,同时在工区中选取若干邻近非目标井。由于目标井及其邻近非目标井都位于同一工作区中,地层环境类似,因此邻近非目标井的测井解释成果可用于为目标井的测井资料的处理提供参考依据。但是,所获取的邻近非目标井应当为与目标井具有相同的地质处理任务,这样该邻近非目标井地质处理任务的过程、结论可以为目标井的分析提供参考依据。

一个工作区中通常包括几十甚至上百个邻近非目标井,其中与目标井具有相同的地质处理任务的邻近非目标井的个数也很多。若是每个邻近非目标井的测井解释成果都需要用来分析、处理目标井的测井资料,将会带来巨大的数据处理量,提高了对计算处理设备的硬件要求,延长了目标井的测井解释成果得出的时间。因此,可获取一个用户认为最适合的邻近非目标井来协助处理、分析目标井。

选定了目标井和邻近非目标井后,用户可根据目标井的地质处理任务,选取若干适合该地质处理任务的处理流程。根据用户选定的处理流程,选取若干适合的处理程序;向用户展示所选取的处理程序,并获取用户选定的处理程序;根据用户选定的处理程序,选取若干适合的处理模型;向用户展示所选取的处理模型,并获取用户选定的处理模型;根据用户选定的处理模型,选取若干适合的处理参数初始值和参数变化步长;向用户展示所选取的处理参数初始值和参数变化步长,并获取用户选定的处理参数初始值和参数变化步长。向用户展示的处理程序、处理模型、处理参数初始值和参数变化步长均可根据历史经验数据库中的相关数据获得。可利用选定的邻近非目标井,处理目标井的测井资料,得到处理解释成果,向用户展示出来。用户若是满意该处理解释成果,可将该处理解释成果作为最终成果保存。当前的目标井的地质处理任务完成,接着去处理其他的目标井的地质处理任务。用户若是不满意该处理解释成果,用户可选择为处理参数初始值叠加上所选定的参数变化步长,得到新的处理参数,之后再次进行处理,判断所得到的处理解释成果是否满意;若是经过数次变化处理参数,所得到的处理解释成果仍不符合用户的要求,则用户可以重新选择参数变化步长、处理参数初始值、处理模型、处理程序、处理流程等任一项或多项。

若用户选择的是工作区的多目标井处理,则重复前文所记载的执行选择和处理过程,直至用户所选择的目标井被全部处理完毕。

4 结束语

在大数据时代,数据已经成为重要的生产要素。通过专业技术人才的不断创新,大数据会逐步为人类创造更多的价值。面对专业化的测井处理解释技术,需要从以下三个方面系统认知分析大数据:

第一是理论,从理论上进行深入探讨,从专业的角度对测井解释大数据进行特征定义、描绘与定性,洞悉其技术特点与发展趋势。

第二是技术,分别从计算、处理、存储、分析技术与应用平台构建来说明大数据从采集、处理、存储到形成结果的整个过程及关键技术。

第三是实践,构建专业化的智能测井解释软件平台,从无到有、从简单到精细,展现大数据分析技术在测井解释领域的美好景象与即将实现的蓝图。

其中,理论是大数据认知基础,技术是大数据价值体现的手段和前进的基石,实践是大数据的最终价值体现。

面对测井解释大数据,测井解释工程师们还需要实现传统测井数据处理解释理念的三大转变:要全体不要抽样,要效率不要绝对精确,要相关不要因果。

展望未来,基于大数据分析技术的测井解释与传统测井解释将会从碰撞(Collide)走向连接(Connect)直到最终走向融合(Collaborate)的3C之路。

[1] 《测井学》编写组. 测井学[M].北京:石油工业出版社,1998:384-527.

[2] 隋志强. 对勘探综合研究中的大数据分析的思考[J].油气地球物理,2014,12(1):1-3.

[3] 王喜双,赵邦六,董世泰,等. 油气工业地震勘探大数据面临的挑战及对策[J].中国石油勘探,2014,19(4):43-47.

编辑:韩玉戟

1673-8217(2016)06-0051-04

2016-04-28

邹德江, 高级工程师,博士,1974年生,现从事测井方法、综合地质研究及勘探技术管理工作。

P631.81

A

猜你喜欢
测井资料数据库
本期广告索引
八扇区水泥胶结测井仪刻度及测井数据处理
Party Time
PAIRS & TWOS
JUST A THOUGHT
数据库
数据库
数据库
数据库
基于测井响应评价煤岩结构特征