运用机器学习和锆石微量元素构建花岗岩成矿潜力判别图解:以东昆仑祁漫塔格为例

2023-11-22 03:40郭广慧钟世华李三忠丰成友戴黎明索艳慧刘嘉情牛警徽黄宇薛梓萌
西北地质 2023年6期
关键词:图解锆石岩浆

郭广慧 ,钟世华,* ,李三忠 ,丰成友 ,戴黎明 ,索艳慧 ,刘嘉情 ,牛警徽 ,黄宇 ,薛梓萌

(1. 中国海洋大学,深海圈层与地球系统教育部前沿科学中心,山东 青岛 266100;2. 中国海洋大学,海底科学与探测技术教育部重点实验室,山东 青岛 266100;3. 中国海洋大学海洋地球科学学院,山东 青岛 266100;4. 青岛海洋科学与技术国家实验室,海洋矿产资源评价与探测技术功能实验室,山东 青岛 266100;5. 中国地质科学院勘探技术研究所,河北 廊坊 065000)

花岗岩是大陆地壳的最重要组成部分,也是Cu、Fe、Pb、Zn、W和Sn等许多金属矿产的重要来源(吴福元等,2007;王孝磊,2017;刘鹏等,2020)。因此,与花岗岩有关的研究一直是地质学家特别是矿床学家关注的焦点(Chappell et al.,1974;Pizarro et al.,2020;高利娥等,2021;Wade et al.,2022;牛警徽等,2023;Zhong et al.,2023a)。然而,具有成矿潜力的花岗岩仅占地球中已知花岗岩的极小一部分,而大多数地表出露的花岗岩并不能成矿。随着全球对金属矿产资源需求的不断增加,如何快速且准确识别花岗岩成矿潜力已经成为矿床学领域研究的热点(Richards et al.,2017;Pizarro et al.,2020;Zhong et al.,2021a;Zhu et al.,2022)。近年来,得益于成矿理论的发展和测试技术的提升,人们对花岗质成矿岩浆的特征及成因机制已取得了长足的认识,建立了大量识别成矿岩体的地球化学勘查指标及阈值(Zhong et al.,2019;Ballard et al.,2002)。其中,依据锆石成分识别花岗岩成矿潜力已成为当前最常用的手段之一(Zhong et al.,2021a)。这是由于锆石在花岗岩类岩石中广泛存在,并且形成后的地球化学成分几乎不受后期热液活动的影响(Shumlyanskyy et al., 2017),因而能真实反映岩浆源区特征,记录熔体在分异过程中的地球化学行为,从而对解译岩浆-热液系统演化历史具有十分重要的作用(Dempster et al.,2003;Hanchar et al.,2007;Dilles et al.,2015;Grimes et al.,2015)。此外,岩浆氧逸度、含水量以及结晶分异程度对岩浆成矿起着关键控制作用,前人研究发现锆石的Ce4+/Ce3+、Ce/Ce*、Eu/Eu*、Ce/Nd等特征可以很好地揭示以上这些信息(Ballard et al.,2002;Chelle-Michou et al.,2014;Zhong et al.,2019),这为从锆石角度识别岩体成矿能力奠定了理论基础。

随着研究的深入,人们发现许多地球化学指标并不具有普适性(Loader et al.,2017;Chiaradia,2020),这限制了基于锆石成分建立的找矿勘查方法的应用,也引发了关于矿床成因的争论(Du et al.,2020;Lee et al.,2020;Massimo et al.,2022)。以斑岩Cu矿床为例,锆石的Ce4+/Ce3+、Ce/Ce*、和Ce/Nd与岩浆氧逸度具有正相关性。由于斑岩Cu矿床通常被认为与高氧逸度岩浆有关,因而绝大多数研究认为这些比值越高,越有利于形成斑岩Cu矿化(Ballard et al.,2002;Chelle-Michou et al.,2014)。然而,近年来发现的一些还原型斑岩Cu矿床表明,成矿岩体有时也可以具有较低的氧逸度(Cao et al.,2014;Zhong et al.,2019;申萍等,2020),这导致在运用这些比值识别还原型斑岩Cu矿时会造成误判。此外,在以往研究中,前人大都是根据对成矿岩体的“已知认识”从而提出成矿岩体的判别方法,但考虑到成矿过程的复杂性,许多反映岩浆成矿能力的地球化学信息可能均尚未被揭露。换句话说,许多锆石微量元素与岩浆成矿能力之间可能存在着密切联系,对找矿勘查和认识矿床成因同样具有指示意义,但是由于在传统研究中没有发现这些内在联系,致使目前地球化学数据库中大量可以指示岩浆成矿能力的信息被忽视。此外,仅基于少数岩浆特征建立的地球化学勘查方法也容易受到其他因素干扰,引发误判。因此,为了更准确的识别花岗岩成矿潜力,需要借助新方法,挖掘一些在以往研究中可能被忽视的地球化学信息,提高成矿岩体识别时的准确性。

为此,笔者以东昆仑祁漫塔格成矿带为例,借助大数据和机器学习方法,通过对来自该成矿带斑岩—矽卡岩Cu—Fe—Pb—Zn矿床成矿岩体和全球非成矿岩体的锆石数据开展机器学习训练,挖掘一些新的能够反映岩浆成矿能力的地球化学指标。在此基础上,笔者构建了一系列基于机器学习的岩浆成矿潜力地球化学判别图解。将研究结果应用于东昆仑祁漫塔格地区找矿勘查,将有助于提高成矿预测准确性和找矿效率,降低人力、物力成本,从而更好的服务新一轮找矿突破战略行动。

1 区域背景

东昆仑造山带是位于青藏高原北部的一条巨型构造岩浆岩带,其东西长约为1 500 km,可以与冈底斯山脉相媲美(Zhong et al.,2018a;Zhong et al.,2021a)。该造山带北起柴达木盆地南缘,南至巴颜喀拉—松潘甘孜板块,东起秦岭—大别造山带,西至阿尔金造山带,并以乌图美仁乡为界大致可以分为东西两段(钟世华,2018)。东昆仑造山带经历了4个造山旋回,分别是前寒武纪、早古生代、晚古生代—早中生代和晚中生代—新生代旋回(Yu et al.,2020;Zhong et al.,2021b)。这些构造旋回记录了原特提斯洋、古特提斯洋以及新特提斯洋的形成、扩张和消亡过程(Zhong et al.,2021a)。除晚中生代—新生代旋回外,其他各个造山旋回都伴随着大量的岩浆活动,其中以晚古生代和早中生代(特别是三叠纪)的岩浆活动最为强烈(Zhong et al.,2021a)。祁漫塔格成矿带位于东昆仑造山带的东段,东西长约550 km,东起乌图美仁乡一带,西至阿尔金断裂,北与柴达木盆地相邻,西南与库木库里盆地相接(Zhong et al.,2018b)。祁漫塔格成矿带岩浆-构造活动频繁,成矿地质条件优越,是中国三叠纪金属矿产最重要的分布区之一(毛景文等,2012;钟世华等,2017a,2017b,2017c)。

祁漫塔格地区出露地层时代跨度大、分布零散,且大都经历了不同程度的后期改造(钟世华等,2017b)(图1)。研究表明,中元古界长城系小庙组和狼牙山组、奥陶系滩间山群以及石炭系缔敖苏组和大干沟组与区域上矽卡岩矿化关系密切,是主要的赋矿地层(丰成友等,2010;2011;高永宝,2013)。长城系小庙组主要为片岩和大理岩等,与区域上钨锡矿化关系密切(高永宝等,2012);蓟县系狼牙山组主要由碎屑岩及碳酸盐岩组成,夹少量火山岩(Zhong et al.,2017;Zhong et al.,2018b);滩间山群又被称为祁漫塔格群,为一套海相火山—沉积组合(张晓飞等,2012);大干沟组和缔敖苏组岩性较为类似,均是一套主要由灰岩组成的碎屑岩-碳酸盐建造(丰成友等,2012)。区内构造活动强烈,褶皱以轴向NWW向的复式背向斜构造为主,NWW、NW和近EW向断裂组成了主体构造骨架;不同级别和序次的断裂构造交汇聚合部位,往往是成岩成矿的有利部位,而NE和SN向断裂大多为成矿后构造(钟世华等,2017c)。祁漫塔格地区岩浆岩分布十分广泛,时代横跨前寒武纪到早中生代,岩性复杂多样,但以志留纪—泥盆纪(435~370 Ma)和中晚三叠世—早侏罗世花岗岩(245~196 Ma)最为发育(Zhong et al.,2021b),主要形成于该地区早古生代旋回和晚生代—早中生代旋回的(后)碰撞阶段(Zhong et al.,2021a)。基性—超基性岩仅在该地区呈零星分布,以辉绿岩脉最为常见(钟世华等,2017b)。

图1 祁漫塔格地质图(据Zhong et al.,2021b修改)Fig. 1 Geological map of Qimantagh

祁漫塔格成矿带是近几年查明的有较大找矿远景的斑岩—矽卡岩型Cu-Mo—Fe—Pb—Zn多金属成矿带(毛景文等,2012),代表性矿床有维宝、尕林格、虎头崖、野马泉、卡尔却卡、四角羊和肯德可克等。来自辉钼矿Re—Os和热液白云母Ar—Ar等的定年结果证实,这些矿床的形成大都与三叠纪花岗岩类岩体的就位有关(丰成友等,2011;田承盛等,2013;于淼等,2015;姚磊等,2015;Xia et al.,2015)。不过,近年来随着勘查和研究工作的深入,在祁漫塔格许多Cu—Fe—Pb—Zn多金属矿区发现含矿化的泥盆纪花岗岩,证实在该地区存在两期斑岩—矽卡岩多金属矿化(Zhong et al.,2021a)。除这些与花岗岩类有关的矿床外,与基性—超基性岩有关的铜镍硫化物矿床是该地区另一种重要的矿床类型,以夏日哈木超大型铜镍硫化物矿床为代表(Liu et al.,2018)。

2 数据收集和处理

2.1 数据收集

文中使用的成矿岩体锆石数据均来自祁漫塔格成矿带斑岩—矽卡岩矿床,包括矽卡岩Cu—Pb—Zn矿床、矽卡岩Fe矿床、矽卡岩Pb—Zn矿床以及斑岩Cu矿床。祁漫塔格成矿带虽然发育许多斑岩Mo矿床,这是目前尚未有来自这些矿床的锆石数据。此外,笔者也没有考虑来自白干湖等W—Sn矿床的锆石数据,一方面是由于来自这类矿床的锆石数据也很少,另一方面是由于W—Sn矿床的成因与Cu—Fe—Pb—Zn矿床有较大区别,成矿岩体的许多地球化学特征(如氧逸度)显著不同(另文讨论)。对于非成矿岩体的锆石数据,笔者则使用 Zou等(2022)汇编的数据库。使用这一数据库的好处是,它包含了国内外的非成矿岩体锆石数据,因此将使结果更具有代表性。具体的锆石数据来源见表1。

表1 文中使用的锆石微量元素数据来源统计表Tab. 1 Data sources of zircon trace elements used in this study

2.2 特征值选取和数据清洗

对每一条锆石数据, 笔者收集了21种特征用于后续机器学习训练,包括15种稀土元素(La、Ce、Pr、Nd、Sm、Eu、Gd、Tb、Dy、Ho、Er、Tm、Yb、Lu和Y)、Ti、Hf、Th、U以及Eu/Eu*和Ce/Ce*。其中,Eu/Eu*=(下标N代表球粒陨石均一化),Ce/Ce*则根据Zhong 等(2019)提出的方法计算获得。选择这些元素用于机器学习模型训练,是因为这些特征在文献中几乎均有报道,从而确保文中可以充分利用文献中已发表的数据。由于使用含有缺失特征的数据会导致机器学习训练结果出现偏差(Chawla,2002),必须确保用于机器学习训练的数据库中每条训练数据均报道了上面提及的21种特征。为了避免引入新的误差,除稀土元素外,含有缺失值的数据需要删除;对缺失部分稀土元素的数据,文中将采用文献中的通用做法进行处理,即缺失的稀土元素可由其相邻的2个稀土元素经内插法获得。此外,许多轻稀土富集的锆石是由于包裹体混染等导致的,文中使用Zou等(2022)提出的La<0.1×10—6筛选出干净的岩浆锆石数据。文中共收集了723条锆石微量元素数据,其中包括343条来自成矿岩体的锆石数据和380条来自非成矿岩体的锆石数据。

笔者汇编了锆石微量元素数据库的统计学特征(表2,图2)。来自成矿岩体的锆石Ti含量变化范围大,为0.02×10—6~41 919.34×10—6;La、Ce、Pr含量变化范围小,分别为0.01×10—6~0.10×10—6、2.12×10—6~60.09×10—6和0.01×10—6~1.16×10—6;Nd和Sm含量变化范围也较小,分别为0.13×10—6~14.04×10—6和0.25×10—6~25.14×10—6。来自成矿岩体的锆石Eu含量变化也较小,为0.02×10—6~7.44×10—6。成矿岩体的锆石的重稀土元素变化范围普遍较大,通常跨越2个数量级。其中,Gd值为1.37×10—6~238.00×10—6,Tb值为1.93×10—6~114.74×10—6,Dy值为0.63×10—6~34.61×10—6,Ho值为10.47×10—6~403.30×10—6,Er值为4.40×10—6~147.61×10—6,Tm值为24.00×10—6~702.98×10—6,Yb值为5.53×10—6~146.39×10—6,Lu值为60.20×10—6~1 317.17×10—6,Y值为15.21×10—6~279.95×10—6。相对于稀土元素,成矿岩体的锆石Hf、U、Th变化范围也较大,分别为6 422.50×10—6~13 873.25×10—6,56.35×10—6~2 249.59×10—6以及17.93×10—6~1 716.13×10—6;Eu/Eu*值为0.03~0.77,Ce/Ce*值为57.52~6 997.36。

表2 两种类型锆石的成分特征统计表(10-6)Tab. 2 The compositional characteristics of the two types of zircon compiled in this paper (10-6)

图2 文中用于训练的两种类型锆石的21种特征箱状图Fig. 2 Box illustrations of the 21 features of the two types of zircon used for training in this paper

与成矿岩体的锆石相比,来自非成矿岩体的锆石Ti含量明显减小,平均值为17.02×10—6。La含量平均值为0.04×10—6,与成矿岩体的锆石相比略低;Ce和Eu含量与成矿岩体的锆石相似,平均值为19.31×10—6和0.95×10—6;Pr、Nd、Sm等3种轻稀土元素含量较成矿岩体的锆石高(表2),其平均值分别为0.15×10—6、2.55×10—6和5.36×10—6。非成矿岩体的锆石的Gd、Tb含量较成矿岩体的锆石小,其平均值分别为29.39×10—6和10.30×10—6;Dy、Ho、Er、Tm、Yb、Lu、Y含量与成矿岩体的锆石有明显差异,平均值分别126.92×10—6、48.02×10—6、218.29×10—6、47.57×10—6、468.36×10—6、84.07×10—6和1 429.95×10—6。来自非成矿岩体的锆石的Hf、Th、U含量与成矿岩体的锆石较为相近,其平均值为11 348.72×10—6、465.07×10—6、284.17×10—6;与Eu、Ce特征一致,非成矿岩体的锆石Eu/Eu*和Ce/Ce*含量明显低于成矿岩体的锆石(表2)。综上所述,成矿岩体和非成矿岩体的锆石微量元素在分布范围上虽然存在不同程度的重合,但是也表现出不同的变化趋势,从而表明利用这些元素开展花岗岩成矿潜力评价在理论上是可行的。

3 基于机器学习的决策边界图解构建

机器学习模型目前已被广泛用于解决地球科学中的分类问题(Bergen et al.,2019)。在这些方法中,支持向量机(Support Vector Machine,简称SVM)是当前使用最多、最有效的方法之一(Petrelli et al.,2016;Petrelli et al.,2020)。支持向量机是由Vapnik等人于1995年提出(Cortes et al.,1995),原理是寻找一个满足分类要求的最优分类超平面,使得该超平面在保证分类精度的同时,能够使超平面两侧的空白区域最大化(顾亚祥等,2011)。支持向量机是通过最大化分类超平面到最近样本点的距离来选择决策边界(图3)。相对于其他机器学习模型(如神经网络),支持向量机不需要对数据进行复杂的特征转换和处理,这使得我们的模型变得更加简单和高效。此外,支持向量机即使在样本较少的情况下,也能取得较好的分类效果,这使得支持向量机在面临小样本场景时成为一种有吸引力的选择(程学旗等,2014)。

图3 支持向量机模型原理图Fig. 3 Support Vector Machine model schematic

根据排列组合规则可知,选择21个锆石特征中任意两个作为端元,共可以构建210个二元图解。不难预测,大部分图解将无法有效区分成矿岩体和非成矿岩体,因此无需对所有二元图解的决策边界进行计算(王瑀等,2022)。为此,笔者首先利用支持向量机算法和全部21个锆石特征,训练得到一个基于21个锆石特征的支持向量机模型;然后,利用机器学习解释性算法——SHAP(SHapley Additive exPlanations),获得对分类结果影响最大的5个特征;最后,再以它们中任意2个特征作为端元计算二元图解的决策边界即可。SHAP模型由Lundberg等于2017年提出,其主要思想来自于组合博弈论中的Shapley值,用于解决机器学习的“黑匣子”问题。SHAP方法以SHAP值来计算各个特征重要性以及对预测结果的贡献。

为定量评估模型的表现,训练前笔者将数据集拆分为训练集和测试集,并确保每个数据集中各类别的数据比例相同,这样可以使模型在训练和测试过程中对各个类别的样本都有足够的学习和评估机会,避免类别不平衡导致的偏差(Zhong et al.,2023b)。具体地,文中将数据集(n=723)按8∶2的比例随机分为训练集(n=578)和测试集(n=145)。训练过程中,对训练集采用5倍交叉验证评估模型表现,并根据模型得分寻找最优参数。最后,利用模型表现最优时的参数,计算获得测试集的准确率,用于评估模型的最终表现。

4 研究结果

4.1 SHAP值特征

图4展示了将21个锆石特征全部作为训练输入特征时,得到的支持向量机模型的SHAP值结果。某一特征在图中的位置越靠上,表示该特征对输出结果的影响越大。可以看出,利用支持向量机模型识别来自成矿岩体和非成矿岩体的锆石时,对输出结果影响最大的5个特征是Gd、Dy、Yb、Y和Tm,其次是Lu、Er、Tb、Ho和Eu/Eu*。相比于以上10个元素,Eu、Sm、Nd、La、Ti和Pr对输出结果的影响程度较低,而对成矿潜力判别最不重要的5个元素是Th、U、Ce、Ce/Ce*和Hf。

图4 支持向量机模型的SHAP值图Fig. 4 SVM method based SHAP plot

在图4中还可以看出各个特征对模型预测的影响。对于每一个特征,颜色越红,代表特征值越大,颜色越蓝,代表特征值越小。此外,SHAP值为正,意味着该特征变量对模型的预测值有一个正向的影响,即该特征变量越有可能导致被预测成为成矿岩体;SHAP值为负,意味着该特征变量对模型的预测值有一个负向的影响,即该特征变量越有可能导致被预测成为非成矿岩体。不难发现,Gd、Dy、Yb、Y和Er表现出类似的规律,均是值越低,越有可能导致预测结果是成矿岩体。Tm则正好与之相反,表现为值越高,越有可能导致预测结果是非成矿岩体。Lu、Tb、Ho、Eu/Eu*和Eu表现出与Tm类似的特征。其余元素(如Hf),其SHAP值集中在0附近,意味着其对结果没有明显的影响。

4.2 二元图解构建

Gd、Dy、Yb、Y和Tm对支持向量机训练模型的输出结果影响最大,因此文中使用以上5个锆石特征进行了二元图解构建。选择5个特征中任意2个作为端元,共可构建10个二元图解,结果见图5。在图5中,不但显示了计算获得的支持向量机模型的决策边界及对应的准确率,还显示文中汇编的(亦即训练使用的)所有锆石数据。可以看出,10个二元图解在区分成矿岩体和非成矿岩体时的准确率均很高,为0.99~1。此外,视觉审查也可以发现,在每一个二元图解中,来自成矿岩体和非成矿岩体的锆石几乎均很好的落入了决策边界两侧对应的区域。

此外,从10个二元图解可以看出,来自成矿岩体的锆石通常表现为Gd、Dy、Yb和Y值比较低,而Tm值则比较高;来自成矿岩体的锆石则正好与之相反,它们的Tm趋向于低值而其余4个特征趋向于高值。这些规律与SHAP值的结果是完全一致的(图4)。以上这些结果共同表明,文中构建的10个二元图解能够有效地区分来自成矿岩体和非成矿岩体的锆石。

5 讨论

5.1 与以往方法对比

文中利用支持向量机模型,选取Gd、Dy、Yb、Y和Tm等5个锆石微量元素特征构建了10个用来识别成矿岩体和非成矿岩体的决策边界图(即二元判别图解)。综合模型的准确率(0.99~1)和决策边界图的视觉审查,可以看出10个二元图解可以很好的将成矿岩体和非成矿岩体区分开来。为了进一步证明文中新提出的二元图解有效,图6展示了来自祁漫塔格成矿带成矿岩体和非成矿岩体的锆石在以往提出的锆石Eu/Eu*~Ce/Ce*图解上的分布情况。可以看出,尽管总体上成矿岩体呈现出更高的锆石Eu/Eu*和Ce/Ce*含量,但是成矿岩体和非成矿岩体锆石的成分范围存在明显重叠,显示传统方法难以有效区分祁漫塔格成矿带斑岩系统的成矿岩体和非成矿岩体。

图6 祁漫塔格成矿带成矿岩体和非成矿岩体的锆石Eu/Eu*-Ce/Ce*图解Fig. 6 Zircon Eu/Eu* vs. Ce/Ce* diagram from mineralized and barren rocks from the Qimantagh metallogenic belt

然而,以上获得的决策边界图的准确率可能被高估,这在许多研究中已被提及(韩亚楠等,2022;Nathwani et al.,2022)。这是由于在模型训练时,笔者通常会随机抽取数据库的一部分数据用于训练,而将剩余的数据用于测试。然而,这些用于测试的数据与训练数据必然存在一部分来自相同数据源,从而导致基于测试集获得的模型评价指标得分明显偏高。为了真实反映机器学习模型的准确率,文中引入独立验证,即用在训练数据库中没有涉及的36条来自祁漫塔格斑岩Cu矿的锆石数据进一步检验新提出的10个二元判别图解。从图7中可以明显看出,这些锆石数据全部落入了10个二元图解的成矿岩体区域。该结果进一步证明文中构建的10个二元判别图解在成矿潜力预测时具有良好的稳定性和有效性。

5.2 存在问题和展望

文中研究结果表明,充分利用好锆石大数据和机器学习,将可以为祁漫塔格成矿带与花岗岩类有关矿床的找矿勘查提供理论指导,大大减少传统找矿勘查的人力、物力和时间成本,提高找矿效率。这对运用其他副矿物成分开展花岗岩成矿潜力评价、指导找矿勘查也具有重要指导意义。不过,在应用文中提出的锆石二元判别图解时,为了获得可靠的分类结果,需要注意其应用的范围和前提条件。此外,当前的研究仍存在一些不足,为了进一步提高判别图解的准确性,并充分挖掘锆石在花岗岩成矿潜力判别中的作用,未来还需要在多个方面加强研究。

(1)需要加强对热液、变质和岩浆成因锆石的研究。只有岩浆成因的锆石才能用于判别花岗岩成矿潜力。一些来自热液矿床的锆石可能遭受了热液或变质事件的影响,导致许多锆石事实上并不能用于花岗岩成矿潜力评价。然而,如何区分岩浆锆石、热液锆石和变质锆石还存在很大的争议。此外,即便对于岩浆成因锆石,由于包裹体的存在,也会导致分析获得的锆石数据存在异常。如果将文中提出的二元判别图解用于非岩浆成因或受包裹体混染的锆石,可能会导致严重的误判。因此,在未来的研究中,为了提高对成矿岩体判别的准确性,需要进一步加强对热液、变质和岩浆成因锆石特征的研究。

(2)需要加强对来自更多矿床类型以及祁漫塔格以外地区成矿花岗岩中锆石的研究。文中所搜集的成矿岩体锆石数据全部来自东昆仑祁漫塔格地区,通过笔者的训练结果可以看到,新提出的二元判别图解在应用于祁漫塔格地区时表现优异。但是,机器学习方法依赖于可靠的、充分的训练数据,笔者所收集的数据来源较单一,并且数据量有限,这些因素都可能会影响模型的性能和可靠性。因此,文中获得的二元图解主要适用于祁漫塔格成矿带及其周边地区斑岩-矽卡岩Cu-Fe-Pb-Zn矿床的找矿勘查,不能应用于其他类型矿床的成矿岩体识别(如矽卡岩W-Sn矿)。此外,若将这些图解应用于其他地区花岗岩成矿潜力评价时需要谨慎,必须结合其他地质、地球物理和地球化学资料综合评判。在未来的研究中,为了提高基于机器学习方法建立的二元图解的应用范围,需要充分收集来自其他地区以及其他矿床类型的锆石数据,将其应用于机器学习模型训练。

(3)需要提醒的是不能单纯依靠一个图解就判断花岗岩能否成矿,而必须综合考虑所有二元图解。文中提出的10个二元判别图解可以正确的判别大部分花岗岩的成矿潜力,且独立验证结果进一步表明了这一结论。但是不能忽视的是,在自然界中,单一的地球化学元素,极易受到外界干扰,所以使用单一的二元图解可能会导致误判。为降低误判风险,建议联合使用本文提出的10个二元判别图解,从而提高结果的准确性和可靠性。

6 结论

(1)利用汇编的来自祁漫塔格成矿带斑岩-矽卡岩Cu-Fe-Pb-Zn多金属矿床成矿岩体和全球非成矿岩体的锆石微量元素数据,借助支持向量机算法和机器学习解释性算法,挖掘能够反映岩浆成矿能力的锆石微量元素特征,并在此基础上构建花岗岩成矿潜力判别图解。

(2)模型训练结果显示,在21个常见的锆石微量元素特征中,Gd、Dy、Yb、Y、Tm等5种元素特征对识别岩浆成矿能力最为重要;在此基础上,文中新提出了10个基于锆石成分的二元判别图解,它们在识别成矿岩体和非成矿岩体时的准确率均接近1。

(3)研究表明,利用机器学习方法和地质大数据,可以挖掘传统研究方法难以发现的新的地球化学指标和图解,这对深入认识矿床成因、指导找矿勘查具有重要意义。

猜你喜欢
图解锆石岩浆
俄成功试射“锆石”高超音速巡航导弹
岩浆里可以开采出矿物质吗?
火山冬天——岩浆带来的寒冷
图解十八届六中全会
红锆石
西准噶尔乌尔禾早二叠世中基性岩墙群LA-ICP-MS锆石U-Pb测年及构造意义
锆石微区原位U-Pb定年的测定位置选择方法
图解天下
岩浆转化机
九顶山铜钼多金属矿区岩浆侵入期次和成矿作用