基于光谱能级匹配的支持向量机蚀变信息提取

2014-08-03 02:39于浩何浩常玲孙卫东
遥感信息 2014年2期
关键词:超平面训练样本能级

于浩,何浩,常玲,孙卫东

(1.新疆维吾尔自治区地质矿产勘查开发局信息中心,乌鲁木齐 830000;2.新疆大学 建筑工程学院,乌鲁木齐 830047)

1 引 言

遥感蚀变信息是指从遥感数据中提取的、可能与成矿围岩蚀变矿物有关的一种量化微弱信息,在区域地质制图和找矿中应用成效显著,尤其是在一些地质工作程度较低的偏远地区,能大大地减少野外工作量。比值法与主成分分析法是目前遥感矿化蚀变信息提取的常用方法[1-3]。但这些方法主要着眼于增强处理,以求目视效果,在背景与噪声的干扰下,蚀变信息的增强效果并不理想[4]。

近年来出现的一些方法如:小波分析、神经网络、分数维几何(分形或分几)等,由于受样本数目和维数的限制,得到的结果常常不能令人满意。支持向量机(SVM)是一种基于统计学理论的机器学算法,在解决有限样本、非线性及高维模式识别问题中表现出许多特有的性能,并且具有强大的泛化能力[5-6]。但支持向量机算法本身是一种有监督学习方法,需要一定数量的训练样本,对遥感蚀变信息而言,训练样本选取的方法主要通过野外实地调查,然后在遥感影像上,利用准确的界线建立感兴趣区,选取训练样本。光谱能级匹配是通过同时度量两个光谱之间的大小和形状来判定光谱相似性的,而传统的光谱相似性度量方法(如:欧氏距离、相关系数、光谱角等)只计算两个光谱之间的大小(亮度)或形状。因此本文提出了一种基于光谱能级匹配(SEM)的支持向量机(SVM)遥感矿化蚀变信息提取算法,并在新疆西昆仑库斯拉甫一带将该方法与传统方法进行应用对比,探索一种适合研究区的遥感蚀变信息提取和识别方法。

2 研究区地质概况

研究区位于西昆仑山脉北坡山前地带,属高山区,总体地势西高东低,其大地构造单元包括塔里木地块和西昆仑构造带,该地区山势雄伟,地形切割剧烈,平均海拔在3500m以上。叶尔羌河自西向东穿越研究区,植被稀疏,主要分布于河道两侧。研究区出露主要地层有泥盆系、石炭系、二叠系,侏罗系、白垩系,古近系,新近系和第四系,处于西昆仑塔木—卡兰古铅锌铜成矿构造带,目前发现的矿产主要赋存在一套陆棚海相碎屑岩和碳酸盐岩层中,分别是中泥盆统克孜勒陶组(D2k)、上泥盆统奇自拉夫组(D3q)、下石炭统卡拉巴西塔克组(C1k1)、下石炭统和什拉甫组(C1h)及克里塔格组(Clk)。其中下石炭统卡拉巴西塔克组(C1k1)与和什拉甫组(Clh)是铅—锌矿带主要赋矿层,其下部为碎屑岩,与白云岩、灰岩和生物屑灰岩共生,上部为灰岩[7-8]。区内深大断裂极为发育,走向以北西向和南北向为主,主要的区域性深大断裂有西昆仑山前断裂、康西瓦断裂。

图1 研究区区域地质图(根据1∶25万地质图修编)

3 基于光谱能级匹配的支持向量机算法

3.1 光谱能级匹配法

光谱能级匹配法(Spectral Energy level Matching,SEM)是谱带强度与波形特征相结合的产物,主要包括平均谱带强度相似度和光谱波形特征相似度两部分,可以减少异物同谱的现象[9]。

(1)平均谱带强度相似度

平均谱带强度相似度是参考光谱与像元光谱的平均谱带强度的相对误差与1的差,反映了参考光谱与像元光谱间的总体相似性。表达式为:

其中,ipavg表示像元光谱的平均值,rpavg表示参考光谱的平均值,表达式分别为:

其中,I ij表示像元光谱中第j个波段的谱带强度,I dj表示参考光谱中第j波段的谱带强度,m是波段个数。

(2)光谱波形特征相似度

光谱波形特征反映了参考光谱与像元光谱间的局部波形相似性。通过快速排序法分别对参考光谱与像元光谱按谱带强度从小到大进行排序,将排序后相应谱带强度的波段位置分别记录在rarr和iarr数组中。假设循环向量长度为m,判断数组rarr和iarr中同一位置的波段位置是否相等,并记录相等的数量n,n与m的比值表示光谱波形特征相似度(wSim),表达式为:

(3)总相似度

总相似度(Sim)是谱带强度相似度与波形特征相似度的乘积,表达式为:

3.2 SVM基本原理

支持向量机(SVM)是在统计学习理论的基础上发展起来的一种新型机器学习算法,它利用核函数将样本非线性映射到高维空间里,在这个空间里建立一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面,建立方向合适的分隔超平面使两个与之平行的超平面间的距离最大化。如图2所示,图中实心点和空心点代表两类样本,H为分类超平面,H1、H2为与分类超平面平行的分隔超平面,他们之间的距离叫做分类间隔(Margin),分隔超平面间的距离或差距越大,分类器的总误差越小。

图2 支持向量机的基本思想

支持向量机采用核函数巧妙地解决了由低维空间向高维特征空间映射的问题。对于满足Mercer条件的核函数K(xi,xj),最优分类函数是:

常用的核函数主要有:多项式核函数、RBF径向基函数、Sigmoid核函数等。核函数的选择决定了特征空间的结构,选择的好坏直接影响到算法的实现与效果。在实际应用中常常对每一种核函数采用网格搜索的方法,做交叉验证,求得该核函数对应的最佳参数。

3.3 基于SEM的SVM算法

研究区ASTER数据获取时相为2004年9月12日,级别为L1B,图像云量少,质量佳。对其进行大气纠正,对干扰数据进行掩模处理,将预处理的影像进行成员提取及归一化处理,分析成员光谱,结合研究区矿化信息提取蚀变矿物光谱,并作为参考光谱。随后的算法描述如下:

(1)计算影像中每个像元光谱与每类参考光谱之间的光谱能级值,并设定一个初始阈值,既要保证采集到足够的训练样本,又要保证训练样本与提取目标的最大相似性;

(2)如果某类的训练样本数未达到所需的样本数,则重新调整阈值,执行(1);

(3)利用提取的训练样本集应用 Crossvalidation算法确定最优SVM模型参数;

(4)根据最优SVM模型参数训练SVM分类器模型;

(5)采用训练好的SVM模型对整个遥感影像进行蚀变信息提取。

具体算法流程见图3。

4 实验结果及分析

4.1 算法应用对比

选取PCA主成分分析法和本文方法分别提取铁化、泥化和碳酸盐化,对提取的结果进行叠合,二者进行对比并相互佐证,使得结果更加可靠。

(1)用常规的 PCA(ASTER1,2,3,4)、PCA(ASTER 4,6,7,9)和 PCA(ASTER 1,3,4,8)提取“铁化”、“泥化”和“碳酸盐化”信息,其结果如图4(a)所示。

(2)在选取的成员光谱处采集样本光谱,用本文方法提取上述蚀变信息,总相似度值设为0.86(该阀值最大设置为l,为尽可能减少假异常,本文设置的阀值相对较高),其结果如图4(b)所示。

4.2 结果分析

图4 遥感蚀变信息提取结果对比

由于PCA方法是对ASTER图像原始波段的线性组合分析,各主分量中所包含的方差很小的面状异常信息,许多是由噪声引起的;加之受波谱分辨率和密度分割阈值的影响,PCA结果中常包含干扰异常。对比图4可以看出,用PCA方法提取的遥感蚀变信息中干扰异常较多,且3类蚀变在空间上存在重叠现象。“铁化”信息受高亮度岩体影响较大,而“泥化”信息受第四系冲积物影响较大,“碳酸盐化”二者提取的分布情况较为相似。

综合分析各类异常信息的叠加结果,可以发现遥感蚀变信息与地层的走向吻合性好。“碳酸盐化”蚀变在下石炭统和什拉甫组(C1h)灰岩地层较为普遍,影像上为青白色调,呈南北向带状分布,与卡兰古铅锌矿所处的碳酸岩矿化蚀变带基本一致。该区的几个重要矿床,如卡兰古、阿巴列克、托库孜阿特等铅、锌、铜矿均产自碎屑岩与灰岩过渡层,因此,这套灰岩对于该区铅锌矿的成矿具有重要的指示意义,可作为铅锌矿化的找矿标志之一。野外调查显示(图5(a)),该地层岩性为碎屑灰岩,生物化石限定其时代为早石炭世,划分为下石炭统和什拉甫组(C1h),与西侧上泥盆统奇自拉夫组(D3q)石英砂岩呈假整合接触,具有不同程度的角砾岩化特征,进一步印证了该区由碎屑岩向灰岩过渡的矿化富集过程。“铁化”蚀变信息主要位于研究区叶儿羌群(J1-2y),呈黄色调,界限清晰,近南北向分布。野外调查显示(图5(b)),该地层岩石为色调上以灰色为主,含砾砂岩夹细砂岩,岩石固结程度较低,表面风化破碎较强,局部具有褐铁矿化特征。“泥化”蚀变信息在研究区广泛分布,呈带状以细脉或团块的形式分布,在影像上表现为以深灰-灰绿色为基本色调。图5(c)显示库斯拉甫断层以东的褶皱处绿泥石化和高岭土化的特征,与之平行呈近南北向展布;同时,赋存于塔哈奇组(C2t)的火山碎屑岩和砂岩中广泛存在泥化现象(图5(d)),说明在该区中低温热液活动广泛,这与该多金属矿体的形成有重要联系。

图5 野外调查照片

5 结束语

(1)本文提出的基于光谱能级匹配的支持向量机遥感矿化信息提取方法,克服了传统方法应用中受样本数目以及维数的限制,光谱能级匹配能够同时度量谱带强度和光谱波形特征,因此可以减少异物同谱的现象,更有利于从背景信息中分离目标信息。

(2)通过与常规方法提取的蚀变信息的对比,本文提取的蚀变信息与地层的走向吻合性好,有效地克服了干扰异常的影响。

(3)结合地质资料及野外查证,“碳酸盐化”的提取能够较好的描绘该区灰岩的分布特征,这套灰岩对该区铅锌矿的成矿具有重要的指示意义,可作为铅锌矿化的找矿标志之一。

(4)研究区地层互层现象较为普遍,受ASTER数据空间分辨率所限,一些矿化蚀变信息无法识别在所难免。此外,光谱能级匹配中阈值的设定需要结合经验和实地调查,才能设计出与实际情况更相适合的提取方法。

[1]张玉君,曾朝铭,陈薇.ETM+(TM)蚀变遥感异常提取方法研究与应用:方法选择和技术流程[J].国土资源遥感,2003,(2):44-49.

[2]王亚红,王永,王辉,等.利用ETM数据进行矿化蚀变信息提取的方法研究:以柴北缘地区为例[J].遥感信息,2009(6):68-72.

[3]荆凤,陈建平.矿化蚀变信息的遥感提取方法综述[J].遥感信息,2005(2):1-4.

[4]傅文杰,洪金益,朱谷昌.基于SVM 遥感矿化蚀变信息提取研究[J].地质与勘探,2006,46(2):69-73.

[5]VAPNIK V N.The Nature of Statistical Learning theory[M].New York:Springer Verlag,1995.

[6]VAPNIK V N.Statistical Learning theory[M].New York:Wiley,1998.

[7]辛存林,都卫东,魏明,等.新疆西昆仑地区塔卡提铅锌矿地质特征与成矿远景[J].兰州大学学报(自然科学版),2012,48(1):20-34.

[8]胡庆雯,朱红英,周圣华.新疆塔木一卡兰古铅一锌(铜)矿带区域控矿条件[J].矿产与地质,2007,21(5):551-554.

[9]王钦军,蔺启忠,黎明晓.一种突出目标的多光谱遥感信息提取方法[J].光谱学与光谱分析,2009,29(4):1018-1022.

猜你喜欢
超平面训练样本能级
全纯曲线的例外超平面
涉及分担超平面的正规定则
提升医学教育能级 培养拔尖创新人才
纠缠Ξ-型三能级原子与纠缠腔场相互作用熵的纠缠演化
人工智能
以较低截断重数分担超平面的亚纯映射的唯一性问题
涉及周期移动超平面的全纯曲线差分形式的第二基本定理
光谱、能级和能级图的理解和应用
宽带光谱成像系统最优训练样本选择方法研究
基于稀疏重构的机载雷达训练样本挑选方法