基于多层支持向量机的极化合成孔径雷达特征分析与分类

2017-04-17 05:13谢欣芳
计算机应用 2017年1期
关键词:子集特征分析极化

宋 超,徐 新,桂 容,谢欣芳,徐 丰

(武汉大学 电子信息学院,武汉 430072)

(*通信作者电子邮箱xinxu@whu.edu.cn)

基于多层支持向量机的极化合成孔径雷达特征分析与分类

宋 超,徐 新*,桂 容,谢欣芳,徐 丰

(武汉大学 电子信息学院,武汉 430072)

(*通信作者电子邮箱xinxu@whu.edu.cn)

为了充分利用极化合成孔径雷达(SAR)图像不同极化特征对不同地物目标类型的刻画能力,提出一种基于多层支持向量机(SVM)的极化SAR特征分析与分类方法。该方法首先通过特征分析确定适合不同地物类型的最佳特征子集;然后采用分层分类树的方式,根据每一种地物类型的特征子集逐层进行SVM分类;最终得到整体分类结果。RadarSAT-2极化SAR图像分类实验结果表明所提方法水域、耕地、林地、城区4类地物分类精度为85%左右,总体分类精度达到86%。该算法充分利用了不同地物目标类型的特性,提高了分类精度,也降低了算法时间复杂度。

极化合成孔径雷达图像;地物目标特征分析;多层支持向量机;监督分类

0 引言

合成孔径雷达(Synthetic Aperture Radar, SAR)是一种主动微波成像雷达,能够不受云层等自然不良天气的影响获取地表数据。极化SAR相对于单极化SAR,其地物目标信息更加丰富,能更好地应用在分类等领域。

极化SAR的监督分类方法主要使用“特征+表达+分类器”的模式。极化SAR的特征主要来源是目标分解。目标分解的概念是由Huynen[1]首次提出,其目的是得到切合实际的物理约束解译目标的散射机制,使之更好地表征极化SAR数据。之后随着极化SAR研究[2-7]的不断深入,其分解方式也越来越多,如图1所示。

分类器作为图像分类最重要的组成部分之一。在光学图像中运用成熟的各种分类器也在逐步结合不同的目标分解方法应用于极化SAR图像分类中。目前主要的分类器包括:贝叶斯选择[8-9]、马尔可夫随机场(Markov Random Field, MRF)[10]、支持向量机(Support Vector Machine, SVM)[11-13]等。其中比较有代表性的就是SVM分类器。SVM分类器在小训练样本情况下有良好的分类性能,相比其他分类器,更适合应用于极化SAR图像分类。本文也是采用SVM分类器进行分类。

由于极化SAR图像的某些特征具有相似的物理意义,直接利用全部特征进行分类会带来严重的维数灾难,故需要根据具体的应用需求对特征进行有效的表达,如文献[14]针对城区建筑密度提出基于极化特征共生矩阵的城区分类方法。解决这一问题的常规方法是特征选择。文献[15]提出一种wrapper特征选择方法用于森林地物SVM分类;文献[16]通过特征线性判别分析(Linear Discriminant Analysis, LDA)对近200维的特征进行优选,提出一种面向对象的极化SAR 分类方法。文献[17]通过最小冗余最大关联(minimum Redundancy and Maximum Relevance, mRMR)特征选择算法[18],利用互信息量来衡量特征之间的相关性和冗余度,利用信息差和信息熵进行特征选择。

图1 极化特征

虽然这些方法能够在一定程度上解决维数灾难的问题,分类效果也有了较大的改进,但是并没有充分考虑不同地物的典型特点,并不适用于复杂的应用场景。

基于上述问题,本文提出一种基于多层SVM的极化SAR特征分析与分类方法。该方法充分利用不同极化特征对不同地物类型的刻画能力,选择适合每一类地物类型具有足够区分能力的特征子集,分层特征表达,使之更有效地表征地物类型。

1 地物目标特征分析

通过地物目标特征分析可以得到描述某类地物目标比较好的特征子集,使该类地物可以取得更好的监督分类结果。

实验数据1为荷兰Flevoland省Radarsat-2极化SAR数据,图像时间为2008年,图像大小为1 400×1 200,图像分辨率为8 m,如图2所示。实验数据2为加拿大Vancouver市 Radarsat-2极化SAR数据,图像大小为2 600×1 600,图像分辨率为8 m,如图3所示。

图2 Flevoland实验数据

实验数据中主要的地物类型为水域、耕地、林地和城区。主要研究的极化特征包括:极化相干矩阵分量幅值|Tij|(0

图3 Vancouver实验数据

得到地物类型具有足够区分能力的特征子集来源主要包括两个方面:一方面是极化SAR特征的物理意义及其特性,使得特征与地物类型之间存在对应关系;另一方面是具体考察特征直方图类间的区分能力,直接建立地物类型和极化特征的关联关系,构造地物的具有足够区分能力的特征子集。

1.1 水域

水域主要包括海洋、河流和湖泊。根据地物目标特征分析得到水域和其他地物区分明显的特征包括:|T22|、|T23|、|T33|、P3、C1mHA、CSERD。其特征如图4所示,样本直方图如图5所示。

图4 Flevoland水域特征子集特征

其中,C1mHA是在Cloude分解中的极化熵H和极化散射各向异性度A组合生成的新特征,具体计算式见式(1),可以从理论上解释C1mHA对水域有效的原因。当极化熵H值较低时可以认为是弱去极化,低熵散射一般发生在海洋地区。而各向异性度A较高说明λ2和λ3差别较大,在城区和海区混合了中等和较高的各向异性度。

C1mHA=(1-H)A

(1)

从特征图和样本直方图中可以看出,上述6维特征能够有效区分水域和其他地物类型。

1.2 耕地

耕地主要包括旱地、水田等。根据地物目标特征分析得到耕地和其他地物(不包括水域)区分明显的特征包括:α、CPR、P1、P2、C1mH1mA=(1-H)(1-A)、φρHH-HV(线性极化相关系数ρHH-HV相位)。其特征如图6所示,样本直方图如图7所示。

从理论分析,平均散射角α与平均物理散射机制直接相关。具体见式(2)。其中Pk是伪概率,αk是特征矢量参数。较低的α出现在水域和耕地区域,表示单次散射是主要散射机制,中等或者较高的α值出现在城区和园林地区。这样在没有水域的区域就容易将耕地和其他两类地物进行区分。

(2)

从特征图和样本直方图分析,上述6维特征在无水域情况下,可有效区分耕地区域和林地、城区。

通过上述理论公式和特征图分析发现,并不存在单独区分耕地区域的特征,但是在无水域情况下,较容易区分耕地和其他地物。

图5 Flevoland水域特征子集样本直方图

图6 Flevoland耕地特征子集特征

1.3 林地、城区

林地主要指植被高度比较高的植被区,城区主要指的是人工建筑区。根据地物目标特征分析得到林地和城区区分明显的特征包括:A、RρRR-LL(圆极化相关系数ρRR-LL实部)、|ρRR-LL|(圆极化相关系数ρRR-LL幅值)、CHm1mA=H(1-A)、CRVI、P3。其特征如图8所示,样本直方图如图9所示。

从理论分析,各向异性度A反映特征分解得到的第二个、第三个特征值的相对大小,具体表达形式见式(3)。各向异性度在海洋和园林区域中较低,在城区和沿海地区较高。比较容易区分林地和城区;圆极化相关系数ρRR-LL是处理当同极化和交叉极化相关系数为0时无法描述非对称目标的情况所构建的相关系数,具体见式(4)。文献[20]证明圆极化相关系数对区分林地和城区是有效的。

(3)

(4)

从特征图和样本直方图分析,上述6维特征对林地城区有较好的可分性,但是如果掺杂其他地物则容易出现错分。

通过对特征图和样本直方图的分析,可以得到如下结论:

1)|T22|、|T23|等特征可以单独区分水域和其他地物(耕地、林地、城区)。

2)在无水域地物的情况下,α、CPR等特征可以区分耕地和其他地物(林地、城区)。

3)在无其他地物的情况下,A、RρRR-LL等特征可以区分林地和城区地物。

2 基于多层SVM的极化SAR特征分析与分类

基于多层SVM的极化SAR特征分析与分类方法的流程如图10所示。主要针对地物目标类型包括:水域、城区、林地和耕地。

图7 Flevoland耕地特征子集样本直方图

图8 Flevoland林地城区特征子集特征

图9 Flevoland林地城区特征子集样本直方图

图10 基于多层SVM的极化SAR特征分析与分类方法流程

2.1 预处理:轮廓检测和分级图像分割算法

轮廓检测和分级图像分割算法是Arbelaez等[19]于2011年提出的。该算法使用一种结合局部和全局信息的高性能边缘检测器——gPb算子来提取场景轮廓,其基于谱聚类将多尺度局部亮度、颜色、纹理四个通道的信息融入到全局框架中,并定义关联矩阵来表征图像块的相似度,使用全局化分类器优化局部线索。在此基础上,该方法引入方向分水岭变换(OrientedWatershedTransformation,OWT)从有向轮廓信息中构造初始化区域集合,然后使用聚类算法得到超度量等高线图,各个尺度上每条边缘的权重由轮廓线在尺度上的相对频率决定,最后根据阈值k得到相应的边缘,确定最终的分割结果。

Flevoland局部轮廓检测分级图像(ContourDetectionandHierarchicalImageSegmentation,CDHIS)分割和线性迭代聚类(SimpleLinearIterativeClustering,SLIC)分割结果对比如图11所示。从分割结果上看,相对于SLIC分割结果,CDHIS对细小区域的解析能力有明显提高,并且对于介质相同的区域得到的分割块比较大。这样的分割结果使得计算特征均值更加准确,出现奇异值的概率降低,对分类起到更好的作用。

图11 Flevoland局部CDHIS分割和SLIC分割结果对比

2.2 基于多层SVM的极化SAR特征分析分类方法

基于多层SVM的特征分析分类方法的具体步骤如图12。

该方法中SVM分类器的核函数为径向基函数(RadialBasisFunction,RBF)。RBF核函数在处理线性不可分的分类问题有较大优势,其SVM核参数为默认参数。

通过上述地物目标特性分析发现:仅利用一种或几种特征是无法对每一类的地物和其他类地物类型进行有效区分的,因此本文采用了一种多层树结构进行分类,其分类顺序为:水域、耕地、林地和城区。基于多层SVM的特征分析分类方法是基于由易到难的准则,结合地物目标特性分析结论,得出分类顺序。各特征子集典型特征直方图如图13所示。

首先,水域特征子集(|T22|、|T23|等)的特征能很好地区分水域和其他三个类别,其典型特征直方图如图13(a)。预处理后得到数据根据水域特征子集进行第一次SVM分类,样本为两类:一类为水域样本;一类为其他三类地物的混合样本。其次,耕地特征子集(α、CPR等)在无水域的情况下很好地区分耕地和其他两个类别,其典型特征直方图如图13(b)。第一次SVM结果其他类别根据耕地特征子集进行第二次SVM分类,样本分为耕地样本和林地城区混合样本两类。最后,林地城区特征子集(A、RρRR-LL等)在无耕地和水域的情况下较好地区分林地和城区两个类别,其典型特征直方图如图13(c)。第二次SVM分类的其他结果根据林地城区特征子集进行第三次SVM分类,样本分为林地样本和城区样本两类。通过上述三次SVM分类就可以得到全部的分类结果。

图12 基于多层SVM的特征分析分类方法的具体步骤

图13 各特征子集典型特征直方图

3 实验结果及分析

本文通过分析Flevoland实验数据中的水域、城区、林地、耕地及总体的分类精度来评价本文方法及对比算法。该算法的硬件平台为PC,配置为i5处理器/16GB内存,软件平台为Matlab2014a。对比实验1为Wishart监督分类;对比实验2为|Tij|+SVM(0

图14 Flevoland实验结果

表1Flevoland不同方法分类准确率对比

Tab.1ClassificationaccuracycomparisonofdifferentmethodsinFlevoland

类型准确率/%Wishart监督分类|Tij|+SVM多维特征+SVM多维特征+mRMR+SVM本文方法水域90.5096.280.195.492.1耕地71.1878.389.683.888.8林地96.6573.668.781.686.3城区50.0063.861.376.785.4总体78.1077.176.1683.888.0耗时/s103.809929.95≫20000.0016220.901022.00

对本文方法和对比实验方法的结果进行分析:1)对比实验1是较为经典的极化分类方法,并在分类结果后面增加马尔可夫后处理,时间复杂度较小,主要针对自然地物。从分类结果上可以看出其区分水域和林地的效果好,但是对人工地物效果不好,总体分类精度一般。2)对比实验2只提取单一特征|Tij|(0

Vancouver实验数据实验结果如图15和表2所示。从目视解译和分类结果评估两个方面得到了相似的实验结论。

图15 Vancouver实验结果

表2Vancouver不同方法分类准确率对比

Tab.2ClassificationaccuracycomparisonofdifferentmethodsinVancouver

类型准确率/%Wishart监督分类|Tij|+SVM多维特征+SVM多维特征+mRMR+SVM本文方法水域94.2197.6897.0398.1598.93耕地62.4964.3779.5971.6979.34林地88.7269.8243.2276.9385.89城区86.2165.1241.3379.0387.29总体78.2173.7673.1080.5886.77耗时/s420.7010152.00≫100000.00109330.007960.00

通过重复实验评估样本数量对分类精度的影响。每组重复次数为15次,重复实验的样本是通过随机选择得到的。实验结果如图16。

图16 样本数量对总体分类精度影响

从图16和数据分析得出,当样本百分比超过5%,其总体分类精度的标准差小于0.002。结果表明:一方面,本文方法有较好的稳定性,在同等实验条件下得到一致的实验结论;另一方面,本文方法受样本量的影响较小,随着样本量的增加,总体分类精度迅速增加并保持稳定。

4 结语

本文提出一种基于多层支持向量机(SVM)的极化SAR特征分析与分类方法。通过特征分析确定适合不同地物类型的最佳特征子集,采用多层树结构根据每一种地物类型的特征子集进行SVM分类。该算法充分利用了地物目标类型的特性,提高了分类精度,也降低了算法时间复杂度。实验结果验证了该方法的有效性和稳定性。

下一步的研究方向主要是面向更丰富地物目标类型,通过更细致物理机制的研究,选择更为精确的SVM核参数,构造更好的分类框架,以期在各种复杂地物类型中获得更精确的分类结果,在减灾、土地利用等重要领域发挥积极作用。

)

[1]HUYNENJR.Phenomenologicaltheoryofradartargets[D].TUDelft,Holland:DelftUniversityofTechnology, 1970: 157-179.

[2]HOLMWA,BARNESRM.Onradarpolarizationmixedtargetstatedecompositiontechniques[C]//Proceedingsofthe1988IEEENationalRadarConference.Piscataway,NJ:IEEE, 1988: 249-254.

[3]FREEMANA,DURDENSL.Athree-componentscatteringmodelforpolarimetricSARdata[J].IEEETransactionsonGeoscienceandRemoteSensing, 1998, 36(3): 963-973.

[4]YAMAGUCHIY,MORIYAMAT,ISHIDOM,etal.Four-componentscatteringmodelforpolarimetricSARimagedecomposition[J].IEEETransactionsonGeoscienceandRemoteSensing, 2005, 43(8): 1699-1706.

[5]CLOUDESR.Targetdecompositiontheoremsinradarscattering[J].ElectronicsLetters, 1985, 21(1): 22-24.

[6]DURDENSL,VANZYLJJ,ZEBKERHA.Theunpolarizedcomponentinpolarimetricradarobservationsofforestedareas[J].IEEETransactionsonGeoscienceandRemoteSensing, 1990, 28(2): 268-271.

[7]KROGAGERE.Newdecompositionoftheradartargetscatteringmatrix[J].ElectronicsLetters, 1990, 26(18): 1525-1527.

[8]SAEPULOHA,KOIKEK,OMURAM.ApplyingBayesiandecisionclassificationtoPi-SARpolarimetricdatafordetailedextractionofthegeomorphologicandstructuralfeaturesofanactivevolcano[J].IEEEGeoscienceandRemoteSensingLetters, 2012, 9(4): 554-558.

[9]LÖNNQVISTA,RAUSTEY,MOLINIERM,etal.PolarimetricSARdatainlandcovermappinginborealzone[J].IEEETransactionsonGeoscienceandRemoteSensing, 2010, 48(10): 3652-3662.

[10]VOISINA,KRYLOVVA,MOSERG,etal.ClassificationofveryhighresolutionSARimagesofurbanareasusingcopulasandtextureinahierarchicalMarkovrandomfieldmodel[J].IEEEGeoscienceandRemoteSensingLetters, 2013, 10(1): 96-100.

[11]FUKUDAS,HIROSAWAH.Supportvectormachineclassificationoflandcover:applicationtopolarimetricSARdata[C]//IGARSS’01:ProceedingsoftheIEEE2001InternationalGeoscienceandRemoteSensingSymposium.Piscataway,NJ:IEEE, 2001: 187-189.

[12]WASKEB,VANDERLINDENS.ClassifyingmultilevelimageryfromSARandopticalsensorsbydecisionfusion[J].IEEETransactionsonGeoscienceandRemoteSensing, 2008, 46(5): 1457-1466.

[13] 何吟,程建.基于商空间粒度的极化SAR图像分类[J].计算机应用,2013,33(08):2351-2354.(HEY,CHENGJ.ClassificationofpolarimetricSARimagesbasedonquotientspacegranularitycompositiontheory[J].JournalofComputerApplications, 2013, 33(8): 2351-2354.)

[14] 桂容,徐新,董浩,等.全极化SAR影像城区建筑密度分析 [J].遥感技术与应用,2016,31(2):267-274.(GUIR,XUX,DONGH,etal.UrbanbuildingdensityanalysisfrompolarimetricSARimages[J].RemoteSensingTechnologyandApplication, 2016, 31(2): 267-274.)

[15]MAGHSOUDIY,COLLINSMJ,LECKIEDG.Radarsat-2polarimetricSARdataforborealforestclassificationusingSVMandawrapperfeatureselector[J].IEEEJournalofSelectedTopicsinAppliedEarthObservationsandRemoteSensing, 2013, 6(3): 1531-1538.

[16] 李雪薇,郭艺友,方涛.基于对象的合成孔径雷达影像极化分解方法[J].计算机应用,2014,34(5):1473-1476,1490.(LIXW,GUOYY,FANGT.Object-basedpolarimetricdecompositionmethodforpolarimetricsyntheticapertureradarimages[J].JournalofComputerApplications, 2014, 34(5): 1473-1476, 1490.)

[17] 王云艳,何楚,涂峰,等.特征选择双层SVM的融合算法用于极化SAR图像分类[J].武汉大学学报(信息科学版),2015,40(9):1157-1162.(WANGYY,HEC,TUF,etal.PolSARimageclassificationusingfeaturefusionalgorithmbasedonfeatureselectionandbilayerSVM[J].GeomaticsandInformationScienceofWuhanUniversity, 2015, 40(9): 1157-1162.)

[18]DINGC,PENGH.Minimumredundancyfeatureselectionfrommicroarraygeneexpressiondata[J].JournalofBioinformaticsandComputationalBiology, 2005, 3(2): 185-205.

[19]ARBELAEZP,MAIREM,FOWLKESC,etal.Contourdetectionandhierarchicalimagesegmentation[J].IEEETransactionsonPatternAnalysisandMachineIntelligence, 2011, 33(5): 898-916.

[20] 杨杰,赵伶俐,李平湘,等.引入规范化圆极化相关系数的保持极化散射特性的分类算法[J].武汉大学学报(信息科学版),2012,37(8):911-914.(YANGJ,ZHAOLL,LIPX,etal.Preservingpolarimetricscatteringcharacteristicsclassificationbyintroducingnormalizedcircular-polcorrelationcoefficient[J].GeomaticsandInformationScienceofWuhanUniversity, 2012, 37(8): 911-914.)

ThisworkispartiallysupportedbytheTechnologyResearchandDevelopmentoftheMajorProjectofHigh-ResolutionEarthObservationSystemunderGrant(03-Y20A10-9001-15/16),theComprehensiveDisasterDemonstrationProjectofSpatialInformationServices.

SONG Chao, born in 1992, M.S.candidate.His research interests include synthetic aperture radar image interpretation.

XU Xin, born in 1967, Ph.D., professor, doctoral supervisor.His research interests include signal and information processing.

GUI Rong, born in 1990, M.S.candidate.Her research interests include synthetic aperture radar image interpretation.

XIE Xinfang, born in 1994, M.S.candidate.Her research interests include synthetic aperture radar image interpretation.

XU Feng, born in 1980, M.S., associate research fellow.His research interests include application of synthetic aperture rada image in disaster prevention and reduction.

Polarimetric synthetic aperture radar feature analysis and classification based on multi-layer support vector machine classifier

SONG Chao, XU Xin*, GUI Rong, XIE Xinfang, XU Feng

(SchoolofElectronicInformation,WuhanUniversity,WuhanHubei430072,China)

In order to make full use of the ability of of Synthetic Aperture Radar (SAR) images with different polarization features for characterizing different types of ground objects, an analysis and classification approach of polarimetric SAR feature based on multi-layer Support Vector Machine (SVM) classifier was proposed.Firstly, the optimal feature subsets suitable for different terrain types were determined through the feature analysis.Then, the method of hierarchical classification tree was used for SVM classification step by step according to the feature subset of each object type.Finally, the overall final result was obtained.The experimental results of RadarSAT-2 polarimetric SAR image classification show that, the classification accuracy of the proposed approach is approximately 85% for four kinds of ground objects such as water area, cultivated land, forest land and urban area and the overall classification accuracy is up to 86%.The proposed approach can make full use of the characteristics of the different ground object target types, improve the classification accuracy and reduce the time complexity.

polarimetric Synthetic Aperture Radar (SAR) image; feature analysis of ground object; multi-layer Support Vector Machine (SVM); supervised classification

2016-06-02;

2016-07-25。

高分辨率对地观测系统重大专项技术与开发项目(03-Y20A10-9001-15/16);综合减灾空间信息服务应用示范项目。

宋超(1992—),男,福建福州人,硕士研究生,主要研究方向:合成孔径雷达图像解译; 徐新(1967—),男,湖北武汉人,教授,博士生导师,博士,主要研究方向:信号与信息处理; 桂容(1990—),女,湖北武汉人,硕士研究生,主要研究方向:合成孔径雷达图像解译;谢欣芳(1994—),女,河南周口人,硕士研究生,主要研究方向:合成孔径雷达图像解译; 徐丰(1980—),男,北京人,副研究员,硕士,主要研究方向:合成孔径雷达图像在防灾减灾方面的应用。

1001-9081(2017)01-0244-07

10.11772/j.issn.1001-9081.2017.01.0244

TP75; TN958

A

猜你喜欢
子集特征分析极化
2013—2020年开封地区无偿献血人群HIV感染状况及特征分析
认知能力、技术进步与就业极化
极化雷达导引头干扰技术研究
拓扑空间中紧致子集的性质研究
基于干扰重构和盲源分离的混合极化抗SMSP干扰
1822号台风“山竹”演变特征分析
穆夏艺术特征分析
近60年银川气温变化特征分析
关于奇数阶二元子集的分离序列
非理想极化敏感阵列测向性能分析