基于通道划分的植物反射波谱分类研究

2014-08-01 12:15王欢欢徐丽华
西南林业大学学报 2014年3期
关键词:波谱波段区间

王欢欢 徐丽华

(浙江农林大学环境与资源学院,浙江 临安 311300)

正确地识别植物是利用和保护城市森林资源的基础和依据[1]。随着遥感技术的快速发展,如何从海量的数据中选择有效的波段进行植物种类识别成了亟待解决的问题。因此,波段的选择、数据的降维处理成为了未来研究的重点之一。Martin Herold、Nirmal Keshava、曹建农等人分别利用B距离法、基于可分性的迭代选择波段方法、马尔科夫网等方法对波段进行降维,并有效的对数据进行了压缩[2-4]。而在植物种类识别方面,目前主要是以实验室获得的叶片高光谱反射率及一些相关的化学物理参数(叶片叶绿素含量、水分含量等)为基础数据[5],运用不同的数学方法对其进行分析研究,确定不同植被的识别特征。Gong、Chaichoke Vaiphasa、Zhang等人分别利用小波变换、对数变换、归一化变换及一些相关的物理化学参数等对叶片光谱反射率进行分析,并得到了较为理想的分类结果,能够很好地区分不同树种的类型[6-8]。而国内学者,如宫鹏、傅银贞、浦瑞良、丁丽霞等人利用光谱微分法、变量相关法、方差法、包络线去除法对不同树种进行了识别,均得到了较好的结果[9-12]。在植物波谱的研究方面大多数学者都是单纯的用数学方法提取最佳波段进行植被识别,本研究将基于通道划分,将波段信息进行降维,进行植物反射波谱的分类研究。

基于47种杭州城市常见植物的400~2 500 nm的反射波谱,根据各个波段间的相关性划分了23个波谱区间,根据新的波谱反射率对原始波谱进行变换得到了新波谱,采用自组织竞争神经网络法对原始波谱和新波谱分别进行识别。结果表明,自组织竞争神经网络法可以将波谱曲线相似的植物聚为一类,且23个通道划分的结果显示,识别植物的最佳波段大部分位于红光波段和近红外波段内,通道划分后的新波谱以较少的数据保留了植物之间的差异,实现了数据的压缩,为高光谱数据的降维提供了一种参考。

1 研究数据采集

波谱数据的采集地点位于浙江农林大学以及周边地带。共采集了包括木本植物、草本植物在内的47种杭州城市常见植物。数据采集时每种植物选取5株,每株采集一片向阳面的成熟叶片,共计235个叶片样本。数据采集在晴朗的天气下进行,选择生长茂盛的、无病害的植物进行叶片采集,并放在保鲜袋里,迅速带到室内测量光谱反射率。叶片的采集为不同日期时,选择天气晴朗的相同时间段进行收集,减少气候和时间差异对数据的影响。光谱数据的测量采用ASD FieldSpecPro FR野外光谱辐射仪。测量光谱波段范围为350~2 500 nm,共 2 151 个波段。由于350~400 nm光谱反射率不稳定,出现了大幅度的波动,因此,本研究选用400~2 500 nm的光谱。为了提高光谱测量的准确性和稳定性,利用该光谱仪配套的植物高密度探头进行光谱测量,每测完1片树叶进行一次标准白板的校正,每个叶片测量5条光谱。每种植物共测得25条光谱,取其平均值作为该植物的光谱反射率值。采集的植物种类见表1。

表1 杭州市典型植物采样类型及名称

2 研究方法

2.1 相关系数矩阵

相关系数矩阵也叫相关矩阵。设(x1,x2,x3……,xn)是一个n维随机变量,任意xi与xj的相关系数ρij(i,j=1,2,3……n)构成的n阶矩阵称为该随机向量的相关系数矩阵,记作R,即:

(1)

(2)

式中:cov(xi,xj)为xi、xj的协方差;σxi为xi的标准差。

相关系数反映的是相邻元素之间的相关性大小。相关系数越高,元素之间的相关性越大,相似程度越高;相关系数越小,元素之间的相关性就越小,相似程度就低。一般认为,相关系数在0.3以下为无相关,0.3~0.5表示低度相关,0.5~0.8表示中等相关,0.8以上表示高度相关[13]。

2.2 通道划分

对于相关系数矩阵R,以矩阵R的对角线为基础,提取出m个对称矩阵Di,k∈(1,n)且m个对称矩阵中的所有元素都不小于某个固定值a,Di即为通道区间。即:

(3)

式中:i∈(1,m),k∈(1,n),Di为通道区间,R为相关系数矩阵。

2.3 波谱重采样

根据确定的通道区间对原始光谱数据进行压缩。本项研究采用的是章皖秋等人对城市典型地物反射波谱分辨率进行分析时采用的重采样及扩展的公式。章皖秋等[14]人利用该公式对城市地物反射波谱进行压缩降维,并且得到了较好的研究结果。

原始反射率光谱按照公式(4)进行变换。

(4)

式中:B为通道个数,B∈(1,2,…,2 100);b为该通道划分中的第b个通道,b通道的波谱宽度为[λ1,λm],b∈(1,2,…,B);b=[λ1,λm];Rλ为第b个通道的波谱反射率的平均值;RBb为第b个通道的新波谱,由原始波谱重采样得到RB=[RB1…RBb…RBB]构成了通道数B下的新波谱。

波谱重采样采用的是积分法求平均值,它可以代表样本的平均指标,能够反映波谱区间内各光谱反射率数据的平均特征。波谱降维后光谱曲线的分辨率降低,维数变少,为了新光谱的分类结果与原始反射光谱的分类结果具有可比性,将新光谱按公式(5)扩展新波谱,使原始波谱具有相同维数[14]。

(5)

式中:λ=401,…,2 500 nm。

2.4 自组织竞争神经网络

本研究采用自组织竞争神经网络对重采样之后的新波谱和原始波谱分别进行植物的分类识别。自组织竞争人工神经网络是一种无教师学习神经网络模型,它模拟人类生物神经系统的适应过程,利用竞争的原则来进行信息处理,指导网络的学习,网络通过自身的训练,自动对输入模式进行识别分类。

3 结果与分析

3.1 相关性分析

波谱分辨率越高,各相邻波段之间的相似性越高,通道间相关性就越大,会增加数据量和冗余度,难以包容植物反射波谱的合理摆动。为了减少数据之间的冗余,根据公式(1)、公式(2)计算2 100个波段之间的相关系数矩阵,见图2。

图2颜色的深浅代表了相关系数的大小,颜色越浅说明相关系数越大,波段之间的相关性就越高,所包含的信息相似程度就越高。反之,颜色越深代表相关系数越小,所包含的的信息差异性越大。图2中的对角线代表了各波段与本身的相关系数,是一条代表相关系数都为1的连续象元。而对角线的周围是一系列连续的、颜色浅的小矩阵,这些矩阵对应着一系列连续、相关性高的波谱区间。并且随着波段间隔的增大,相关系数矩阵图中的颜色逐渐变暗,相关系数逐渐变小,说明波段之间的相关性随波段之间间隔的增大而减小。波段间隔越大,所代表的信息差异性越大,因此相关性越小。同一波段区间内各波段之间的相关性高,所代表的信息相似。因此可采用定量方法,将这些高相关的连续的波谱区间作为通道提取出来。

3.2 通道划分结果

根据计算出的各波段之间的相关系数,在matlab中按照公式(3)编写的相关程序,把高度相关的波段区间作为通道提取出来。

根据相关系数大于0.8的为高度相关,故分别选用2个值a=0.8、a=0.9 为临界点划分波段区间。当a=0.8时,得到14个波谱区间;当a=0.9时,得到23个波谱区间。表2~3分别为a=0.8、a=0.9时划分的通道区间。

表2 a=0.8时划分的14个波谱通道 nm

表3 a=0.9时划分的23个波谱通道 nm

通过表2~3的对比分析可以看出,当划分为14个波谱通道时,波谱区间的宽度较宽,数据压缩严重;而当划分为23个波谱区间时,波谱区间的宽度相对变窄。根据前人的研究,20 nm的波谱宽度用于识别植物树种是较为理想的[16],14个波谱通道划分法的通道区间大部分都远大于20 nm,而23个波谱通道划分法的通道区间波谱宽度大部分在20 nm左右,所以23个通道划分法较14个通道划分法要合理。因此,本项研究选用了23个通道划分的方法。

在划分的23个通道内,波谱宽度越窄说明这些波段越能更好的对不同植物进行识别,更能够有效的区分不同植物之间的波谱差异。其中有11个通道的波谱宽度较窄,分别为:490~509、642~676、677~683、684~688、689~705、706~725、726~741、1 331~1 354、1 355~1 370、1 371~1 383、1 384~1 416。1个通道位于绿光波段内,6个通道位于红光波段内,4个通道位于近红外波段内。说明能够有效识别并区分不同植物的波段大部分位于红光波段和近红外波段内。23个波谱通道的划分将原分辨率为1 nm的波谱有效的进行了降维,减少数据之间的重复,用较少的数据量表达了更多的信息。

3.3 植物分类结果

合理的波谱通道应该不仅对数据进行了压缩,而且还保留了植物之间的差异性,本项研究将从植物之间的差异性对波谱通道划分的合理性进行检验。

根据通道划分的结果,依据公式(4)、(5)对原始波谱进行波谱重采样及扩展得到1个新的光谱,设计1个自组织竞争人工神经网络。学习率为0.1,最大迭带次数定为 2 000。其中竞争层节点个数的选择将最终决定植物的分类结果,因此,从实际出发,认为这些样本至少分为4个期望类:针叶类木本植物、阔叶类木本植物、竹类植物和草本植物,然后根据分类结果与样本特征对每一类再逐渐细分。实验中分别尝试了4个类别、5个类别、6个类别3种分类方法,从而设定网络竞争层神经元个数,分别为4个,5个,6个,利用神经网络对数据进行分类,分析数据特征。通过对比分析可知,分为6类时效果最佳,表4分别为6个神经元时的新波谱和原始波谱分类结果展示。

表4 6个神经元分类结果

由表4可知,新光谱的分类结果对植物种类有很好的识别聚类效果,虽然没有把针叶类木本植物、阔叶类木本植物、竹类植物和剩余的草本植物精确地分出来,但是这些植物都以小类别的方式被聚集在六大类中,且六大类植物中的每一类都具有相似性与差异性,可以在分类基础上对样本再进行逐层细分。因此,自组织竞争神经网络法可以对植物进行有效的识别。新光谱的分类结果与原始波谱的分类结果相似,都能很好的将相似的植物波谱分为一类。对比2种分类结果,有3类的分类结果完全相同,只有短梗冬青、苦槠、女贞在分类结果中出现了变化,女贞在新光谱分类结果中与石楠、木犀、木莲、大叶冬青、枸骨分为一类,这6种植物都是阔叶树种,且叶片都是革质,所以女贞被分到这一类更为合理。而短梗冬青和苦槠在2种分类结果中虽然被分到了不同类别,但是,这两类都属于常绿阔叶树种,因而对分类结果影响不大。所以,综上来看,新波谱的分类结果与原始波谱的分类结果相似,并且更具有合理性。

为了更直观的观察通道划分后的植物种类识别结果,将通道划分后的分类结果以波谱曲线的方式表达出来,如图3~8所示。可以看出通道划分后的新波谱仍能够很好的识别植物,并且将波谱曲线相似的植物分到了同一类。

通过原始波谱与新波谱分类结果的对比可以看出,23通道组较少的数据保留了原始光谱反射数据的主要信息,确保了不同植物之间反射率的差异,进而确保了不同植物之间的可分性;在降低信息冗余的同时并未降低信息量,且23个波谱通道划分下的自组织竞争神经网络法能够很好的将形状相似的波谱划分到一起。

4 结论与讨论

1) 本项研究分析了47种不同植物的实测光谱曲线,以波段间的相关性作为衡量波段间相似程度的标准来划分通道区间,并通过神经网络法对通道划分的结果进行了检验。

2) 通道划分的结果显示,23个通道中11个波谱通道宽度较窄,能够较好地区分植物的光谱信息;且11个波谱通道大部分位于红光波段或近红外波段内,为识别植物的最佳波段。23个通道划分的光谱以较少的数据保留了400~2 500 nm不同植物之间的差异,减少了数据的冗余,有效的对原始波谱数据进行了降维;在降维的同时并未减少信息量且降维后的新波谱在植物识别方面效果更佳。自组织竞争神经网络法能够较好的将形状相似的植物波谱曲线聚为一起,能将主要的植物有效的自动识别出来。

3) 本项研究结果可为高光谱数据的降维和植物识别的波段选择提供参考,但由于受到样本质量、数量、波谱特征的影响,因此,如何选择有效波段来区别不同植物仍是目前研究的一个重点问题。

[1] 刘旭升,张晓丽.森林植被遥感分类研究进展与对策[J].林业资源管理,2004(1):61-64.

[2] Herold M, Roberts D A, Gardner M E, et al. Spectrometry for urban area remote sensing:Development and analysis of a spectral library from 350 to 2400 nm[J]. Remote Sensing of Environment, 2004, 91(3): 304-319.

[3] Keshava N. Distance metrics and band selection in hyperspectral processing with applications to material identification and spectral libraries[J]. Geoscience and Remote Sensing, IEEE Transactions on, 2004, 42(7): 1552-1565.

[4] 曹建农,李德仁,关泽群.用马尔科夫网对多光谱遥感图像进行波段最优融合[J].测绘学报,2005,34(1):46-52.

[5] 王志辉.高光谱遥感在森林树种识别中的应用[D].杭州:浙江农林大学,2011:2-3.

[6] Gong P, Pu R, Yu B. Conifer species recognition: An exploratory analysis of in situ hyperspectral data[J]. Remote Sensing of Environment, 1997, 62(2): 189-200.

[7] Vaiphasa C, Ongsomwang S, Vaiphasa T, et al. Tropical mangrove species discrimination using hyperspectral data: a laboratory study[J]. Estuarine Coastal and Shelf Science, 2005, 65(1/2): 371-379.

[8] Zhang J, Rivard B, Sánchez-Azofeifa A, et al. Intra-and inter-class spectral variability of tropical tree species at La Selva, Costa Rica: Implications for species identification using HYDICE imagery[J]. Remote Sensing of Environment, 2006, 105(2): 129-141.

[9] 宫鹏, 浦瑞良. 不同季相针叶树种高光谱数据识别分析[J]. 遥感学报, 1998, 2(3): 211-217.

[10] 傅银贞,汪小钦.基于光谱测量的南方典型树种反射光谱特征分析[J].厦门理工学院学报,2009,17(3):37-41.

[11] 浦瑞良,宫鹏.高光谱遥感及其应用[M].北京:高等教育出版社,2000:3-4.

[12] 崔莹莹,舒清态,人工神经网络在林业中的应用现状与趋势[J].西林林业大学学报,2013(5):98-103

[13] 张彦.社会统计学:原理与方法[M].修订版.南京:南京大学出版社,2003:215-216.

[14] 章皖秋,腾丽,张王菲,等.城市典型地物反射波谱分辨率研究[J].遥感信息,2008(2):21-24, 50.

[15] 闻新,周露,李翔,等.MATLAB神经网络仿真与应用[M].北京:科学出版社,2003:300-303.

猜你喜欢
波谱波段区间
你学会“区间测速”了吗
最佳波段组合的典型地物信息提取
盐酸四环素中可交换氢和氢键的核磁共振波谱研究
全球经济将继续处于低速增长区间
基于PLL的Ku波段频率源设计与测试
琥珀酸美托洛尔的核磁共振波谱研究
小型化Ka波段65W脉冲功放模块
区间对象族的可镇定性分析
波谱法在覆铜板及印制电路板研究中的应用
检疫性杂草假高粱与近缘植物种子的波谱鉴别方法