汉江中下游典型河段水环境遥感评价

2016-12-01 03:48赵登忠胡承芳汪朝辉程学军
长江科学院院报 2016年1期
关键词:水质评价反演水质

肖 潇,徐 坚,赵登忠,胡承芳,汪朝辉,程学军

(1.武汉大学 资源环境与科学学院,武汉 430079;2.长江科学院 空间信息技术应用研究所,武汉 430010)



汉江中下游典型河段水环境遥感评价

肖 潇1,2,徐 坚2,赵登忠2,胡承芳2,汪朝辉2,程学军2

(1.武汉大学 资源环境与科学学院,武汉 430079;2.长江科学院 空间信息技术应用研究所,武汉 430010)

选择汉江中下游典型河段作为研究区域,利用2012年春、夏、秋3季水质采样结果及HJ1A卫星CCD同步多光谱数据,建立了研究区总氮浓度BP神经网络反演模型,并根据反演结果对研究区进行水质状况评价。研究结果表明:基于弹性BP训练算法(启发式训练算法)的BP神经网络模型反演精度高,适用性强,可真实反映研究区总氮浓度在不同河段及不同季节中的变化情况,可较好地利用国产卫星数据开展流域水质评价工作。水质评价结果表明研究区在不同季节和不同区域水质差异较大,研究区春季总氮指标严重超标,夏、秋2季指标优于春季,下游指标优于上游。

汉江中下游;典型河段;水质评价;神经网络;多光谱数据;遥感反演模型

1 研究背景

水质评价是水环境治理与监控中的重要工作,通过水质监测,对水质做出合理评价,才能制定有针对性的水环境治理规划和方案。利用样点水样采集、指标分析和等级评价等传统手段进行水质评价只能给出样点处的水质状况,难以达到对大面积水域进行评价的要求,而大规模开展实地采样分析将消耗大量的人力、物力和财力。近年来,随着遥感技术的飞速发展,越来越多的研究者利用遥感手段对水体进行快速连续、动态监测。基于遥感技术进行水质评价,国内外研究者已开展许多相关研究[1-8]。大多数研究是利用遥感数据定量反演水质参数浓度,再以水质参数浓度为基准建立水质评价模型。其中利用遥感数据反演水质参数浓度常采用经验模型和半经验模型,而这些模型往往反演精度不高且普适性不强,其原因主要是由于内陆水体组分之间相互影响,水体的光学特性比较复杂,简单的线性回归模型难以对浓度进行准确估算,且模型容错性能不高。在这种情况下,研究人员将神经网络方法、遗传算法等非线性关系优化法引入到水质参数反演研究中,其中使用较多的为神经网络算法。神经网络是一种黑箱算法,它不需要了解输入与输出之间的关系,模型通过简单的非线性函数多次拟合,可以实现低维到高维的非线性精确映射,具有较强的自适应能力。基于这些优点,神经网络方法可以很好地模拟遥感信号与水质参数之间复杂的非线性关系,且反演精度远高于经验模型[9-12]。针对总氮指数,也有不少相关研究,如利用TM影像资料建立鄱阳湖和太湖的总氮指数神经网络反演模型,并将模型较好地应用于湖泊水质调查、分析和评价[13-14];利用SPOT5遥感影像,建立渭河陕西段BP神经网络和RBF神经网络水质反演模型,研究表明对于自然河流,神经网络模型的水质参数反演结果明显好于线性回归线模型结果[15]。

虽然神经网络模型在水质参数遥感反演模型的建立上具有很多优点(高速计算能力,大容量记忆能力,学习能力及容错能力等),但神经网络模型众多,训练算法也举不胜举,所以选择适合的神经网络模型、训练算法及相关参数确定则是解决问题的关键。本文以汉江中下游典型河段为研究区域,利用2012年春、夏、秋3季所获得的水质实测数据,结合环境一号卫星同步多光谱数据(HJ-1A CCD),以包含一层隐含层的BP神经网络为例,利用多种改进的BP训练算法建立研究区水质参数反演模型,通过性能对比得到最适研究区水质参数浓度估算的BP神经网络训练算法及相关参数;再基于反演结果进行河流水质评价。

2 数据及预处理

2.1 研究区

根据汉江水体污染特点及野外实地调查,划定研究区、确定了20个监测断面(图1),于2012年春、夏、秋3季开展水质取样调查工作,并利用单因子污染指数评价法对所采集的水质样本进行初步评价。因汉江是沿江城市重要的水源地,根据《地表水环境质量标准》(GB3838—2002),汉江应以Ⅲ类水为控制目标。所以,根据对研究区水体水质参数的初步评价可以看出,研究区监测断面水体总氮指标的单因子污染指数在春季和夏季均有不同程度的超标,在秋季有所好转,上游水质劣于下游。研究区水体总氮浓度统计见图2。

图1 研究区及监测断面Fig.1 Study areas and monitoring sections

图2 研究区水体总氮浓度统计情况Fig.2 Statistics of TN concentration of study area

2.2 遥感影像预处理

河流流动性大,对遥感影像的重返周期要求很高,因此本文采用HJ-1A卫星多光谱数据,其重返周期为2~3 d,可以满足河流水质的监测要求。在实地采样时,为保证采样周期与重返周期相符合,实验通常进行2~3 d。在获取与实地采样时间相符合的影像数据后,对影像数据进行预处理,主要进行几何纠正、大气校正等。其中,几何精纠正基于1∶50 000地形图及TM精纠正影像,利用ERDAS遥感图像处理软件完成。大气校正则通过ENVI软件进行影像数据的大气校正,选用基于modtran4+传输模型的FLAASH模型对研究区域进行大气校正。在处理的过程中,选择大气模型为MSL,气溶胶模型为Rural,能见度为40 km[8,16]。

2.3 水质评价方法选择

在进行天然河流水质评价时,常用的评价方法主要有单因子指数评价法、单因子水质标识指数法、综合污染指数法及综合水质标识指数法,这4种方法各有其优劣。根据前期研究认为单因子水质标识指数法最适合进行研究区水质评价[17]。这种方法由同济大学徐祖信提出[18],它是由1位整数和小数点后2位或3位有效数字组成,表示为

(1)

式中:X1代表第i项水质指标的水质类别;X2代表监测数据在X1类水质变化区间中所处的位置;X3代表水质类别与水功能区划设定类别的比较结果。

这种方法的主要优点在于它不仅与传统的单因子指数评价法一样,可以确定主要超标物质,还可以对主要超标物质进行定量评估。不仅能完整表达水质类别,还能直接水质反映达标情况,并可直观表示主要超标物质的时空变化趋势。采用该方法对研究区水质进行评价的结果见表1。

可以看出,研究区总氮浓度的变化具有明显的季节性,总氮指数从春季到秋季呈现明显好转趋势。

3 计算模型

BP神经网络模型(反向传播法)是神经网络分

表1 单因子水质标识指数结果分析

类器中最普遍的形式,其重要应用之一就是函数逼近,它可以建立训练样本集中地从输入到输出的任意的非线性、非显函数映射关系,其特点适合水质定量遥感反演研究。虽然BP神经网络被人们广泛应用,但也存在一些限制与不足,针对传统BP神经网络的缺点,许多学者提出了优化算法来提高其网络性能[19]。从模型训练模式来看,这些优化算法可以分为启发训练式和数值优化训练式(也称为快速训练式或智能优化训练式)2类[20-21]。

通过对HJ-1A多光谱数据4个波段与研究区总氮浓度进行相关性分析,选择参与建模的波段。将29种波段及波段组合与研究区水体实测总氮浓度进行相关性分析,根据分析结果可以看出,春季总氮浓度与波段组合(B2+B4)/(B1+B3)的相关性最高,相关系数R为0.51;夏季总氮浓度与波段组合(B2+B4)/(B1+B3)的相关性最高,相关系数R为0.78;秋季总氮浓度与波段组合(B1+B2)/(B3+B4),相关系数R为0.76。故将HJ-1A多光谱数据的4个波段作为输入项,总氮浓度作为期望输出项。在建模之前对样本进行归一化处理,使得输入、目标值处于-1~1之间。利用HJ-1A多光谱数据,采用标准BP训练算法、启发式训练算法(弹性BP算法、附加动量法等)和数值优化训练算法(比例共轭梯度法、Levenberg-Marquardt法)分别建立总氮浓度反演模型,再通过分析比较得出最适研究区的BP神经网络训练算法。

3.1 初始值设定

在建立不同训练函数的BP神经网络之前,必须先选定BP神经网络的结构,即确定网络层数、神经元数目、每层的激励函数以及学习速率等几个方面。从BP神经网络的构成可以得知,单层网络在运算速度和解决非线性问题的精度上没有优势,而过多网络层数又会使网络复杂化,延长网络训练的时间。通常情况下,研究人员优先选择调整隐含层中的神经元数目来提高网络精度,不仅容易调整,且训练效果也更易观察。在激励函数的选择上,一般选择具有非线性放大系数功能的S型函数。基于以上考虑,本文使用包含一个隐含层的BP神经网络,即网络层数为3层,输入层激励函数采用常用的S型激活函数,输出层则采用线性激活函数,根据网络结构及实际情况,设定神经元个数为3~10个[22-23];其余参数设定需满足不同算法拟合结果的可比性,故确定学习速率为0.05,显示周期为1 000,迭代次数为20 000,目标误差为0.000 5。

3.2 模型建立

本文引入标准BP算法、启发式算法和数值优化算法共7种BP神经网络改进训练算法,包括标准BP算法、附加动量法、自适应速率法、弹性BP法,比例共轭梯度、拟牛顿法、Levenberg-Marquardt法;利用2012年总氮浓度与同期卫星多光谱数据建立研究区分季节总氮浓度遥感反演模型,选用平均相对误差(RE)、均方根误差(RMSE)进行精度校验,从而得到最适及性能最稳定的训练算法。在每次模型建立过程中,将20组数据随机分成4组,其中3组作为建模组,1组作为校验组进行循环计算,以4次循环计算中RMSE最小者为最优。具体拟合精度见图3。

从图3(a)中可以看出,Levenberg-Marquardt法的拟合情况最好,在神经节点为9的时候精度最高;而从校验结果图3(b)却发现,基于Levenberg-Marquardt训练算法得出的拟合结果出现误差增大、模型泛化能力降低的问题,而基于弹性BP法训练算法的拟合结果更为稳定,在验证环节中没有出现“泛化能力”降低问题。因此,针对2012年春季数据而言,结合图3(a)、图3(b)的统计结果,综合考虑均方根误差和平均相对误差两个值及模型泛化能力,认为弹性BP训练算法为最优算法,神经网络节点数为7。

同样,在2012年夏季,从图3(c)中也可以看出Levenberg-Marquardt法的拟合效果最好,但从图3(d)中的验证结果可以看出该法也表现出 “泛化能力”降低的问题。因此,针对2012年夏季数据而言,综合考虑RMSE和RE两个值及模型泛化能力,认为弹性BP训练算法为最优算法,神经网络节点数为6。

与2012年春季及夏季类似,从2012年秋季的拟合结果中可以看出,基于Levenberg-Marquardt训练算法也出现了拟合结果误差增大,模型泛化能力降低的问题,即使图3(e)中表现出RMSE及RE最小,而图3(f)中RMSE和RE增大,拟合结果不能接受。因此,针对2012年秋季数据而言,依旧是弹性BP训练算法为最优算法,神经网络节点数为7。

此外,根据拟合过程得出,BP算法、弹性BP法、比例共轭梯度法、Levenberg-Marquardt法的收敛速度较快。其中,Levenberg-Marquardt法收敛速度最快,且精度最高,但在3个数据集中都出现了“泛化能力”降低的问题,故认为该算法在此适应性不强。综上所述,考虑均方根误差,平均相对误差和模型泛化能力,以及从试验过程中对模型的调试状态来看,认为基于弹性BP训练算法的BP神经网络(神经网络节点为6—7)收敛速度快、拟合精度高、适用性强,性能稳定,认为最适合研究区总氮浓度遥感反演模型建立。

4 水质评价

根据模型性能比较结果,利用HJ1A多光谱数据,基于弹性BP训练算法的BP神经网络所建立的研究区总氮浓度反演模型的模拟精度最高。因此,使用反演估算结果进行研究区水体评价(图4)。

图4 2012年研究区总氮单因子水质标识指数空间分布Fig.4 Spatial distribution of single-factor identification index of water quality with total nitrogen in the research areas in 2012

从研究区总氮因子水质标识指数空间分布图4看,对比实测数据计算得到的水质评价结果(图中标注数字为利用实测数据计算得到的评价结果),当总氮指标超过劣五类水指标时,部分经反演结果得到的指标略低于实测结果得到的指标;当总氮指标处于三类水或优于三类水指标时,经反演结果得到的指标与实际情况相符,说明基于弹性BP训练算法建立的反演模型可信度高、普适性强,能够很好地反映出研究区整体水质情况。

如图4所示,研究区总氮指数在春季严重超标,而在夏季和秋季总氮浓度下降,研究区水质状况转好,这主要是由于春季研究区周围农田施用农药等引起。且下游指数优于上游,这主要是由于研究区上游毗邻农田,而下游紧靠城市,农业中大量施用的化肥、农药、家畜粪便等随着地表径流进入上游江段,造成上游指标劣于下游的情况。此外,总氮单因子水质标识指数分布图可以反映总氮指标的高值区,且高值区与实测数据的分布状态相符合。

为进一步验证该模型的适用性,本文选取同一水域不同河段进行模型验证,结果表明,2012年春季的总氮指数全线超标,同年夏季明显下降,而秋季已达到三类水标准,与实际情况相符,说明基于BP神经网络模型(弹性BP训练算法)反演结果得出的研究区水质评价结果具有很高的可信度及适用性。

5 结论与展望

本文利用7种训练算法建立了BP神经网络总氮浓度遥感反演模型,通过在汉江中下游典型河段进行验证比较,均表明利用BP弹性算法得到的结果反演精度最高,能准确反映水质参数的空间分布情况,表明该模型具有很高的可信度与适用性。

BP神经网络虽然是发展最为成熟的神经网络之一,但由于它是基于负向梯度下降算法的网络模型,因此不可避免地存在一些缺陷和不足,如无法跳出局部极小值、学习时间长、收敛速度慢、拓扑结构难以确定等[23]。在将BP神经网络算法用于水质遥感评价的研究中,一般并未对BP神经网络的训练算法进行适合性筛选,通常是基于计算工具中的神经网络工具直接进行模拟,或基于标准BP训练的改进算法进行模拟,后一种情况虽然可以通过改进得到最适合研究区状况的BP训练算法,但改进过程复杂且耗时。如果基于较为合适的BP训练算法进行优化则可大大地减少工作量。因此进行训练算法的筛选就显得尤为必要了。

在利用BP神经网络进行水环境评价时,除了训练算法和神经元个数外,网络的层数、激活函数以及学习速率都会影响模型精确度和适用性,本文结合研究区自身特点和已有研究成果,预设网络层数、激活函数类型等进行网络训练,没有单独考虑这些因素对模型的影响,所以未来还需要在网络层数、激活函数等参数的选取方面做更深入的研究,提高网络设计的精度,将神经网络方法更好地应用于利用遥感数据进行内陆水体水质评价工作中。

[1] 邬明权, 牛 铮, 高 帅, 等. 渤海陆源入海排污口的多尺度遥感监测分析[J]. 地球信息科学学报, 2012, 14(3): 405-410.

[2] 顾 清. 浙江省饮用水水库水质演变及风险评价研究[D]. 浙江:浙江大学, 2014.

[3] 朱 琳. 西太湖宜兴段近岸水质分析与现状评价[D]. 南京:南京林业大学, 2013.

[4] BITELLI G, MANDANICI E. Atmospheric Correction Issues for Water Quality Assessment from Remote Sensing: The Case of Lake Qarun (Egypt)[C]∥ Society of Photo-optical Instrumentation Engineers. Proceedings of Remote Sensing. International Society for Optics and Photonics. Toulouse France,September 21-23, 2010: 78311Z-1-78311Z-8.

[5] MARKOGIANNI V, DIMITRIOU E, KARAOUZAS I. Water Quality Monitoring and Assessment of An Urban Mediterranean Lake Facilitated by Remote Sensing Applications[J]. Environmental Monitoring and Assessment, 2014, 186(8): 5009-5026.

[6] SYAHREZA S, MATJAFRI M Z, LIM H S,etal. Water Quality Assessment in Kelantan Delta Using Remote Sensing Technique[C]∥SPIE Security + Defence. Proceedings of International Society for Optics and Photonics. Edinburgh, United Kingdom, September 24-26, 2012: 85420X-1-85420X-7.

[7] ALPARSLAN E,AYDÖNER C,TUFEKCI V,etal. Water Quality Assessment at Ömerli Dam Using Remote Sensing Techniques[J]. Environmental Monitoring and Assessment, 2007, 135(1-3): 391-398.[8] THIEMANN S, KAUFMANN H. Determination of Chlorophyll Content and Trophic State of Lakes Using Field Spectrometer and IRS-1C Satellite Data in the Mecklenburg Lake District, Germany[J]. Remote Sensing of Environment, 2000, 73(2): 227-235.[9] KEINER L E, YAN X H. A Neural Network Model for Estimating Sea Surface Chlorophyll and Sediments from Thematic Mapper Imagery[J]. Remote sensing of environment, 1998, 66(2): 153-165.

[10]ZHANG Y, PULLIAINEN J, KOPONEN S,etal. Application of An Empirical Neural Network to Surface Water Quality Estimation in the Gulf of Finland Using Combined Optical Data and Microwave Data[J]. Remote Sensing of Environment, 2002, 81(2): 327-336.

[11]SUN D, LI Y, WANG Q,etal. Development of Optical Criteria to Discriminate Various Types of Highly Turbid Lake Waters[J]. Hydrobiologia, 2011, 669(1): 83-104.

[12]CHAMI M, ROBILLIARD D. Inversion of Oceanic Constituents in Case I and II Waters with Genetic Programming Algorithms[J]. Applied Optics, 2002, 41(30): 6260-6275.

[13]王建平, 程声通, 贾海峰, 等. 用 TM 影像进行湖泊水色反演研究的人工神经网络模型[J]. 环境科学,2003,24(2): 73-76.

[14]吕 恒,江 南,罗潋葱. 基于TM数据的太湖叶绿素A浓度定量反演[J].地理科学,2006,26(4):472-476.

[15]赵玉芹,汪西莉,薛 赛.渭河水质遥感反演的人工神经网络模型研究[J].遥感技术与应用,2009,24(1):63-66.

[16]肖 潇,胡承芳,徐 坚.汉江水质多源遥感监测与评价方法研究技术报告[R].武汉:长江水利委员会长江科学院,2013.

[17]XIAO Xiao, HU Cheng-fang, WEN Xiong-fei,etal. A Study on Water Quality Assessment in Typical Area of Middle and Lower Reaches of the Hanjiang River[C]∥ The Center for Earth Observation and Digital Earth. Proceedings of the 35th International Symposium on Remote Sensing of Environment. Beijing, China, April 22-26, 2013: 212-1—212-8.

[18]徐祖信. 我国河流综合水质标识指数评价方法研究[J]. 同济大学学报: 自然科学版, 2005, 33(4): 482-488.

[19]WEN J, LI Z J, WEI L S,etal. The Improvements of BP Neural Network Learning Algorithm[C]∥ IEEE Signal Processing Society. Proceedings of 5th International Conference on Signal Processing. Beijing, China, August 21-25, 2000: 1647-1649.

[20]陈明忠. BP 神经网络训练算法的分析与比较[J]. 科技广场, 2010 ,(3): 24-27.

[21]吕琼帅. BP 神经网络的优化与研究[D]. 郑州: 郑州大学, 2011.

[22]张德丰,MATLAB神经网络应用设计[M].北京,机械工业出版社,2009.

[23]褚 辉,赖慧成,一种改进的BP神经网络算法及应用[J].计算机仿真,2007,24(4):75-77.

(编辑:曾小汉)

Remote Sensing Assessment of Water Quality for Typical Segmentsin the Middle and Lower Reaches of Hanjiang River

XIAO Xiao1,2, XU Jian2, ZHAO Deng-zhong2, HU Cheng-fang2,WANG Zhao-hui2,CHENG Xue-jun2

(1.School of Resource and Environmental Sciences, Wuhan University, Wuhan 430079, China;2.Spatial Information Technology Application Department, Changjiang River Scientific Research Institute, Wuhan 430010, China)

Typical segments in the middle and lower reaches of Hanjiang River were taken as study areas for water quality. According to sampling results and synchronized multi-spectral CCD data of HJ-1A satellite in spring, summer and autumn of 2012, we establish a retrieval model of BP neural network for TN (total nitrogen) concentration ,and assess water quality of the study areas based on the retrieval results. The results show that, on the basis of resilient BP training algorithm (heuristic-based training algorithm), the retrieval model of BP neural network established is of high accuracy and wide application fields, which can truly reflect the changes in TN concentration in different reaches and different seasons , and is easy to utilize domestic satellite data to carry out assessment work of water quality ; furthermore, assessment results indicate that water quality of the research areas varies a lot with seasons and reaches: the value of TN indicator in spring significantly exceeds standard value , in other words, value of this indicator in summer or autumn is lower than that in spring. Finally, concentration of TN of downstream area is lower than that of upstream area.

middle and lower reaches of Hanjiang River; typical segments of river; assessment of water quality;neural network;multi-spectral data; remote sensing inversion model; typical segments of river

2015-01-27;

2015-02-23

国家自然科学基金项目( 41201452, 41301435);科技部国家国际合作专项项目(2012DFR70760); 国家软科学研究计划项目(2012GXS2B008) ;长江科学院中央级公益性科研院所基本科研业务费(CKSF2012029/KJ,CKSF2014035/KJ,CKSF2014032/KJ)

肖 潇(1986-),女,湖北武汉人,工程师,硕士,主要从事水环境遥感研究,(电话)027-82926895(电子信箱)danny_xiaoxiao@126.com。

10.11988/ckyyb.20150100

2016,33(01):31-37

P237;TP79

A

1001-5485(2016)01-0031-07

猜你喜欢
水质评价反演水质
反演对称变换在解决平面几何问题中的应用
浞河浮游藻类的调查研究与水质评价
关于水质监测对环境保护的意义
一月冬棚养虾常见水质浑浊,要如何解决?这9大原因及处理方法你要知晓
这条鱼供不应求!虾蟹养殖户、垂钓者的最爱,不用投喂,还能净化水质
图像识别在水质检测中的应用
滻灞河水质评价方法研究
基于概率统计和模糊综合评价法的水质评价模型及其应用——以拉萨河水质评价为例
拉普拉斯变换反演方法探讨
等效源反演成像在激发极化法中的研究及应用