达里诺尔湖溶解性有机质荧光特征与人工神经网络非线性响应研究

2020-11-25 08:28马淑芹
环境科学研究 2020年11期
关键词:人工神经网络湖水平均值

孙 伟, 夏 瑞, 王 晓, 王 璐, 陈 焰, 马淑芹, 张 远, 胡 泓

1.中国环境科学研究院, 环境基准与风险评估国家重点实验室, 北京 100012

2.中国海洋大学环境科学与工程学院, 山东 青岛 266100

DOM(溶解性有机质)对河湖水生态系统结构与功能具有重要影响,研究多因素驱动下DOM的荧光特征与响应关系是当前环境科学的热点和难点. 达里湖是我国内蒙古自治区重要的综合性自然保护区和东北亚最大的候鸟集散地之一,近年来受自然气候和人类活动多重影响下,湖泊生态退化严重、湖面持续萎缩、水质持续恶化,严重影响周边生态环境质量和生态系统健康,受到当地政府和周边国家的关注[1-2]. DOM通常是指能够通过0.45 μm滤膜的一类有机物质,其广泛存在于土壤、水体、沉积物中[3-4],含有丰富的碳、氮、磷等湖泊生源要素,可以提供微生物繁殖活动所需的能源和碳源[5-7]. 此外,DOM的浓度和组成直接或间接影响着水环境中生物的活动,以及其他元素的迁移转化过程,是表征河湖水生态环境演变和退化的重要参考指标之一[8-9]. DOM测定过程相对简单,仅需过滤即可检测,可通过DOM的光谱特征来反映水质状况,在国内外应用较为广泛. Heibati等[10]通过紫外和荧光光谱分析发现,DOM可以为水质污染提供非常稳定的背景信号,只要考虑到潜在的干扰物,DOM荧光是饮用水网络中水质变化的敏感指标. SHANG等[11]通过研究DOM荧光光谱与修改后的营养状态指数之间的联系,建立了一种新的水库营养状态监测模式. 陈军等[12]对太湖氮磷浓度与水质因子关系的研究表明,太湖水体中ρ(TN)、ρ(TP)与ρ(DOC)、ρ(Chla)和浊度之间均存在较强的线性相关关系,可用DOM等参数预测ρ(TN)和ρ(TP). 这也证明了DOM的来源和浓度与富营养化有一定联系.

河湖生态环境退化成因机制较复杂,通常涉及多个环境因子的复合影响和内在交互作用,具有较大的非线性变化特性,难以用简单的数学方法建立要素之间的响应关系. 人工神经网络模型(ANN)因其优秀的非线性映射能力和自我学习训练能力,对光谱特征的识别、提取、匹配和分类具有很好的辅助作用,并能推演有机质组分与水质之间的相关性[13]. Maurício等[14]利用人工神经网络模型建立ρ(TSS) 与DOM的响应关系,结果表明人工神经网络模型验证过程平均误差低至19%,决定系数(R2)大于0.60,实现了利用低传感器预测多光谱波段,从而进行水质监测. 王娟等[15]通过平行因子法结合自组织映射神经网络,建立了pH、ρ(DO)、ρ(COD)、ρ(BOD5)等水质参数与荧光组分的多元线性回归方程,求得相关系数均大于0.50,发现各荧光组分可以在一定程度上模拟水质参数的变化情况. 与一般数学模型相比,人工神经网络模型具有更强的适应性和灵活性,对于科学诊断和预测现实流域水生态系统多要素相互作用的非线性关系具有较好的模拟精度和效率.

该研究以内蒙古达里诺尔湖(简称“达里湖”)为研究对象,基于前期对达里湖DOM特征及来源的分析基础上[16],开展达里湖三维荧光特征分析,并进一步利用人工神经网络模型方法,建立DOM与湖体主要水质指标的响应关系,通过多参数敏感性分析识别DOM的主要环境驱动因子及其非线性响应规律,以期为我国河湖生态环境问题诊断、溯源和预测提供科学参考.

1 材料与方法

1.1 研究区概况

达里湖(116°26′E~116°41′E、43°13′N~43°23′N)位于内蒙古自治区赤峰市克什克腾旗境内,东部是贡格尔草原,西边为内蒙古锡林郭勒草原自然保护区,南临浑善达克沙地,是内蒙古自治区东部主要的水资源地. 达里湖南北长21 km,东西宽15 km,周长约79 km,湖面积约190.09 km2,湖面海拔约1 226~1 228 m. 近年来,达里湖水面面积不断萎缩,从1972年的233.15 km2降至2016年的191.43 km2,下降速率为8.77 km2(10 a)[17]. 由于湖泊面积的改变,达里湖不同区域的水深存在一定程度的波动,由西南到东北逐渐变浅,湖水最深处约13 m,平均水深6.7 m[18].

1.2 样品采集与处理

1.2.1手动监测采样

于2018年9月(秋季)和2019年6月(夏季)对达里湖进行水质样品采集. 达里湖周边无明显工业、企业污染来源,采用网格布点法,将达里湖进行网格剖分,利用网格的交点布置水样监测点. 由图1可见,主湖区第一次设置17个采样点(D1~D17),第二次采样在第一次采样基础上增设了14个采样点(S1~S14),共设置31个采样点,4条入湖河流设置4个采样点(W1~W4). 采集表层0.5 m的水样,采集和运输保存过程根据GBT 14581—1993《水质、湖泊和水库釆样技术指导》以及《水和废水监测分析方法(第四版)》要求进行. 采用HI83200便携式水质测定仪(Thermo Orion Star,美国)现场测定ρ(DO)和pH,同时采集水样5 L,采集前用待测水样润洗采集瓶2遍,采集完毕后置于车载冰箱中冷藏,并尽快运回实验室进行水化学指标的检测. 水化学指标包括ρ(TP)、ρ(Chla)、ρ(COD)、ρ(DOC)、ρ(TN)、高锰酸盐指数,具体步骤参考《水和废水监测分析方法(第四版)》;光谱测定水样通过0.45 μm微孔滤膜抽滤后进行测定.

图1 达里湖采样点分布

1.2.2无人船监测采样

针对达里湖现有数据资料缺乏的问题,于2019年6月(夏季)利用现代化无人船智能采集设备,搭载多参数水质在线分析仪和在线采样结合的手段,对达里湖水质指标进行采集和在线分析,采用SE40系列中小型无人船,通过基站软件发送测量任务,在GNSS系统定位下,无人船根据任务航线(见图2),自主完成监测任务. 通过无人船搭载的在线水质检测仪检测温度、pH、ρ(DO)、ρ(Chla);同时在对应站点使用无人船遥控采集水样,使用无人船每次可以搭载16个采样瓶,完成16个采样任务后立即取出水样,更换采样瓶后继续采样. 每次共采集水样40个.

图2 无人船监测航线

1.3 分析方法

1.3.1综合营养状态指数

依据《湖泊(水库)富营养化评价方法及分级技术规定》,以Chla作为基准参考标准计算TN、TP、透明度(SD)、高锰酸盐指数的相关权重,再加权求得湖泊水体的综合营养状态指数[19],计算公式:

(1)

式中,TLI(∑)为综合营养状态指数,Wj为第j种参数的营养状态指数的相关权重,TLI(j)为第j种参数的营养状态指数.

1.3.2DOM光谱测定

DOM的光谱吸收系数测定利用紫外分光光度计(UV-2450,日本岛津)测定,以超纯水作为空白对照,通过0.45 μm滤膜,测定波长为240~800 nm处的吸光度,然后计算、校正得到各波长的吸收系数,该研究以355 nm处的吸收系数表示DOM浓度[20],计算公式:

αλ=2.303Dλr

(2)

式中:λ为波长,nm;αλ为波长λ处的吸收系数,m-1;Dλ为波长λ处的吸光度;r为光程路径,m.

1.3.3人工神经网络模型

人工神经网络的培训使用Matlab软件中的Neural Network Fitting Tool(人工神经网络拟合工具)工具包对有限元的计算结果来进行人工神经网络模型培训,采用Levenberg-Maquardt算法,该方法具有训练速度快、误差小的特点.

人工神经网络模型建立之后,采用决定系数(R2)和均方误差(MSE)来评价模型的性能.R2反映了回归直线对观测值的拟合优度,数值越大表明拟合度越好[21];MSE则反映了估计量与被估计量之间的差异程度,数值越小表明模拟误差越小[22].

1.3.4人工神经网络模型参数敏感性分析

人工神经网络模型参数敏感性分析是定量研究自变量变化导致因变量变化程度的一种分析方法,若某自变量的敏感度越大,则该变量变化对因变量的影响越大;反之,自变量的变化对因变量的影响越小[23]. 计算输入变量对输出变量的敏感性和贡献程度,旨在进一步识别变化环境下驱动因子对DOM的影响规律与特征,计算公式:

(3)

式中:Xi为敏感性水平,%;Fc为输出变量变化值;Fr为输入变量变化值;N为模型种所使用数据样本数. 该研究将主要通过模型参数敏感性分析和多次迭代,探索不同环境要素影响下湖体DOM的演变规律.

2 结果与讨论

2.1 达里湖水质现状

由图3可见:2018年9月(秋季)湖区pH在9.61~9.69范围内波动,平均值为9.65;ρ(DO)范围为7.70~10.76 mgL,平均值为9.83 mgL;ρ(COD)范围为31.95~282.36 mgL,平均值为134.79 mgL,其中94.12%的采样点ρ(COD)高于GB 3838—2002《地表水环境质量标准》Ⅴ类标准限值(40 mgL);ρ(DOC)范围为87.74~97.97 mgL,平均值为93.27 mgL;ρ(TN)范围为3.45~5.94 mgL,平均值为3.99 mgL,所有采样点ρ(TN)均高于GB 3838—2002 Ⅴ类标准限值(2.0 mgL);ρ(TP)范围为0.40~0.65 mgL,平均值为0.54 mgL,所有采样点ρ(TP)均高于GB 3838—2002 Ⅴ类标准限值(0.2 mgL);ρ(Chla)范围为6.71~17.37 μgL,平均值为10.96 μgL. 2019年6月(夏季)湖区pH在9.43~9.58范围内波动,平均值为9.48;ρ(DO)范围为6.00~7.87 mgL,平均值为6.64 mgL;ρ(COD)范围为17.94~81.68 mgL,平均值为40.30 mgL,其中51.61%的采样点ρ(COD)高于GB 3838—2002 Ⅴ类标准限值(40 mgL);ρ(DOC)范围为50.71~106.15 mgL,平均值为90.47 mgL;ρ(TN)范围为2.31~4.02 mgL,平均值为3.03 mgL,所有采样点ρ(TN)均高于GB 3838—2002 Ⅴ类标准限值(2.0 mgL);ρ(TP)范围为0.39~0.58 mgL,平均值为0.41 mgL,所有采样点ρ(TP)均高于GB 3838—2002 Ⅴ类标准限值(0.2 mgL);ρ(Chla)范围为4.91~146.43 μgL,平均值为46.46 μgL.

图3 2018年秋季、2019年夏季达里湖水质参数统计

采用综合营养状态指数对2018年秋季和2019年夏季的达里湖水体营养状态进行评价,根据式(1)对达里湖水体综合营养状态指数进行计算. 由图3可见:夏季,达里湖水体的综合营养状态指数在63.01~72.79之间,全湖处于富营养状态,31个采样点中有9个采样点的综合营养状态指数大于70,为重度富营养状态,其余采样点为中度富营养状态;秋季,达里湖水体的综合营养状态指数在58.81~66.62之间,17个采样点中有2个采样点的综合营养状态指数小于60,为轻度富营养状态,其余采样点均为中度富营养状态.

该研究表明,达里湖水体污染严重,ρ(TP)、ρ(COD)和ρ(TN)均超过GB 3838—2002 Ⅴ类标准限值,水体呈富营养化状态. 达里湖周围无明显工业企业污染源,湖区内营养盐及有机物主要由地表径流而来[24];另外,达里湖流域气候干旱,且属于封闭性湖泊,湖水年蒸发量超过补给量,水位持续下降,湖水不断浓缩,这也可能是导致湖泊水质不断变差的原因之一.

对4条入湖河流(亮子河、耗来河、沙里河、贡格尔河)的水质进行分析,结果如图4可见. 由图4可见,与达里湖相比,4条入湖河流的ρ(TP)、ρ(TN)均小于达里湖,表明入湖水体对主湖区水体污染的贡献影响相对较小. 4条入湖河流中,北侧贡格尔河对达里湖的补给量最大,这可能是导致达里湖北侧水质好于南侧的原因之一.

图4 入湖河流与达里湖污染物浓度对比

注: 不同颜色的线条代表不同采样点.

2.2 达里湖水体DOM吸收系数

对2018年秋季、2019年夏季达里湖水体DOM进行分析,由紫外-可见光吸收特性(见图5)可见,达里湖DOM的吸收光谱曲线趋势大致相同,均在190~200 nm波长范围内,DOM的吸光度随着波长的增加而上升;在200~300 nm波长范围内,DOM的吸光度随波长的增加而呈指数降低;大于400 nm波长后,DOM的吸光度基本为0. 综上,DOM的吸收空间差异较大,时间差异较小.

图6 2018年秋季、2019年夏季达里湖DOM水体α(355)值

DOM成分复杂,其浓度难以确定,常用355、400和440 nm处的吸收系数来表示其浓度,该研究以355 nm处的吸收系数〔α(355)〕表示DOM浓度[19]. 由图6可见:夏季达里湖水体α(355)在3.15~8.36 m-1范围内,平均值为5.05 m-1;秋季达里湖水体α(355)在2.86~4.68 m-1范围内,平均值为3.53 m-1. 夏季DOM吸收系数略高于秋季,夏季达里湖水体更易受太阳辐射、大气降水及河流输入等外界因素的直接影响,有机质浓度高于其他季节[25],这与其他湖泊研究结果[26]相似. 此外,达里湖自然保护区是大鸨、鹤类、大天鹅、猛禽等珍稀候鸟的重要繁殖地和栖息地[27]. 春末至秋季期间,约有146种鸟类,数十万只鸟类在此集群和聚集,鸟类的数量和丰富度指数较高[28]. 鸟类的排泄物会向水体分解释放大量营养物质,水中有机质浓度增加[29]. 通过比较其他水域的α(355)发现,达里湖α(355)平均值低于部分富营养化湖泊,如太湖[29]、鄱阳湖[30],高于大部分海洋及海岸带水体[31-34].

2.3 基于人工神经网络的DOM非线性响应模型

根据前期研究,识别了影响达里湖的主要敏感因子,基于获取的主要输入环境要素与DOM吸收系数〔α(355)〕建立多输入单输出人工神经网络模型. 输入指标为与达里湖α(355)变化关系密切的ρ(TN)、ρ(TP)、ρ(Chla)和pH等4项水质指标,DOM吸收系数为模型输出指标. 设置1个隐含层和4个隐藏节点,建立基于机器学习的多输入单输出非参数模型(见图7). 模型一共88组数据样本,设置训练集样本与测试集样本进行模型参数率定和验证,其中,选择总样本数的70%为训练样本,15%为测试样本,15%为验证样本.

图7 达里湖DOM多输入单输出人工神经网络模型结构

对网络训练完成之后,对人工神经网络模型的结果进行检验. 此时网络处于稳定状态,检验人工神经网络模型效果. 若是输出结果与实际结果差距较大,则需对网络的一系列参数重新进行调整赋值,直到输出结果符合要求;若是输出结果与实际结果差距较小,说明模型可用于α(355)与水质指标的拟合[35]. 训练数据回归曲线如图8所示. 由图8可见,模型训练期、验证期、测试期的决定系数(R2)分别为0.91、0.78和0.84,说明模型训练后输出值与实际检测值越接近,模型预测的准确性越高;均方误差(MSE)分别为0.21、0.46和0.66,说明模型拟合效果较好.

人工神经网络模型建立后,根据训练好的模型进行仿真模拟,建立模型α(355)模拟值与实测值的对比(见图9),模型的模拟值与实测值变化趋势基本一致,模型预测平均值为4.66 m-1,实测平均值为4.68 m-1,表明人工神经网络模型对达里湖水体α(355)模拟的准确性和稳定度均较高,模型在研究区域有较好的适用性.

2.4 人工神经网络模型参数敏感性分析

基于建立的水质指标与α(355)响应关系的人工神经网络模型基础上,进一步通过改变单因子输入边界条件开展模型参数敏感性分析,即通过改变4个水质指标,以1%为步长单位,ρ(TP)、ρ(TN)、ρ(Chla)和pH分别从0~100%的动态递增变化,进行100次模拟情景迭代分析,利用人工神经网络模型模拟α(355)输出的数值变化,探索变化环境下不同水质因子改变对α(355)输出的影响规律,旨在识别导致达里湖α(355)变化的主要驱动影响要素与贡献.

图8 基于Matlab的人工神经网络模型训练和检验结果

图9 α(355)模拟值与实测值对比

基于人工神经网络模型自动迭代计算100次后的α(355)响应模拟曲线如图10所示. 由图10可见,4项水质指标中ρ(Chla)对达里湖α(355)影响较大,ρ(TN)变幅大于60%后对α(355)影响较显著,ρ(TP)的改变对α(355)影响不显著,而pH的增加会导致α(355)呈明显的下降趋势.

图10 α(355)响应变化特征

当达里湖ρ(Chla)变幅低于40%时,对α(355)的影响相对较弱;当ρ(Chla)变幅在40%~60%之间时,α(355)呈显著上升趋势;当ρ(Chla)变幅大于60%时,α(355)呈突变上升趋势. ZHANG等[36]在太湖运用野外调查结合实验室探究方法发现,ρ(Chla)与DOM荧光值呈显著正相关,与人工神经网络模型模拟结果较为一致.

pH与α(355)呈较显著负相关,尤其当pH大于12后,达里湖α(355)呈显著下降趋势. 于莉莉等[37]研究pH对滇池DOM光降解作用的影响时发现,pH在4~9之间时,DOM荧光强度随pH增加而逐渐下降. 杨毅等[38]发现,pH在5~9时,DOM粒子聚合度随pH增加而降低,而pH大于10时,DOM的聚合度会增加,荧光强度降低.

ρ(TN)与α(355)的相关性呈先增后减再增的变化趋势. 当ρ(TN)增幅小于60%〔ρ(TN)<6.70 mgL〕时,α(355)呈下降趋势;当ρ(TN)增幅超过60%后,α(355)呈显著上升趋势.ρ(TP)与α(355)呈不明显的正相关,当ρ(TP)增幅在20%~80%之间〔0.50 mgL<ρ(TP)<0.76 mgL〕时,α(355)呈缓慢上升趋势;ρ(TP)增幅大于80%后,α(355)略微下降. 张柳青等[39]对高邮湖DOM分析发现,类腐殖质荧光特征能在一定程度上预测ρ(TN)、ρ(TP)和ρ(Chla)水质指标的变化情况.

通过计算敏感性水平得出,α(355)对ρ(Chla)变化最为敏感,敏感性水平为31.95%;其次为pH和ρ(TN),α(355)对二者的敏感性水平分别为28.53%和25.54%;α(355)对ρ(TP)变化的敏感性最低,敏感性水平为8.16%. 叶绿素a通常与水体中的富营养化有较大相关性,可见达里湖DOM对富营养化的发生具有显著的影响,后期可深入研究DOM与湖体水生态退化的机制,模拟预测复合环境条件下的湖体富营养化发生趋势和演变规律.

3 结论

a) 通过分析达里湖水质数据发现,达里湖水质水体呈富营养化状态. 夏季达里湖DOM吸收系数在3.15~8.36 m-1之间,秋季水体在2.86~4.68 m-1之间. 夏季达里湖水体更易受太阳辐射、大气降水及河流输入等外界因素的直接影响,DOM浓度较高.

b) 以2018—2019年达里湖水质实测数据和无人船监测为基础,利用人工神经网络模型,构建DOM吸收系数的神经网络模型. 模型验证期的决定系数(R2)为0.78,测试期R2为0.84,表明模型有较好的适用性.

c) 人工神经网络模型参数敏感性分析显示:α(355)对ρ(Chla)变化最为敏感,敏感性水平为31.95%;其次为pH和ρ(TN),α(355)对二者变化的敏感性水平分别为28.53%和25.54%;对ρ(TP)变化敏感性最低,为8.16%.

猜你喜欢
人工神经网络湖水平均值
平均值的一组新不等式
湖水和北风忆
心中有湖水
鄱湖水文之歌
涟漪湖水
利用人工神经网络快速计算木星系磁坐标
人工神经网络实现简单字母的识别
基于改进人工神经网络的航天器电信号分类方法
变力做功时运用F=F1+F2/2的条件
基于人工神经网络的经济预测模型