藻类生长预测模型的比较研究
——以洪湖水体为例*

2022-06-30 07:06郭正强严平川向宣好鲍仲涛
湖泊科学 2022年4期
关键词:丰水期洪湖富营养化

郭正强,严平川,向宣好,鲍仲涛

(1:长江大学资源与环境学院,油气地球化学与环境湖北省重点实验室,武汉 430100)(2:湖北省荆州市水文水资源勘测局,荆州 434000)

近年来湖泊的水体富营养化和藻类快速生长现象较为严重和普遍,许多学者对湖泊的生物组成[1]、水质变化[2]、湖泊富营养化[3]、藻类化学分类[4]、藻类长时序变化及其驱动因子[5]等方面进行研究.藻类是水生态系统的重要成分,其生长状况如藻类结构、细胞数量等指标受到生长区域水体内各项水质指标的影响,也直接反映了水体富营养化的程度.张蓉[6]就不同类型的湖泊水环境从透明度、氮磷营养水平、水温、水深以及CODMn污染等方面研究了藻类不同生长时期对水环境影响程度,刘巧红等[7]采用结构方程模型并结合其他方法对叶绿素a进行预测,通过引入物理环境、CODMn、营养盐和浮游植物4个潜变量以及预先筛选的5个影响因子建立复杂关系,以揭示叶绿素a与富营养指标因子的关系,卢碧林等[8]探究了洪湖在2009-2010年间的富营养化程度以及利用DPS等软件分析了藻种生物量与其环境因子之间的响应关系,并对优势藻类进行了分类.李玉照等[9]结合绝对主成分多元线性回归分析、结构方程模型以及人工神经网络模型对叶绿素a和相关因子进行定量相关分析,并对湖泊面积及水动力方面对叶绿素a的影响进行探讨.神经网络的发展让藻类生长预测方法更加多元化,已经应用于藻华暴发预测[10]、生长状态软测量[11]、富营养化气象驱动因子分析[12]以及水库藻类时序数据预测[13]等方面,并取得了阶段性研究进展.神经网络能在非线性函数逼近方面有很大优势,能够更好地近似变量间的复杂关系,本文细化不同水量不同营养程度,运用神经网络和传统数理统计方法进行藻种生物量的预测.

河湖健康评价是河湖管理的重要内容,是检验河长制湖长制“有名”“有实”的重要手段.湖北省也已制定省级河湖健康评估标准,洪湖作为长江中游典型湖泊也是湖北省重要湖泊之一,其健康程度的监测以及防控至关重要.选择适合的藻类生长预测模型能对洪湖的营养状态以及浮游植物动态的研究有所帮助,有利于后期河湖健康评估工作的开展.

1 样品采集与方法介绍

于2014-2019年逐月上旬在湖心及出入口布置5个站点采集水样,采样点如图1所示.

图1 洪湖采样点分布

采用25#浮游生物网在水面及水深0.5 m 处作“∞”字形来回采集水样,湖泊、水库采样500 mL,采样量视浮游植物分布量而定,若浮游植物数量较少,也可采样1000 mL.所获样品加鲁哥氏液固定,将水样放置在低温避光处,沉淀浓缩后在显微镜下分门类计算藻种生物量.采样现场测水温(T)和溶解氧(DO)浓度,用透明度盘测定透明度(SD),带回实验室的水样低温保存并加相应试剂固定,采用碱性过硫酸钾消解紫外分光光度法(GB 11894-1989)测定总氮(TN)浓度,采用钼酸铵分光光度法(GB 11893-1989)测定总磷(TP)浓度,依据(GB 11892-1989)测定高锰酸盐指数(CODMn).使用分光光度法(SL88-1994)测定叶绿素a(Chl.a)浓度.

采样点蓝田是四湖总干渠进入洪湖的主要区域,其中包括上游片区的生活、工业、农业等污水; 官墩湖滨存在湿地; 施墩河口为洪湖水体进入长江的出口,其水体经过了湖泊自净,受污染情况较轻.

2 分析方法

2.1 湖泊营养程度评价

根据实测水质数据采用综合营养状态指数法[14]进行湖泊营养状态评价,计算公式如下:

(1)

式中,TLI(∑)为综合营养状态指数;TLI(j)为第j种参数的营养状态指数;Wj为第j种参数的营养状态指数的相关权重.

以Chl.a作为基准参数,则第j种参数的归一化的相关权重计算公式为:

(2)

式中,rij为第j种参数与基准参数Chl.a的相关系数;m为评价参数的个数.

26个主要湖泊调查数据的计算结果. 中国湖泊(水库)的Chl.a与其它参数之间的相关关系rij及rij2见表1.

表1 Chl.a与其它参数的相关关系*

2.2 回归分析

回归分析可以判断影响因变量的主要因子.本文根据不同的富营养化程度不同的水量时期将藻种生物量作为y值,将T、DO、TP、TN、CODMn以及SD等作为自变量进行逐步回归分析,得到回归方程,依据方程来判断影响藻种生物量的主要因素.

逐步回归分析可以找出对因变量影响显著的因子,在建立回归方程中,每步只挑选一个能使残差平方和下降最多的因子,还要通过给定信度的F检验,重复该步骤直至待引入因子中不含有对因变量作用显著的因子,并且将一些由于新引入的因子导致其显著性变小或不显著的因子从分析中剔除.进而得到对因变量影响最为明显的线性回归方程.

对于F检验,假设H0:回归参数均为0;H1:至少一个回归参数不为0.

检验使用统计量:

(3)

式中,SSR为回归平方和,SSE为残差平方和,n为样本个数,p为自变量个数.若F≥Fα(p,n-p-1)则认为模型的总体回归效果显著.

2.3 BP神经网络

自2013年第一个现代深度学习网络AlexNet的产生,深度学习网络得到重大发展,在各个行业逐步运用.BP神经网络作为目前应用最为广泛的神经网络之一,其采用误差的反向传播算法进行训练的多层前馈神经网络,优点在于有很强的非线性映射能力,隐藏层的个数可以根据实际情况自行拟定.通过对自变量的数值矩阵和目标数值矩阵训练使得网络逼近于一个函数,以此得到近似的因变量与自变量的映射关系,从而实现对未知目标的预测.

2.4 生物多样性指数

Shannon指数(H′)用来描述种的个体出现的紊乱和不确定性,不确定性越高,多样性也就越高,该指数能够描述两方面的信息:种类丰富度和种类中个体分配上的均匀性.其公式如下[16]:

(4)

式中,S为群落中所有物种数目,N为群落中所有个体数量,ni为群落中第i个种的个体数量.

3 数据分析

3.1 富营养化评价

对洪湖5个实测站点2014-2019年12个月的水质数据分丰(5-9月)、平(3、4、10-11月)、枯(12-2月)3个水期进行富营养化评价,得出各水期的富营养化程度,分析不同水期各站点不同富营养程度占比(图2).

图2 富营养化程度占比

从时间上看,全年内,洪湖营养状态多数处于中营养和轻度富营养,极少数出现中度富营养.丰水期,茶坛岛和官墩中营养程度占比分别为50%和65%,大口、蓝田和施墩河口轻度富营养化程度占比分别为63%、67%和60%.平水期,茶坛岛、官墩中营养程度占比分别为59%和70%,大口、蓝田和施墩河口轻度富营养化程度占比分别为67%、55%和62%.枯水期,大口中营养化程度占比最大,为55%,其余4地中营养程度占比均小于50%.从空间上看:蓝田为四湖总干渠与洪湖连接处,受上游污水汇入影响,水体富营养化程度最高,靠近湖泊2个出口的大口和施墩河口站也受附近居民生活影响,水体富营养化程度高于官墩和茶坛岛,但湖泊自净能力使得施墩河口的富营养化状况略好于蓝田.由于存在湖滨湿地且离入湖口较远的原因,官墩的营养水平最低,多数时间处于中营养状态.

3.2 藻类分析

根据2014-2019年藻类藻种统计数据对洪湖各采样点采用Shannon指数(e为底)进行生物多样性分析,如图3.

图3 各采样点Shannon指数

对各采样点2014-2019年丰、平、枯时期进行生物多样性分析发现Shannon指数总体处于2.10~2.45之间,各地各时期生物多样性差别不大,其中5个采样点的平水期生物多样性要略优于枯水期,但丰水期采样点之间差异较为明显,官墩的Shannon指数最小,施墩河口最大.从整体上分析,蓝田、施墩河口的生物多样性指数高于其余3个样点.

对洪湖水体的5个站点2014-2019年12个月的藻类相对生物量按照丰、平、枯3个不同水期统计分析,发现丰水期、平水期优势种为蓝藻,藻类相对生物量为70%~80%,枯水期茶坛岛、蓝田优势种为硅藻,其余3个站点为蓝藻.5个站点丰、平、枯3个时期不同门类藻类相对生物量见图4.

图4 洪湖不同时期藻类相对生物量

从总体上看,2014-2019年洪湖5个站点丰水期和平水期的藻类相对生物量相近,其中官墩的蓝藻相对生物量最高,枯水期官墩蓝藻相对生物量分别高出茶坛岛和蓝田20%和25%.这是因为官墩站水质较好,总藻密度较低,检出的藻类细胞中蓝藻出现比例高于其他门类,成为优势门类,使得蓝藻在官墩站的相对生物量远高于其他站点.

与丰水期相比,平水期处于洪湖出入口的大口、蓝田和施墩河口受输入营养物质的减少和水温的降低,蓝藻生长速度降低,导致蓝藻相对生物量下降10%以上.茶坛岛和官墩受外源营养物质输入的影响不大,故蓝藻门类下降不明显.

枯水期5个站点中茶坛岛和蓝田硅藻门类增加最为明显.这是因为当水温高于25℃时,硅藻生长受到抑制[7].而低水温环境抑制了蓝、绿藻生长,更利于硅藻生长.

除施墩河口外,其余4个站点的绿藻相对生物量均为枯水期>平水期>丰水期,原因在于随着水量的减少,水体TN、TP浓度增加,而TN、TP浓度偏高的水体对绿藻生长的促进作用最大,从而引起绿藻密度的小幅上涨.

3.3 回归分析与神经网络预测

根据3.1分析,2014-2019年洪湖水质处于中营养和轻度富营养状态.为了进一步分析不同水量、2种富营养化程度下的藻种生物量y与T、DO、TN等8项指标关系,将分为全年、全年+中营养化时期、全年+轻度富营养化时期、丰水期+中营养化、丰水期+轻度富营养化、平水期+中营养化、平水期+轻度富营养化、枯水期+中营养化和枯水期+轻度富营养化9种不同时期讨论.建立了相关系数矩阵,具体见表2.

(2)选用自制的“护理职业性别刻板印象”问卷,通过查阅文献及专家咨询形成初稿,然后采用德尔菲法对量表内容效度进行评价,检验问卷信度,并进行必要的修改形成终稿。调查内容包括个人基本资料和护理职业性别刻板印象量表,量表共2个条目:条目1表示认为男性适合护理职业的情况,条目2表示认为性别对护理职业的重要程度。条目采用1~3级正向计分,量表总分等于各条目分之和,被试者分值越高,表明其对护理职业的刻板印象越深。量表经3位护理学专家和2位教育学专家的审阅及修改,具有良好的内容效度,该量表重测信度为0.85,具有良好的信度。

据表2分析,全年与藻种生物量显著相关的因子有透明度、CODMn、水温和溶解氧,自相关系数分别为-0.147、0.427、0.520和-0.207;全年+中营养化时期、全年+轻度富营养化时期和平水期+轻度富营养化与藻种生物量显著相关的因子有CODMn、水温和溶解氧,自相关系数分别为0.302、0.484和-0.188,0.464、0.527和-0.308以及0.575、0.452和-0.491;丰水期+中营养化与藻种生物量显著相关的因子有水温,自相关系数为0.519;丰水期+轻度富营养化与藻种生物量显著相关的因子有CODMn和水温,自相关系数分别为0.257和0.540;平水期+中营养化与藻种生物量显著相关的因子有CODMn,自相关系数为0.463;枯水期+中营养化与藻种生物量显著相关的因子有总磷,自相关系数为-0.378;枯水期+轻度富营养化与藻种生物量显著相关的因子有CODMn,自相关系数为0.328.故水温和CODMn在藻细胞生长过程中影响最为关键,其水温仅在平水期+中营养化、枯水期+中营养化和枯水期+轻度富营养化时期不显著,CODMn仅在丰水期+中营养化和枯水期+中营养化时期不显著.

表2 各时期藻种生物量与影响因子相关系数

选择对藻种生物量影响显著的因子进行逐步回归分析与神经网络训练,使用2014-2018年的数据进行训练和验证,2019年的数据进行预测,对比2种预测方式在不同时间尺度上的准确性.使用均方根误差(RMSE)进行比较.

3.3.1 逐步回归 由表3可知,影响藻类生长的因子主要有水温、CODMn、总氮、总磷、溶解氧和透明度,并且在不同时期影响程度不同.全年、丰水期+中营养、丰水期+轻度富营养、全年+轻度富营养和全年+中营养藻种生物量与CODMn、温度、总磷、总氮有关,可通过减少营养物质的输入来抑制藻种生物量的增长,枯水期+中营养和平水期+轻度富营养化还应该注重湖泊溶解氧的改善.除枯水期外,其他7个时期的回归方程相关系数都达到了0.5以上,说明回归方程能在一定程度上解释所选环境因子对藻种生物量的影响.此外,显著性检验均小于0.05,说明逐步回归法显著性良好,可作为藻种生物量变化预测的一种方法.

表3 各时期标准化藻种生物量的逐步回归方程

3.3.2 BP神经网络 使用Matlab对各个时期分别训练和预测得到相应的拟合效果和误差分布,计算逐步回归法和神经网络预测误差的RMSE并进行比较,限于篇幅,仅列出全年拟合效果图,见图5、图6.

图5 全年训练集、验证集、测试集和总体拟合效果

图6 全年训练集、验证集、测试集和总体误差范围分布

从图5分析得出,全年训练集、验证集和测试集的拟合效果很好,没有出现欠拟合和过拟合现象.全年、全年中营养化时期、全年轻度富营养、丰水期+中营养化、丰水期+轻度富营养化、平水期+中营养化、平水期+轻度富营养化、枯水期+中营养化和枯水期+轻度富营养化的训练集模拟值与目标值比值R分别为0.95、0.90、0.85、0.94、0.96、0.89、0.82、0.67和0.64,验证集的模拟值与目标值比值R分别为0.94、0.86、0.88、0.91、0.81、0.77、0.83、0.93和0.68,测试集模拟值与目标值比值R分别为0.94、0.85、0.82、0.94、0.82、0.81、0.75、0.89和0.70.说明神经网络训练较好,能够用于预测藻种生物量变化情况.

图6说明,全年模型在训练集、验证集和测试集中训练或预测所得结果的误差多数位于±3500内,误差集中,模型训练和预测效果稳定,能够较好地反映出藻类生长规律.对于全年+中营养化时期、全年+轻度富营养化时期、丰水期+中营养化、丰水期+轻度富营养化、平水期+中营养化、平水期+轻度富营养化、枯水期+中营养化和枯水期+轻度富营养化超过75%数据的误差范围分别为:±3700、±4023、±3505、±2489、±2330、±6335、±993和±3395.误差范围随时期的细化略有扩大,使得模型预测结果波动性较大,但误差数值的范围依旧保持较好的集中程度.

3.3.3 两种方法比较 BP神经网络与逐步回归分析预测的均方根误差见表4.

表4 预测数据RMSE比较

4 结论与讨论

4.1 结论

通过对洪湖水体营养状态分析及回归分析,找到影响藻类生长的显著影响因素,并预测藻类生长变化,主要结论如下:

1)2014-2019年洪湖水体富营养化程度基本处于中营养和轻度富营养之间,丰水期和枯水期的营养程度低于平水期.

2)洪湖5个站点丰水期和平水期的藻类比例相近,其中官墩的蓝藻比例最高.与丰水期相比,平水期处于洪湖出入口的大口、蓝田和施墩河口蓝藻占比下降10%以上.茶坛岛和官墩受外源营养物质输入的影响不大,故蓝藻占比下降不明显.枯水期5个站点中茶坛岛和蓝田硅藻比例增加最为明显.适当的营养盐和低温环境也有助于硅藻生长.除施墩河口外,其余4个站点的绿藻占比均为枯水期>平水期>丰水期.

3)不同时期控制显著变量可以达到防治水华污染的效果.丰水期+中营养化时期可通过控制水体CODMn浓度,丰水期+轻度富营养化控制总磷浓度来抑制藻类生长过快的状况,平水期+中营养化、平水期+轻度富营养化、枯水期+中营养化和枯水期+轻度富营养化时期可通过控制CODMn与总氮、总磷浓度来降低水华发生概率.

4)不同情形采用不同方法预测藻类生长规律.对于全年、全年+中营养化时期、全年+轻度富营养化和丰水期神经网络相对于常规的逐步回归预测体现出巨大优势,误差的RMSE要明显小于逐步回归法,平水期两种方法相当,均有一定误差.枯水期逐步回归的预测结果要优于神经网络.

4.2 讨论

1)藻类的生长受到多方面影响,是一个非线性问题.先前的研究者已经在藻华暴发预测,生长状态软测量,富营养化气象驱动因子分析以及水库藻类时序数据预测等方面取得较好成果,随着近些年快速发展,神经网络已经能很好的对非线性问题进行函数逼近并进行预测,神经网络用于藻类数量变化的预测具有科学性和合理性.

2)BP神经网络还存在以下局限性:当数据量较少时,网络难以训练成型,会极大降低网络效率;当数据量过大时,网络的训练容易产生过拟合现象,导致网络的泛化能力降低,预测结果会产生较大偏差,为了避免出现上述情况,应当在网络训练时适度进行人为干预.

3)影响藻种生物量的因素除了常见的水质指标还与多种气象因子有关,例如气温显著影响藻类的生物量和季节变化,风是藻类生物量空间分布差异的主要原因,降雨是重要的辅助因素.温度处于15~20℃时藻类的生长情况会受到强风和频繁降雨的抑制,当温度处于20~30℃时,由风产生的水力扰动会更加明显,不同风速的扰动也会使叶绿素浓度发生变化[17].这些气象因素的改变也会影响模型的精准度.

4)藻类是水生生物中的一大类群,其生长情况除了与外界环境有关,还与生物的内在特性有联系,建立适宜的生态动力学模型有利于藻类生长预报.通过结合遗传算法与BP神经网络的结合能够使模型预测的精准度提高.在之后的研究中将采用多方式的耦合模型进行探讨,进一步探索影响藻类生长的内在联系.

猜你喜欢
丰水期洪湖富营养化
南宁市主要地表水系放射性水平及不同水期放射性水平研究
鱼病肆虐,4000万打水漂!洪湖龙口有水产人在行动
洪湖水浪打浪
2016-2019年天桥区城乡生活饮用水水质检测结果分析
情规
洪口水库近年富营养化程度时间分布的研究
瞻仰洪湖烈士纪念碑
“缩水”的鄱阳湖
高效溶藻菌对富营养化水体的治理效果
中国农业面源污染研究进展