SWAT模型在我国流域水环境模拟应用中的评估验证过程评价

2020-11-25 09:10秦成新杜鹏飞

环境科学研究 2020年11期

荣易，秦成新，孙傅，杜鹏飞

清华大学环境学院，北京 100084

流域水环境模型是对水体及其汇水区受自然过程和人类活动影响呈现出的复杂响应关系的抽象定量表达，是评估气候变化、土地管理、人类活动等对流域水环境影响的重要工具[1]. 近年来，流域水环境模型在我国得到广泛应用，在非点源污染负荷估算[2]、污染负荷源解析[3]、水环境容量核算[4]、流域规划情景预测[5]等方面发挥了支撑作用. 由于真实环境系统的复杂性，流域水环境模型通常具有复杂的非线性结构，部分参数、输入及边界条件难以直接获取，需要通过主观估计确定，导致模型的模拟结果存在不确定性. 为了评估和管控模型不确定性对管理决策的影响，模型评估验证是模型开发和应用不可或缺的工作. 模型评估验证是指为确定模型及其结果的质量是否适宜支持管理决策而收集和分析信息的过程，具体包括模型遴选、收集输入数据、确定边界条件、建立模型并识别参数、模型结果不确定性分析等步骤.

SWAT(soil and water assessment tool)模型是美国农业部农业研究所(USDA-ARS)开发设计、目前已得到广泛应用的成熟模型，它可在日尺度上连续模拟土壤蒸散发、地表径流、地下水与地表交互及污染物迁移等水文水质过程[6]. SWAT模型也是我国流域水环境模拟的常用模型之一，已有大量应用案例[7]. 然而，由于该模型是基于美国相关研究开发的，也出现了不适用于我国流域的情况[8]. 因此，将SWAT模型应用于我国流域水环境管理决策时，必须开展完整的模型评估验证. 但是，利用SWAT模型开展应用研究的现有文献对模型评估验证的重视程度参差不齐，并且通常重点关注模型参数识别、不确定性分析等步骤，对模型空间概化、输入数据获取等缺少评估[9-11]，尚不足以为该模型的评估验证提供规范性指导.

该研究针对流域水环境模型评估验证过程的质量问题，以SWAT模型为例，梳理总结模型评估验证过程的评价方法，并利用该方法评价2015—2017年发表的SWAT模型在我国流域应用研究中的模型评估验证过程，分析模型评估验证的现状以及存在的问题和不足，以期为完善SWAT模型的评估验证方法、促进模型的标准化应用提出建议.

1 SWAT模型评估验证过程的评价方法

为了评价现有SWAT模型应用研究中模型评估验证过程的质量，该研究结合SWAT模型的建模过程和模型评估验证的基本步骤，梳理总结了SWAT模型评估验证过程的评价方法，具体流程如图1所示.

图1 SWAT模型评估验证过程的评价方法

1.1 确定研究或决策目标阶段

本阶段的评价重点是SWAT模型应用中是否清晰识别研究区域、确认研究目标并分析模型应用的期望产出. 识别研究区域需关注研究区域的地理位置、面积及流域划分等. 根据模型应用关注的主要问题，可将研究目标分为解释研究、预测研究和方法研究. 解释研究侧重利用模型解释流域水文水质过程的历史和现状，预测研究侧重模拟输入要素变化下流域的水文水质响应，而方法研究侧重提出模型构建及评估验证新方法. 模型的期望产出应匹配研究目标，选定重点关注的水文水质过程及变量，如河道径流、泥沙及氮磷含量等.

1.2 获取输入数据阶段

本阶段的评价重点是模型输入数据的可溯源性、准确性、精密性和完备性，由此判断其是否足以支持模型建立与分析. 可溯源性是指输入数据应从可靠来源获取，并详细说明来源；准确性和精密性是指输入数据的产生程序、质量控制、误差水平等应符合相关标准和规范要求；完备性是指输入数据的数量和代表性应满足既定研究目标的需求.

1.3 构建模型及率定验证阶段

本阶段的评价内容包括流域空间划分、行为设定、参数选择、参数识别方法、率定期和验证期长度、模拟效果评价指标等. 模型概化时，流域空间划分方式和人类活动行为等设定应符合流域实际并满足研究需求. 模型参数识别时，应重点关注对流域水文水质响应灵敏的参数，并根据研究目标选择适宜的参数识别方法，如基于定向搜索的寻优方法和基于采样的贝叶斯方法. 模型参数识别和验证时，还应关注率定期和验证期观测数据的时间长度以及二者的相对长短，并选择适当的评价指标评判模型模拟效果.

1.4 展示模型结果阶段

本阶段的评价重点是模型模拟效果和模拟结果的不确定性，即评价模拟结果与观测数据的吻合程度，并表征模拟结果的不确定性及其对决策的影响.

2 我国SWAT模型评估验证过程评价

该研究评价的我国SWAT模型应用研究文献均来自中国知网(https:www.cnki.net). 数据检索策略：主题为SWAT模型，并限制出版时间为2015—2017年，对文献类型不做限制. 从检索结果中排除综述性文章、同一研究同时发表于期刊及作为学位论文主要内容、研究区域位于我国境外等情况后，共保留428篇文献，建立我国SWAT模型评估验证过程评价研究文献库(简称“研究库”)，其中2015年145篇、2016年158篇、2017年125篇.

2.1 确定研究或决策目标

2.1.1识别研究区域

图2 研究流域的位置和面积分布

将研究库中文献的研究区域按地理位置和流域面积分类，结果如图2所示. 其中，地理位置按流域所在省份归类至我国地理区划，流域面积按全部研究流域面积的四分位数归类，分为小型流域(0.62～1 911.5 km2)、中小型流域(1 911.5～5 394.5 km2)、大中型流域(5 394.5～19 032.75 km2)和大型流域(19 032.75～805 000 km2). 从地理位置看，SWAT模型在西北地区的应用研究最多，占到总数的27.1%，其中，应用于大中型及以上流域的文献达到75篇，远超其他区域. 这与SWAT模型适合开展大尺度流域模拟，且干旱半干旱的西北地区更关注SWAT模型揭示的水资源变化趋势有关. 在水资源较为缺乏的华北和东北地区，SWAT模型的应用也较为广泛，分别占到文献总数的16.1%和15.7%. 从应用的具体流域来看，海河流域[12]、渭河流域[13]、长三角水系[14-15]和三峡库区[16-17]等是研究热点.

2.1.2确认研究目标

将研究库中文献的研究目标分类，结果如图3所示. 由图3可见：解释研究的文献有294篇，目标包括模拟水文水质过程(如蒸散发量[18]、融雪径流[19]等)和辅助流域管理(如计算生态需水量[20]、水环境容量[21]等)；预测研究的文献有183篇，目标主要是分析气候、土地利用、管理措施等不同驱动条件下流域的水文水质响应[22-23]；方法研究的文献有61篇，目标涉及模型改进及与其他模型耦合[24]、模型输入和结构不确定性分析[25]、参数识别和灵敏度分析方法[26]等. 综上，我国对SWAT模型的研究仍以应用为主，对模型开发和应用中涉及的方法学研究仍有探索空间.

图3 各类研究目标对应的文献数量

图4 各类期望产出对应的文献数量

2.1.3分析期望产出

研究库中文献模拟或预测的流域水文水质变量主要包括河道径流量、其他水文过程量(如蒸发量等)、河道泥沙含量、河道污染物含量等，各类期望产出涉及的文献数量如图4所示. 应用SWAT模型研究河道径流量的文献最多，占68.0%，其次是研究河道污染物含量，占25.9%. 研究河道泥沙含量和蒸发量等其他水文过程量的文献相对较少，这可能与相应的监测数据获取困难有关. 随着我国日益重视水生态保护，SWAT模型也被用于模拟河道重金属[27]、农药[28]等非常规污染物，但目前相关文献数量极少，尚有较大发展空间.

2.2 获取输入数据

SWAT模型必需的输入数据包括数字高程模型(DEM)、土地利用类型分布、土壤分布与属性、气象等数据. 研究库中文献输入数据的可溯源性总体较好，89.5%的文献提供了所有数据的来源信息，主要来源如表1所示. 由表1可见，当地相关主管部门(如测绘局、气象局、水文局等)是主要的数据来源. 当研究区域较大时，研究者也会使用公开数据库及开源数据. 但是，不同文献对开源数据的描述方式不一致，有的描述为数据名称(如Landsat TM)，有的描述为数据来源(如地理空间数据云等网络数据库)，同一数据集在不同文献中可能出现不同的描述. 为了准确说明模型所用的数据，应同时报告数据来源、名称、版本号等信息，如文献[29].

表1 文献报告的输入数据来源

由于文献使用的数据通常具有可靠来源，因此一般未报告数据的准确性和精密性. 然而，研究者自行观测的数据(如径流量、土壤理化性质等)，则应尽可能报告数据获取的相关方法和依据，以确保数据质量. 研究库中12篇文献采用了自行观测的数据，其中6篇文献报告了数据观测相关内容，其余则受篇幅所限未作报告.

视研究目标不同，SWAT模型可能还需要流域水文水质、耕地管理措施等数据或信息，需要关注输入数据的完备性. 例如，在耕地比重较大的流域，耕地管理措施(农田耕种行为等)较为重要，研究库中22.7%的文献做了相关设定.

2.3 构建模型及率定验证

2.3.1构建模型

在流域空间划分方面，研究库中67.5%的文献报告了子流域划分结果，54.7%的文献报告了水文响应单元(hydrologic response unit, HRU)划分结果. 在划分HRU时，各土地利用类型和土壤类型的划分阈值越大，计算速度越快，但同时会增加不确定性，因此需要确定合理的阈值. 研究库中36.9%的文献报告了划分阈值，绝大部分不超过20%. 在研究土地利用变化的水文水质响应时，土地利用类型划分阈值通常设为0%，以保留不同土地利用的空间分布信息.

图5 参与灵敏度分析以及被判定为灵敏参数的SWAT模型参数

在行为设定方面，研究库中文献设定最多的行为是农业耕种措施，包括种植、施肥、灌溉、收割等. 这些措施的实施时间通常采用已有文献的调研结果或实地调研获取，在模拟中固定在每年的同一时间. 然而，由于施肥、灌溉等行为受降雨影响较大，固定耕种措施实施时间可能出现降雨时施肥等不合理行为，导致模型模拟与实际出现较大偏差[30]. 为降低这一问题引起的输出不确定性，可对实施时间开展灵敏度分析，并结合降雨时间做出适当调整.

2.3.2模型率定验证

研究库文献中，SWAT模型涉及的95个参数参与了参数灵敏度分析和参数识别过程，其中水文、泥沙和水质相关的参数分别为43、10和42个，如图5所示. 在水文参数中，SCS径流曲线数(CN2)、基流衰退系数(ALPHA_BF)、土壤蒸发补偿系数(ESCO)、土壤持水度(SOL_AWC)、主河道水力系数(CH_K2)、曼宁系数(CH_N2)等在较多的应用案例中表现为灵敏参数，而影响气象、降雪、汇流和侧向流过程的参数通常为不灵敏参数. 在泥沙参数中，影响产沙的通用土壤流失方程耕作管理因子(USLE_C)和水土保持因子(USLE_P)，以及影响河道传输过程的河道泥沙运移方程的线性参数(SPCON)和指数参数(SPEXP)等，在较多应用案例中被判定为灵敏参数. 在水质参数中，氮渗透系数(NPERCO)、磷渗透系数(PPERCO)、生物混合系数(BIOMIX)、磷分配系数(PHOSKD)等与物质迁移相关的参数在较多应用案例中是灵敏参数，而与初始化、物质形态转化、河道反应过程相关的参数通常不敏感. 总体而言，SWAT模型水文模拟的控制过程主要包括产流、蒸散发以及土壤、地下水和河道之间的交互，而水质模拟的控制过程主要是污染物的迁移过程. 由于不同流域的水文条件不同，模型的主要控制过程也会出现变化，因此需要在确定参与灵敏度分析的模型参数前识别流域模拟的主要控制过程，并基于控制过程选择参数[31-32].

研究库中75.2%的文献提及了模型参数灵敏度和不确定性分析过程. 其中，49.3%的文献使用了SWAT-CUP[33]软件，9.6%使用了SWAT自带的灵敏度分析及自动校准模块，6.1%采用手动方式调整参数. SWAT-CUP是专为SWAT模型开发的，能够自动完成SWAT模型参数的灵敏度分析、参数识别和不确定性分析. 在开展参数灵敏度分析时，使用SWAT-CUP的多元线性回归法[34]的文献最多，而LH-OAT法[35]、Sobol法[36]、Morris法[37]等方法也有文献使用. 在参数识别和不确定性分析方法中，SWAT-CUP特有的序列不确定性拟合方法(SUFI-2)[38]使用最为广泛，少量文献使用了粒子群算法(PSO)[39]、复合型混合演化算法(SCE-UA)[40]、广义似然不确定性估计方法(GLUE)[41]等. 由于SWAT-CUP软件的广泛应用，我国SWAT模型应用研究中采用的灵敏度和不确定性分析方法大部分为该软件支持的方法.

在率定和验证期长度方面，研究库中85.7%的文献报告了率定期和验证期观测数据的时间长度. 现有文献中率定期数据时间长度的中位数与验证期接近，均为5年左右，但率定期数据时间长度总体上长于验证期，50%的文献中率定期数据时间长度为验证期的1～2倍，25%的文献中率定期数据时间长度为验证期的2倍以上. 研究库中也有17篇文献在率定期和验证期使用的数据时间长度均不足1年，这可能会制约模型在不同水文条件下的模拟能力.

研究库中文献使用的模型模拟效果评价指标主要为统计学指标，包括相关系数或决定系数(correlation coefficientcoefficient of determination)，相对误差或百分比偏差(relative errorpercent bias)以及纳什效率系数(Nash-Sutcliffe efficiency coefficient)3种，它们在现有文献中分别被使用了345、207和380次. 除此之外，也有少量文献使用均方根误差(root mean square error)、均方根误差与观测值标准偏差比(RMSE-observations standard deviation ratio)、克林-古普塔效率系数(Kling-Gupta efficiency)等评价指标. 国外SWAT模型研究中使用的流量历时曲线坡度偏差、峰值时间及强度偏差等动力学评价指标，在研究库文献中尚未见采用. 已有研究表明，使用动力学评价指标可更好地识别模型参数[42]，与统计学指标组合使用可以提高模型对极低流量的模拟精度[43]，并且有助于发现模型参数或结构问题[44].

2.4 展示模型结果

研究库中文献报告的决定系数和纳什效率系数值较高，所有决定系数均大于0.6，绝大部分纳什效率系数均大于0.5. 两个评价指标的中位数均超过0.8，高于拟合程度“相当好”的标准0.75[45]，说明大部分文献中SWAT模型模拟结果与观测数据的拟合效果较好. 但也有2篇文献的纳什效率系数小于0.5，表明这些文献建立的模型对流域的表征能力弱，模拟结果不可靠.

研究库中文献对模型模拟结果不确定性的讨论相对较少，研究者通常只使用单一的模型“最优”参数开展预测模拟，因而可能导致预测结果出现偏差. 部分文献[46]通过统计所有接受的模拟结果得到模拟结果的95%置信区间，并分析了该置信区间涵盖的监测数据数量和模拟结果标准差，以评价模拟结果的覆盖度和分散性. 国际上一些文献将模型模拟结果的不确定性转换为风险损失费用，以更直观地表现不同决策所需承受的风险[47]，但研究库文献中尚未见类似研究.

3 SWAT模型评估验证问题识别与建议

3.1 模型模拟过程和参数识别的选择

SWAT模型的径流模拟是泥沙模拟的基础，而水质模拟又与泥沙模拟有关. 因此，开展泥沙模拟应首先完成径流模拟，而开展水质模拟则需同时完成径流和泥沙模拟[33]. 然而，部分文献在应用SWAT模型时并未遵守该流程. 例如，在模拟研究区污染负荷时，未率定模型对流量和泥沙的模拟效果，而直接率定模型对总氮、总磷的模拟效果[48]；或仅率定了流量和水质的模拟效果，而未率定泥沙的模拟效果，也未将泥沙相关参数纳入灵敏度分析和参数识别的范围[49]. 相较于流量和水质数据，泥沙数据较难获取，因此模型率定存在客观限制. 但在识别水质过程时，仍应将泥沙相关参数纳入参数识别范围.

从模型参数看，SWAT模型中使用的城市、植物数据库以及径流曲线数(CN2)、曼宁系数(OV_N)等均是基于美国环境特征设定的，直接移用到我国流域可能存在适用性的问题. 已有研究[50]表明，SWAT模型默认的CN2对照表与我国实际情况存在较大偏差. 再例如，研究库中文献开展参数灵敏度分析涉及的95个参数中，仅包含植物数据库中最大潜在叶面积指数(BLAI)这一个参数，但是在其他被忽视的植物参数中，太阳辐射利用率(BIO_E)、作物最佳叶面积曲线第一参数点(FRGRW1)等参数可能对径流模拟是灵敏的[51]. 因此，在我国开展SWAT模型评估验证时，建议尽可能使用本地化数据库或将相关模型参数纳入灵敏度分析，以降低模型模拟的不确定性.

3.2 参数取值超出合理范围

如前文所述，SUFI-2为SWAT模型最常用的参数识别算法，该算法识别得到的参数最优值可能落在参数先验分布范围外[52]. 这一特点可纠正不合理的参数先验分布范围，但是当参数的取值范围具有明确物理意义时，参数取值落在设定的范围外则出现错误. 常见的参数取值错误主要有3种形式：①参数取值过小，地下水相关参数(ALPHA_BF、GE_REVAP、GWQMN、RCHDG_DP)取值为负数的情况在文献中频繁出现[53-60]，SCS径流曲线数(CN2)[61-63]、冠层最大蓄水量(CANMX)[64]、土壤持水量(SOL_AWC)[53]、主河道曼宁系数(CH_N2)[65]等参数取值过小情况也时有发生. ②参数取值过大，主要体现在与河道(CH_N2)[66]、汇流(CH_N1)[66]、土壤(ESCO、SOL_AWC)[67-70]等相关的参数上. ③参数取值的相对大小不合理，例如一些文献在识别降雪参数时得到了最小溶雪因子(SMFMN)取值大于最大溶雪因子(SMFMX)的结果[71-75]. 虽然SWAT模型会将这些不合理取值调整为合理数值，但这也将导致参数报告值与实际率定值不一致，容易引起研究者和模型用户对参数取值的误解. 因此，当出现模型率定出现不合理参数取值时，研究者应对这些参数取值进行分析和调整.

3.3 流域水文过程表征不合理

研究库中部分文献应用SWAT模型的模拟效果不佳，在模型率定期表现尚可但在验证期表现较差[60]. 分析这些文献的参数取值和时间序列模拟结果可以发现，模拟效果较差不只是因为产流模式与模型预设不匹配、验证期水文环境变化等[60,76]，还与率定期模型水文过程表征不准确有关.

模型对水文过程的表征与模型参数取值密切相关. 例如，在北洛河流域的研究案例中，模型率定得到的参数ALPHA_BF取值为0.64，CN2为35，而验证期径流模拟的纳什效率系数低至-32.125[76]. CN2值较低导致降雨几乎不产生地表径流而直接进入土壤和地下水，而ALPHA_BF值过高又导致进入浅层地下水的水量会立刻进入河道，从而降低基流的流量. 因此，模型对北洛河水文过程不准确的表征，造成了径流量较低时模拟偏差较大的问题. 建议在模型评估验证时，既注重提高模型率定期的模拟效果，也注重对水文过程的合理表征.

4 结论与展望

4.1 结论

a) 我国现有的SWAT模型应用研究总体比较重视模型评估验证过程，部分文献报告了输入数据来源和质量、模型概化、参数灵敏度分析、参数识别、不确定性分析等过程的技术细节，模型模拟效果较好.

b) SWAT模型评估验证过程的主要薄弱环节是参数识别，具体表现为关键参数选取与研究区域实际特征存在偏差、参数识别结果不合理等，进而影响模型模拟效果和水文水质过程表征.

c) 国际上SWAT模型评估验证的一些新技术，例如使用动力学指标评价模拟效果、分时段分析模拟结果误差、在情景模拟评价中讨论模型输出不确定性等，在我国的研究文献中尚未见采用.

4.2 展望

a) 在SWAT模型应用研究中应重点关注模型参数灵敏度分析和参数识别，结合流域实际情况识别关键模拟过程、筛选潜在灵敏参数、选取合理参数取值，确保过程模拟结果与流域实际相符.

b) 建立SWAT模型本地化应用数据库，更新模型涉及的非本地化设计的数据，如植物数据库、城市数据库、CN值对照表等.

c) SWAT模型应用于流域水环境管理决策时，应完整报告模型评估验证过程相关信息，并开展不确定性分析，降低决策风险.

d) 加强SWAT模型评估验证方法研究，引入和研发评估验证新技术，提高模拟结果的准确度与可靠性，为模型应用于流域水环境管理决策提供支撑.