基于Bootstrap方法的水文模型参数不确定性分析:将SWAT模型应用到中国东北吉林省辽东河流域的一个案例研究。外文翻译资料

 2022-11-27 02:11

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


基于Bootstrap方法的水文模型参数不确定性分析:将SWAT模型应用到中国东北吉林省辽东河流域的一个案例研究。

ZHANG Zheng, LU WenXi*, CHU HaiBo, CHENG WeiGuo amp; ZHAO Ying

教育部环境与资源部地下水资源与环境重点实验室,吉林大学,长春130021

作为描述和分析水文过程的重要工具,流域水文模型已经日益应用于流域水文模拟与水资源管理。然而,在大多数情况下,模型参数只由一个适合的建模数据的观测标方案确定,因此模型参数存在相当大的不确定性。如何定量评估模型参数的不确定性和由此产生的对模型模拟的不确定性的影响,一直是一个备受关注的问题。在这项研究中,两种基于Bootstrap方法(特别是基于Bootstrap和Block Bootstrap基础模型)被用来分析将SWAT(土壤和水评估工具)模型应用于辽东河流域的水文模拟的情况下参数的不确定性。接着,得到五个敏感参数的不确定性范围。计算得出的变异系数和可变参数的贡献表明,在这五个参数中,ESCO和CN2具有较高的不确定性:它们的变异系数和贡献率分别为23.98和70%,14.43和18%。其余三个参数不确定性相对较低。我们比较两个bootstrap方法所获得的参数不确定性的两个范围,并发现由block bootstrap方法获得的不确定性范围是窄于另一个所获得的不确定性范围的。进一步分析参数不确定性对模型模拟的影响的表明,参数不确定性对模拟结果有较大的影响,在模型校准期60%minus;70%径流观测均在相应的95%可信区间。在汛期(即湿期)模型模拟的不确定性相对高于干燥的季节。

参数,不确定性分析,水文模型,bootstrap,SWAT(土壤和水评估工具)

1 介绍

作为水文过程的描述和分析研究的重要工具,水文模型已在日益应用于流域水文模拟和水资源的管理[1– 3 ]。水文模型中往往含有大量的参数,用这些参数来描述流域地表水文过程的重要特征。参数值的准确性对模型的能力有重要的影响,用来真实地反映实际系统的水文过程[ 4-6 ]。然而,由于各种现实因素的制约,这些参数通常不能直接测量,而往往是间接通过模型校正估计,在模拟值进行拟合观测。模型校正可受多种因素影响。当观察到的和模拟的值之间的残余量达到其最小值时,模型参数值被认为是最佳值,这可能会有所不同于从实际物理过程中推断的真正的参数值[ 7,8 ]。以这种方式获得的参数不能完全描述其相应的物理过程中的真实系统的真实状态,从而导致一个极大水平的不确定性。参数的不确定性将通过构造模拟结果的不确定性[ 9,10 ]不可避免地对模型的模拟结果的影响。如何评估水文模型参数的不确定性及其对模型模拟不确定性的影响一直是一个备受关注话题。参数不确定性和水文模型模拟的不确定性影响的定量评价是减少这些模拟的不确定性并评估其有效性[11minus; 13 ]的关键。

水文模型参数的不确定性是非常重要的并且获得了相当多的关注[ 14minus;18 ] 。许多方法已被应用到参数的不确定性分析中,其中Beven和宾利[ 19 ]提出的一般与似然不确定性估计(GLUE)是一种最常见的方法[ 20minus;22 ]。与其他方法相比GLUE因为使用简单的原则,并且不需要任何变化的模拟源代码仿真模型可以很容易地实现。然而,GLUE也有很明显的缺点,比如用于分离行为和非行为模型的似然函数和截断阈值的主观选择。此外,该方法的计算效率也是相当低的。在参数空间中的采样不能保证有足够的密度(因此蒙特卡洛采样通常是在GLUE),这将导致不正确的估计结果[ 23 ]。马尔可夫链蒙特卡罗(MCMC)模拟是另一种用于不确定性分析的比较常见的方法[ 24minus;27 ]。此方法强调使用一个随机步骤来产生一个样本的参数空间,从而建立一个平滑分布导出的参数的后验分布的马尔可夫链。该方法在模型中具有的显著优势是它不需要任何线性假设,也不需要模型输出值对有关参数值[ 28 ]的可微性。随着对MCMC方法日益增长的关注,许多研究人员已经将其与其他综合方法[ 29–32 ],以利用其强大的空间搜索功能来提高了原有方法的有效性和效率。Blasoneetal[ 33 ]表明,结合MCMC抽样方案与 GLUE ,可以大大提高有效性和效率。

除了上面提到的第一种方法,贝叶斯方法是另一种常用的不确定性分析方法,在该方法中,固定的但未知的参数的值被取为随机变量,根据贝叶斯理论的先验分布得到参数的后验分布。该方法具有较高的模拟和计算的灵活性[34,35 ],但尽管被广泛使用,它仍然是有争议的,由于要假设服从一个特定的先验分布的参数的必要性,这个时候这样的假设往往是不现实的或不正确的。

与这些方法相比,非参数统计技术被称为“bootstrap”,可以很容易地实现使用简单的原则,有几个优点[ 36 ]:(1)只需要少量的编程;(2)与其他相关的方法相比,所需的计算量是比较小的;(3)没有必要假设变量的先验分布。当bootstrap方法已经得到普及,许多新颖的方法已基于Bootstrap [37minus;39 ]概念先后被开发。在本研究中,采用不同的引导方法来评估一个半分布式水文模型的参数不确定性:土壤和水评估工具(SWAT),并对模型的不确定性对于模型的影响进行了分析。通过对参数不确定度分析结果的比较,确定了最大不确定度的模型参数,并讨论了参数不确定度分析结果存在差异的可能原因。

本研究的总体结构如下。第2节介绍了bootstrap的基本原理和所采用的两种不同方法的步骤;第3节提供的辽东河流域数据收集所需研究的基本概况;第4部分介绍了通过模型灵敏度分析得到的几种主要的敏感性参数;第5节讨论了参数不确定性分析与它对研究模型模拟结果的不确定性的影响,并讨论了在这两种方法的结果差异可能的原因;最后,第6部分总结了一些研究得出的主要结论。

2 Bootstrap

bootstrap是由Eforn [ 40 ]首次提出的一种非参数重采样方法,。它的基本概念是一个“bootstrap样本”记为n,使其从一个不知道分布的样本,通过重新安置抽样还是成为n。首先,一个bootstrap样本的数目按顺序并且单独地从原来的样本中提取出来。然后,将这些引导样本用于执行统计检验的未知分布的统计特性,如方差,标准差和置信区间。与经典的统计方法相比,这种方法的优点是,计算过程是比较简单的,没有必要对未知分布进行假设。Bootstrap方法越来越广泛地直接应用于同分布的独立样本,从而产生Bootstrap样本。然后这些Bootstrap样本可用于具有一定的依赖性结构的样本数据(如时间序列数据),直接进行重采样是不合理的,这会破坏原有的依赖结构。保持数据的依赖结构(dependency structure)在整个重采样过程中产生的各种基于bootstrap的方法,包括基于模型的bootstrap和block bootstrap。本研究试图应用后两者的方法来解决在不确定性分析中直接重采样的数据在销毁过程中保持的依赖结构的问题。

Model-based bootstrap

在 model-based bootstrap中,定义数据为以下[44]:

X (t),Y obs (t)(t 1, 2,, N ) ,

其中x(t)表示输入数据(如降水),污泥产率(t)表示观测数据(例如径流),n表示序列长度。在这项研究中,水文模型被表示为

Y (t) f X (t), , ( 1 )

=(1,2,···,m)表示向量模型中的m参数。通过建立模型,circ; 估计值的模型参数向量的估计值和Ycirc; (t)估计值的模型输出向量Y(t)可以得到,此后的模型表示为

Y (t) f X (t), , (2)

模型的残余部分表示为

(t) Y obs (t) Ycirc; (t) Y obs (t) f X (t), circ; , (3)

(t)通常被认为是相互独立的,且 t=1,2,···,N.。进行Bootstrap抽样的残差来创建一组新的残差是基于模型的自举的基本概念;然后用这套新的残差进行模型拟合,得到bootstrap样本估计的参数beta;circ; *。

  1. 对残差序列 (t) 进行随机替代抽样形成一个新的残差序列*(t)(即通过Bootstrap方法生成Bootstrap样本)
  2. Bootstrap数据Y * (t) Ycirc; (t) * (t) 生成,其中t=1,2,···,N
  3. 模型Y * (t) f {X (t), 被拟合得到参数向量 和新的径流资料的Bootstrap估计值circ; * (circ; * , circ; * ,, circ; * )
  4. 重复步骤1minus;3 1000次
  5. 得到向量参数 的置信区间。以m为例,用自举抽样的方法获得了有序的Bootstrap估计序列m, ,从而得到参数m 在置信水平.的置信区间[circ;*m1 ,circ;*m 2 , , circ;*m1000 ]

2.2 Block bootstrap

block bootstrap的基本概念不再是一个单一的数据点的引导采样,但整个数据序列的划分成若干“块”。然后,对这些“块“进行引导采样。 block bootstrap 方法的具体步骤使用如下;

  1. 得出剩余序列 (t) Y obs (t) Ycirc; (t) ,其中t=1,2,···,N.
  2. 根据霍尔等人进行的长达三个多月的研究[45], 数据N分为B(blocks) 和长度L(N=BL) 然后,根据对这些块进行随机的bootstrap 抽样,并且结合block bootstrap 样本生成Bootstrap样本* (t) of (t)。
  3. 生成bootstrap数据Y * (t) Ycirc; (t) * (t) ,其中t=1,2,···,N
  4. 用模型Y *

    剩余内容已隐藏,支付完成后下载完整资料


    资料编号:[29692],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。