基于两阶段Copula熵的多目标优化进行水文气象计量网络设计外文翻译资料

 2022-05-26 09:05

英语原文共 14 页,剩余内容已隐藏,支付完成后下载完整资料


基于两阶段Copula熵的多目标优化进行水文气象计量网络设计

摘要:利用水文气象资料来获取点和面积平均值,量化水文气象变量的空间变化,以及水文气象模型的校准和验证。水文气象网络被用来收集这些数据。由于数据收集很昂贵,为了降低成本,根据水文气象台站的最少数量设计最佳网络至关重要。本研究提出了一个基于两阶段Copula熵的多目标优化问题包括:(1)用于将潜在水文气象仪表聚类为若干组的copula熵方向信息传输(CDIT);(2)用于为区域化群体选择最佳测量组合的多目标方法。尽管以前在网络设计中采用了熵理论,但是用于互信息估计的联合直方图方法有一些局限性。与联合直方图相比,基于Copula熵的互信息(MI)估计方法对于量化冗余信息的不确定性更加有效(JH)方法。该方法的有效性通过应用三种模型评估方法,包括Nash-Sutcliffe系数(NSC),负copula熵的算术平均值(MNCE)和MNCE / NSC,应用于一种水文气象测量网络。结果表明,基于两阶段Copula熵的多目标技术能够评估区域水文气象网络的性能,并且可以使决策者制定水资源管理战略。

关键字:水文气象仪表网络、Copula熵、互信息、多目标优化。

  1. 绪论

水文气象站提供有关降水,水质,空气质量,河流和地下水的基本数据。 所收集的水文测量数据对水资源系统的规划,决策和运行管理是必要的,包括水坝和水库设计,洪水预报,区域淡水资源风险评估,水资源分配和配水系统开发。 一个优化设计的网络应该为这些需求提供充足的信息。 网络设计还有其他需求,如需水量增加和冲突,气候变化,长期效益以及量化网络密度对水文模型精度的影响(Mishra and Coulibaly,2009)。 因此,需要设计一个考虑到水文气象数据的各种用途和用户的水文气象网络。

确定水文气象变量空间采样的适当策略(如降雨/河流流量)的方法取决于流域内规范网络的预先存在的条件:(1)未测量,(2)测量不够 雨量计,或(3)超出要求的密集网络(Dong et al,2005)。也许最常见的网络设计用于空间和时间离散点的观测,并估计连续场或通量的特征(Pardo-Iguzquiza,1998)。 已经有相当多的研究完成地表水水文监测网络的设计和评估。(1)基于统计的方法,(2)空间插值技术,(3)基于信息论的方法和(4)混合方法。

半个多世纪以来,统计回归技术已被广泛应用于测量站的定位(Moss和Tasker,1991)。最具代表性的统计方法是在有限的预算和时间范围内使区域信息最大化的广义最小二乘法(GLS)(Moss和Tasker,1991)。空间插值技术已被用于水文气象领域以获取台站数据(Camera等,2014; Bechler等,2015)。地统计学技术并采用方法根据包括全局与局部、精确与近似、基于点的与基于点的特征以及考虑协变量的特征来进行空间插值。克里格方法是最着名的空间插值方法,由两部分组成:使用变差函数的空间变化分析和距离计算(2000);Li和Shao,2010; Adhikary等,2015; Zhang等,2014; Aalto等,2016).Goovaerts(2000)比较了三种多元地质统计算法,包括DEM数字高程模型)纳入降雨量的空间预测中:简单的克里金法,具有不同的局部平均值,具有外部漂移的克里金法和克克里格法。据观察,如果相关次要,预测会有所改善信息,如DEM,被考虑在内。这一观察证实了Creutin和Obled(1982)的发现。然而,如果变量X在一个时间尺度上影响变量Y,而变量Y在不同时间尺度影响变量X,他们不能捕获非线性关系或明确地识别耦合的方向性。这些限制阻止了使用基于相关性的技术来对复杂系统进行稳健分析反馈是重要的,水文频率分析应该考虑非平稳性(Liang et al,2012)。

自70年代以来,熵的概念在水文气象和水资源文献中很受欢迎(Singh,1997)。基于熵概念设计网络的基本依据是测站应尽可能少地传递信息,这意味着电台应尽可能相互独立。转换信息被定义为熵理论中的互信息。 Husain(1987)

假定二元和多元连续分布来确定熵。根据不同的概率分布情况计算不同站点之间的信息传输,并根据信息最大化确定待保留站点的最佳位置。Krstanovic和Singh(1992a,b)使用联合熵和转换信息评估了路易斯安那州的降雨网络,其中多元分布是使用最大熵原理确定的。 Yang和Burn(1994)提出了方向信息传递指数(DIT),用于测量网络中测量站之间的信息流。基于熵的水质监测网络评估由Ozkul等人完成。(2000年)。 Markus等(2003)使用GLS和DIT指数的混合组合,通过在GLS中包含负净信息的函数作为惩罚函数。确定杂种组合的权重以最大化与GLS和DIT的结果的平均相关性。他们发现,无论在改变垃圾箱大小时熵值有多大的差异,在收到的信息与发送的信息之间的差异方面,站点的排名在大多数情况下仍然保持不变。间隔大小的问题首先由Amorocho和Espildora(1973)分析,并且也被Steuer等人使用(2002)计算离散变量的信息。 Singh(1997)在评估类间隔大小的影响时发现,熵值随着类间隔尺寸的增加和抽样间隔的增加而减小.Al-Zahrani和Husain(1998)利用香农熵来评估位于西南地区的现有水文网络审查了沙特阿拉伯王国提供最大水文信息的适宜性。

最近几年已经见证了采用混合方法.Chen et al。(2008)将克里金与熵相结合,以确定流域雨量计站的最佳数量和空间分布。 Mishra和Coulibaly(2014)评估了实施核密度方法的季节性流量信息对估算测站间互信息的影响。 Mahmoudimeimand等人(2015)使用基于熵和克里金法的优化模型,利用GIS确定雨量计的数量和位置。候选站是克里格误差最小和信息熵最大的站。

虽然信息论在评估中的应用,网络设计和网络设计已经取得了相当大的进展,计算出来的互信息是通过假设正态或对数正态多元分布来确定的。但是,在现实世界中,水文变量可能不服从这些概率分布。互信息使用的另一个主要限制是很难计算两个以上的随机变量(Alfonso et al,2010)。 Li等人(2012年)制定

水文评估和设计的最大信息最小冗余准则,但通常需要评估几个变量之间的相关性,这是由总相关性定义的。Copula理论似乎是确定可用于多元分布的一种自然方法估计多个变量的互信息和多变量相关性(Zeng和Durrani,2011)。 Copula理论的主要优点是可以分别确定边际分布和多元依赖模型,从而可以灵活地选择不同的边际和联合概率分布(Baacute;rdossyandHouml;rning,2016; Singh and Zhang,2006;Genest和Favre,2007; Gennaretti等,2015; Song和Singh,2010年)。

与基于熵的规范网络设计研究相比(Alfonso等,2010; Markus等,2003; Xu等,2015),本研究采用Copula理论定量描述双变量或多元变量,这在规范网络设计领域尚未引入。此外,能够分析非线性依赖性的Copula熵(CE)可以被视为互信息的一种替代方法(Ma and Sun,2011)。一般来说,该方法基于联合直方图(JH)的互信息估计对箱的数量非常敏感(Markus et al,2003)。因此,本文研究了基于Copula熵(CE)的互信息估计与联合直方图方法的区别,分析基于Copula熵(CE)的多目标优化的性能以识别水文气象测量网络的最佳组合是合乎逻辑的。

本文的结构如下,第2节简要介绍了熵和Copula的基本概念,第3节给出了基于Copula熵(CE)的多目标规划网络设计多目标优化模型的框架。该Copula熵为基础的多目标方法包含两个阶段:( 1)基于Copula熵的方向信息传输(CDIT)将潜在的水文气象仪表聚类为几个根据分组规定分组;(2)为区域化群体选择最佳量表组合的多目标方法。两阶段优化方法旨在减少计算空间以缩小评估范围处理。将最小全相关与最大联合熵相结合的多目标函数被认为是Alfonso等人的一项改进(2010年)。第4节涉及一个水文气象仪表网络的应用,并讨论了结果。

  1. 研究方法

2.1.Copula函数

设为d维不相关随机向量,对应概率密度函数为,各自的一维边缘分布函数为:

Sklar定理表明下面的d维Copula函数C存在:

hellip;(1)

式中:P表示多元分布函数(cdf),表示的边缘分布函数,为Copula参数。

通过方程(1)可知,Copula函数取决于Copula参数的选取,一个更加灵活的半参数方法(SP)(Genest, et al., 1995),包括使用非参数估计边缘分布函数(经验分布函数法)之后用最大似然法进行Copula参数的估算。半参数方法可总结如下:

设为d维不相关随机向量,是的第t个样本观测值,其中,n为样本长度。则边缘分布的估计是下面的经验分布函数:

hellip;(2)

对最大似然函数取对数代替上式求极大值来估算Copula参数,这个估算值由下式给出:

hellip;(3)

在这个研究中,半参数方法用来预估参数,详细内容可参阅nelsen这本书。

2.2.Copula熵

边缘函数熵、互信息、联合函数熵和全相关是水文网络设计中常用的四个基础工具。这些术语可以再参考(McGill, 1954; Alfonso et al., 2010)中查看

一方面,全相关估算涉及到联合函数熵的估算,因此,估算联合分布概率在多变量情况下很难。另一方面,联合分布直方图方法常用来估算互信息。当使用联合离散分布直方图估算互信息时,通常假设一组任意数如10,15,20,这种方法存在质疑,因为互信息对任意数的数目的选取很敏感。Copula提供一个灵活的方法来构建联合分布来模拟多元随机数,这个方法是独立于模拟边缘分布的。这个研究用Copula函数来估计互信息和全相关避免了复杂的计算需求和联合直方图的方法可能产生的错误。Copula密度函数熵(又称Copula熵或Copula信息)被定义为一个Copula函数表示的独立不确定测量值。Copula熵和全相关(或多元互信息)详细介绍如下:

假设两个随机变量和的Copula函数表示为:,其中是和的分布函数值,则两个随机变量和的互信息可以表示为Copula熵的负值:

hellip;(4)

其中;是随机变量的边缘分布函数,是两个变量的Copula熵,方程(4)的推导详见(Ma and Sun, 2011).

从上式容易得到多元情况下Copula熵。假设d维向量的Copula可以表示为:,其中,是各自边缘分布函数的随机变量,向量X的联合分布函数,多维随机向量X的联合熵可用下面通式表示:

hellip;(5)

方程(5)表明多元联合随机变量熵可以用边缘熵和Copula熵表示(详细推导见Ma and Sun, 2011)。同理,可以被证明,多元随机变量全相关(或多元互信息)是相应Copula熵的负数:

hellip;(6)

进一步,方程(6)可以表示为:

hellip;(7)

其中,是随机变量X的Copula密度函数;。从方程(6)可得,全相关(或多维互信息)可以通过Copula熵来计算,在方程6中有两种计算Copula熵的方法:多重积分和蒙特卡洛方法。积分方法在多维变量情况下是很难得,因此,另一种方法:蒙特卡洛用来计算积分值通过计算特定的是可行的。

从方程4-7,Copula熵被用来估算上面四种熵包括互信息和全相关。更进一步地,只要边缘熵和Copula熵可以得到,多元联合熵也可以通过方程7的关系求得。

第三章 二维Copula熵优化模型

首先提出了两相方法对数据采集网络进行设计。杨和Burn(1994)使用DIT(方向信息)促进了这两种方法。概念转移。这两种方法能够促进一般网络设计问题的最优解修改。在数据收集网络设计框架概述通过烧石(1991)有很多机会结合基本组件的替代方法框架。类似于第一阶段提出的方法通过杨与燃烧(1994)DIT(方向信息转换)FER),它测量水文STA之间的关联。以CdIt(Copula熵)代替方向信息传递在本研究中。预期的是

更紧密地反映一个站点的信息传输能力从Copula理论的角度。与方法不同提出的杨与燃烧(1994)第二阶段的研究考虑总体信息(联合熵),冗余度(总相关)和估计误差。此外,第二这项研究的阶段涉及多目标优化,包括:ING:(1)整体信息的最大化;(2)最小化冗余度;(3)最小化估计误差。在第一阶段,基于Copula熵的方向信息传递相关参数估计及拟合的检验采用半参数方法的二元Copula函数。为了第二阶段,两个目标函数,包括总的COO-关系与联合熵、相关参数估计与检验多元Copula函数的拟合。这个流程图两相法显示在图1

3.1. 候选量规网络分区的第一阶段

假设在初始网络分区有d个候选点,每个站点被定义一个感兴趣的值表示为X,如径流量或降雨量。所以表示在i站点测得时间序列上的值。

受情报信息传递(DIT)用来做网络格网数据收集启发,基于信息传递的Copula熵被定义为:

其中,在构成的连续量决策信息表;代表分数信息通过站点i对J推断;代表站J对i的信息推断。是互信息站点i对J;H(lt;)和H(lt;)代表边际信息熵信息保留站点II和J:HC(U,U,U)是水文站系列数据的Copula熵,XI和X在站I和J:U和U收集的是水文时间序列数据X的累积概率分布;XI收集在站I和J:HC(U,U,),用SturpCopu计算L

全文共14199字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[11774],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。