基于人工神经网络的印度东部某江心屿的 地下水水位预测模型外文翻译资料

 2022-03-30 21:33:58

基于人工神经网络的印度东部某江心屿的

地下水水位预测模型

摘要:地下水水位预测对整体地下水和地表水资源规划和管理具有重要意义。本研究将人工神经网络模型应用于印度东部热带湿润地区某一江心屿的地下水水位预测,在研究区域的18个站点利用人工神经网络建模来预测未来一周的地下水水位,输入包括周降雨量,皿蒸发量,河段,排水水位,抽水率和上周地下水水位,共40个输入节点和18个输出节点。分别利用三种不同人工神经网络训练算法,即附加动量和自适应学习速率的梯度下降法(GDX),Levenberg Marquardt法(LM)和贝叶斯正则化法(BR)进行训练并对三者的性能进行了评估。由于拥有40个输入节点和18个输出节点的神经网络规模很大,LM和BR需要花费很长时间来完成单次迭代,所以,将研究区域划分为三组,分别用上述三种算法进行训练,结果表明三种算法在地下水水位预测方面的效果几乎一样好。其中,BR的性能稍微优于GDX和LM。利用BR算法对同一输入进行训练建立的模型被进一步用于预测一组管井在未来2,3和4周的地下水水位,结果显示:虽然地下水水位预测精度一般随着前置时间的增加而降低,但预测的地下水水位在前置时间较长的情况下仍较为理想。

关键词:人工神经网络;地下水水位预测;反向传播GDX算法;Lavenberg Marquardt算法;贝叶斯正则化算法;江心屿

1介绍

地下水是最宝贵的自然资源之一,它已成为世界上所有气候地区的可靠水源。在发展中国家,由于地下水可以比地表水更有效、更迅速、更容易地直接输送到贫困地区,而成为一种扶贫工具。不幸的是,由于过度开采和地下水污染日益严重,地下水水位和含水层的减少正在威胁着供水和生态系统的可持续性。不可持续的地下水使用导致的许多后果在世界范围内日益明显,特别是在发展中国家,主要的问题是如何在地下蓄水层保持长期的可持续产量。因此,对目前和未来几代人来说,水资源特别是地下水资源的可持续管理是至关重要的。

地下水建模已成为一个帮助水资源管理者优化地下水使用和保护这一重要资源的强有力的工具。在过去的几年中,基于物理的数值模型被广泛用于地下水系统的模拟和分析。随着计算机的广泛使用,工程师、水文地质学家和环保人士将其应用于从含水层安全产量分析到地下水修复和质量等各种问题。但这些建模技术大多都是数据密集型、劳动密集型且价格昂贵。在大多数发展中国家,在数据匮乏的情况下,使用基于物理的模型是高度受限的。因此,在这种情况下,经验模型提供了一种有吸引力的替代建模方法,这种模型可以使用相对较少的数据提供有用的结果,而且省时省钱。人工神经网络(ANN)模型就是其中一种,它被当作通用的逼近器,非常适合于动态非线性系统建模,与基于物理的数值模型不同,人工神经网络不需要对系统的物理性质和条件进行明确的表征和量化就可以从具有代表性的数据中了解系统的行为,由于它可以对足够多的数据进行学习和归纳,人工神经网络能够解决大规模的复杂问题。它的一个吸引人的特点是,它能够在没有明确提供给它们物理条件的情况下,建立输出和输入之间的关系。

人工神经网络技术在水文学中的应用,从实时建模到基于事件的建模,已被用于降雨径流、降水预报以及对河流、蒸发、水质和地下水等方面的建模。相对于地表水水文学,在文献中关于人工神经在地下水/水文学中的应用的研究相对较少。在地下水水文中,神经网络技术主要用于含水层参数估计,地下水水质预测,地下水水位预测等。

在过去的大多数研究中,基于人工神经网络的地下水水位预测模型都是通过一组输入参数来预测单个管井或几个管井的地下水水位。本研究通过使用人工神经网络模型,提出了一种方法,可以在一个流域的大量管井中同时预测地下水的水位,因此,该方法具有重要的现实意义。本文采用附加动量和自适应学习速率的梯度下降法(GDX)、Lavenberg Marquardt法 (LM)和贝叶斯正则化法(BR),对位于印度东部热带湿润地区的某江心屿的地下水水位进行预测,证明了该方法的适用性。这类研究首先在印度北部进行,本研究将其应用在印度东部。

2研究区域

本研究选取的研究区域是位于印度奥里萨邦的卡塔乔迪河流域的巴利什穆扎(图1和2),它是一个典型的江心屿,周围环绕着卡塔乔迪河及其分支Surua。它位于东经85°54rsquo;21”到86°00rsquo;41”和北纬20°21rsquo; 48”到20°26rsquo;00”之间。该江心屿总面积为35km2,研究区域为热带湿润气候,年平均降雨量为1535mm,其中80%发生在六月至十月,正常的月平均最高和最低气温分别为5月的38.8℃和12月的15.5℃。5月和12月平均月最高和最低蒸发量分别为202.9mm和80.7 mm。

图3 a A-Arsquo;部分的研究区域岩性剖面

b B-Brsquo;部分的研究区域岩性剖面

地下水是研究区域灌溉的主要来源。该地区有69个由奥里萨邦政府,印度奥里萨邦政府建造和管理的政府管井,是灌溉用水的主要来源。现在,他们逐渐被移交给当地的水用户协会。研究区域岩性资料表明承压含水层的存在。图3a, b分别在A-Arsquo;和B-Brsquo;横截面上显示研究区域的岩性剖面。从图3a可以看出,含水层深度在流域西侧较深,东侧较浅。图3b表明,在河的下游一侧有一层以上的含水地层。含水地层(即含水层)主要由粗砂、中粗砂和卵石组成,粗砂为主导地层。含水层的厚度从20m到55m不等。层厚15 ~ 50m的顶部封闭层由粘土或砂质粘土组成,中间夹杂着粗砂或中粗砂。地下水水位对河流水位的变化有显著的影响,证明了它与地表水体有良好的联系。因此,顶部封闭层实际上是半封闭层,含水层是半封闭的性质。地下含水层的透水率最小值为B点的528.5m2/d,最大值为O点的3,484.8m2/d,平均值为1,778.86m2/d。含水层的储水系数最小值为H点的1.43 e-4,最小值为O点的9.94e-4,平均值为4.61e-4。

在研究区域,季风季节水资源充足,但在夏季,农田池塘干涸,地下水提取不足,无法满足农民的全部用水需求。因此,研究区域在夏季遭受缺水的影响,而在低于平均降雨量的年份里,水资源短缺情况更加严重。

3方法论

3.1数据采集和监测

研究区域的地下水水位数据是通过监测19个站点每周的地下水水位获得的,时间为2004年2月至2007年6月,监测地点选择可以代表整个流域的南北及东西走向的横截面。由于N点的地下水水位监测数据不全,所以将其他18个站点的地下水水位数据作为这项研究的具体研究对象。通过在研究区域安装雨量计来监测日降雨量,日均蒸发量数据来自一个名为Cuttack的距研究区域约2km的中央水稻研究所气象站。由于项目工地附近的每周河段数据无效,而Naraj的河段直接影响研究区域周围的河段,所以Naraj的河段数据将被用于人工神经网络建模。

3.2人工神经网络体系结构和训练算法概述

人工神经网络是一种模拟人脑神经网络的性能特征而建立的大规模并行分布式信息处理系统。神经网络以代表其体系结构的节点之间的连接方式、连接权重的确定方法和激活功能分类。本研究将使用前馈神经网络架构和三种神经网络训练算法,即附加动量和自适应学习速率的梯度下降法(GDX),Levenberg Marquardt法(LM)和贝叶斯算法正则化法(BR)并对比分析哪种算法在预测研究区域的每周地下水水位的效果最佳。

3.2.1前馈神经网络

自误差传播学习算法问世以来,前馈神经网络已经成功应用于不同的领域,它的网络架构是所有神经网络中最简单的。在前馈神经网络中,节点通常按照层排列,以第一个输入层为开始,结束于最后一个的输出层,隐藏层可以不止一个,每层都有一个及以上节点。图4显示了当前研究的前馈网络——单隐藏层,输入和输出层有多个节点。信息通过从输入层传输到输出层,某一层的节点与其不同层的节点相连。因此,某一层节点的输出仅取决于上一层接收的输入和相应的输入权重。前馈神经网络的主要优点是它们很容易处理,并可以模拟任何输入/输出分布。

3.2.2训练算法

库利巴利等报道现在已经有超过23条用于训练人造神经网络的学习规则,但是这些规则都不能保证能找到全局最小值,这就使得高效的网络训练成为网络设计中具有挑战性的部分。 对现有文献的批判性研究表明超过90%的实验通过标准的反向传播算法(BPA)来训练前馈神经网络,从本质上来说这是一种基于梯度下降的算法,是由Rumelhart等提出的优化技术。标准的反向传播算法是一个梯度下降算法,其中网络权重沿着网络传递性能函数的梯度的反向传播。 术语“反向传播”指的是计算非线性多层网络梯度的方式。

尽管反向传播训练在许多应用中被证明是有效的,但它具有固有的基于梯度的技术和本地搜索性质的局限性,例如收敛速度慢等。在传统的反向传播算法基础上提出的各种优化算法中,二阶非线性优化方法如共轭梯度法,Levenberg Marquardt算法和准牛顿法通常比BPA的任何变体都快。 Levenberg Marquardt算法是专门为使得平方误差的总和最小化设计的,它克服了标准BPA的局限性。

在不造成欠拟合或过拟合问题的条件下,使用尽量少的输入变量和参数构建具有较高的预测精度的模型十分重要。隐含层中的神经元太多会导致过拟合,即模型虽然能够很好地模拟训练样本的映射关系,但将数据的噪声数据也学习到了模型中。另一方面,隐含层节点数量不足的网络将不足以学习数据的规律。由此可见,隐含层的节点数太少和太多的网络预测效果都不好,从而导致后期网络无法很好地识别测试数据。为了克服这个问题,麦凯提出了能够处理过拟合问题的贝叶斯正则化法。

附加动量和自适应学习速率的梯度下降法——常规的BPA的学习率始终保持不变,算法的性能对学习率的设置非常敏感,如果学习率设置得太高,算法可能会发生振荡变得不稳定。如果学习率太低,算法将花费很长的时间收敛。为了解决这个问题,附加动量和自适应学习速率的梯度下降法(GDX)结合了自适应学习率与动量训练,自适应学习率总是试图使学习步长尽可能大,同时保持学习状态稳定,每个变量根据动量梯度下降进行调整,工作原理类似于低通过滤器,动量允许网络忽略误差表面的小特征,这种训练算法是网络训练中最简单常见的方法之一。

Levenberg Marquardt算法——在反向传播算法中,梯度下降给出的局部梯度不直接指向最小值,而是通过很多小步长的梯度下降才能达到最低限度,从而导致学习缓慢。为了克服这个问题,Levenberg Marquardt算法使用多层FNN训练的方法进行了二阶优化。 Levenberg Marquardt法对牛顿法进行修改,以期找到最小化问题的最优解。它期望能避免计算Hessian矩阵而获得二阶训练的速度和准确性。

其中,x 为神经网络的权重,J 为将要被最小化的表征性能的雅可比矩阵,mu;为控制学习过程的标量,以及e 为残差矢量。 当标量mu;为零时,这就变成了与拟牛顿法近似的Hessian矩阵。当mu;很大时,方程变成小步长的梯度下降法。拟牛顿法在其附近收敛速度更快,更准确,误差更小,所以目标是尽可能快地转向牛顿的方法。Levenberg Marquardt算法是前馈神经网络训练最快的方法之一。但是,由于算法要占用很大内存,它只能用于小型网络。不过,许多研究人员已经成功地运用它解决问题。

贝叶斯正则化算法——贝叶斯方法涉及优化一个包含传统的平方误差函数和以及另一个名为“正则化者”的术语的目标函数。使用正则化者的动机是削减复杂程度高的权重函数,以获得更简单的函数。贝叶斯方法还能够实现在训练期间自动调整最佳的权重衰减参数。贝叶斯正则化的优点如下:

  1. 它为处理模型复杂性和过拟合问题提供了一种统一的方法。
  2. 误差函数的调整旨在改进模型的泛化能力。
  3. 由训练的模型生成的预测可以分配一个误差条来表示它的置信水平。

在贝叶斯框架中,权重空间的不确定性被分配一个概率分布,表示对权重向量不同值的置信水平,这个函数最初设置为一些先验分布,一旦观测到数据,就可以通过贝叶斯定理将其转化为后验分布。通过对权重的后验分布最大化,可以得到最可能的参数值。贝叶斯正则化已经被几个研究人员有效利用。

3.3 人工神经网络的设计

模型开发过程中最重要的步骤之一是确定重要的输入变量。通常,先验知识的某种程度被用来指定初始的候选输入集。虽然先验识别在许多应用中已经被广泛使用,且有必要定义一个候选的输入集,但是它依赖于专家的知识,因此,它是非常主观的,并且是依赖于个例的。当模型的关系没有被很好地理解时,通常会用到分析技术,例如交叉相关。与使用交叉关联相关的主要缺点是它只能检测两个变量之间的线性依赖关系。因此,相互关联不能捕获任何非线性依赖。这可能存在于输入和输出之间,这些输入与输出的非线性相关,可能会导致重要输入的遗漏。直觉上,确定适当投入的首选方法包括先验知识和分析方法的结合。

在本研究中,利用一组合适的输入参数,设计了18个管井(图2)的地下水水位预测模型。通过考虑影响地下水水位的因素,确定了神经网络模型的输入参数。不同时间间隔下管井水位的交叉相关分析表明,在18个管井的水位时间序列中,时间间隔1的相关性是非常显著的。为了研究降雨和河流水位对地下水的影响,绘制了每周的地下水水位。图5显示了4个地点的地下水水位与周降雨量的每周变化,这表明在降雨量大的时候,地下水水位普遍较高。因此,降雨就是影响研究区域地下水的潜在输入参数其中之一。同样,图6展示了4个地点的地下水水位的每周变化和河流水位数据。河流水位数据与地下水水位数据之间存在着良好的相关性,河流水位是影响研究区域地下水的另一个潜在的输入参数。在半承压含水层中,除降雨外,蒸发是影响地下水补给的另一个参数。因此,每周的皿蒸发量也被纳为人工神经网络模型的输入参数之一。

lt;

全文共9982字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[14772],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。