利用人工神经网络估算水库二氧化碳排放量外文翻译资料

 2022-03-14 08:03

英语原文共 17 页,剩余内容已隐藏,支付完成后下载完整资料


利用人工神经网络估算水库二氧化碳排放量

1.介绍

水库的温室气体排放量这一概念首次在1993年提出。如今它已成为世界各国特别是加拿大、巴西和美国的研究热点。在过去的二十年里,人们越来越努力将水库作为温室气体的来源,并对各种水库进行了广泛的研究。然而,全球温室气体排放的规模仍然存在争议。根据目前全球二氧化碳(CO2)排放量估算,48 TgCyr-1的CO2由水库排放。温室气体的排放量估计占36.8 TgCyr-1 CO2。这些估计数据大约相当于2%的内陆水域,有报道2100 TgCyr-1通量作为全球碳排放的CO2。虽然从水电系统和所有水库系统估算的全球二氧化碳通量略有差异,但通过统计分析,水电站和非水电站的二氧化碳排放量没有显著差异。与水库类型,水库的温室气体排放与多种因素有关,这对了解温室气体排放的机理和控制具有重要意义。在单一水库系统中,深度和温度可能是碳排放量以及空间和季节变化的一个重要因素。温室气体的排放量随水库的纬度和年龄的增加而减少。考虑到碳排放的内在来源,洪灾区的初始有机碳是另一个关键因素,特别是在青年水库中。此外,温室气体的排放也与大坝的运行机制和水质有关,如ph值和叶绿素a。

尽管CO2排放数据有重大意义和不确定性,但许多地区的二氧化碳排放量数据仍然缺乏,这在全球二氧化碳预测中留下了严重的缺口。为了解决这个问题,统计模型是一个不错的方法来推断没有测量数据的水库CO2流量,然后依靠有限数量的测量得出区域或全球估计。其中最常见的模型是统计回归模型,其可以验证二氧化碳排放量和一个或几个因素的回归方程之间的关系。其他模型,可以识别更复杂的非线性响应,如随机森林和蒙特卡洛模拟,也被用来阐明二氧化碳排放量与环境或水坝的因素之间的关系,并预测其他采样的水库附近地区的二氧化碳排放量。不同于这些模型与环境因素的投入,一个数学模型与自组织临界性理论(SOC)只能被用来推断一个水库的情况。这些开创性的模型有着精确度低和地域的局限性这样的缺点,因此,开发水库CO2排放的优化模型仍然是将来的研究方向之一。

人工神经网络(ANN)经常被用来模拟温室气体排放引起的水质状况和能耗,并且显示出巨大的能力。然而,很少有研究用人工神经网络来模拟水库中温室气体的排放。事实上,人工神经网络在这项研究上有几个优点。人工神经网络通过模拟人类学习和决策过程具有强大的学习和泛化能力。因此,ANNs可以描述线性关系或非线性关系,即使在有限的输入变量中,变量之间的相互作用也被确定,数据的复杂模式得到了充分的理解。此外,由于人工神经网络的学习机制是非参数的,所以数据的结构和分布不受限制。人工神经网络拟合的精度在很大程度上取决于数据的数量和质量。在世界上,截止到2016年,至少有229个水库系统测量了CO2通量,并为人工神经网络提供了足够的数据。此外,许多常用的测量技术都集中在气体在空气-水界面的扩散通量,因为气体的溶解度适合于二氧化碳。影响模型性能的关键因素有:体系结构的选择和参数的设置。然而,很难得出模型体系结构绝对适用于特定的环境的结论。因此,一些特殊的方法,如试错法,在莫种程度上可以确定参数,在遵序原则的基础上最佳的网络结构一般保持泛化能力和网络复杂度之间的平衡。

在这项研究中,我们第一次尝试用ANNs,反向传播神经网络(BPNN)和广义回归神经网络(GRNN)以及全球各地不同类型的水库模拟了水库的CO2排放通量。通过相关分析和领域知识选择模型的输入变量。通过灵敏度分析检验了所选输入集的合理性。详细描述了模型参数的选择,并用统计指标对模型的性能进行了评价。由于模型有能力预测有一个没有数据的水库的CO2排放量,所以全球水库的二氧化碳排放量是可以估计的。除此之外,还可以根据水库的某些特点,对拟建水库的CO2排放量进行评估,为大坝建设提供指导。

2.材料和数据

2.1数据收集

本研究收集到的数据,大部分是来自于巴罗斯等人在2011年和迪莫等人在2016年收集的资料。还收集了一些最新文献中的水库CO2排放监测数据。从相关文献中收集了有关水库和监测的一些基本参数,并从全球水库和大坝数据库中补全了确实的数据。另一个重要参数,潜在植被净初级生产力(npp0)在水库的位置,从净初级生产力的人类占用的地图中提取(HANPP)。在同一年内,一个以上的研究从该系统测量CO2通量的情况下,用这些参数的算术平均值进行统计,并将不同年份测得的同一个水库的CO2通量保持在原始值上。为此,在对235个水库进行研究的基础上,收集了277个数据集,并在补充表S1中找到了数据集的信息。

总的来说,我们收集了全球235个水库中10个参数,包括纬度(LAT),年龄,叶绿素(叶绿素a)、水温(WT),平均深度(MD),停留时间(RT)、溶解性有机碳(DOC)、总磷(TP)、该地区潜在的净初级生产力(npp0),和CO2通量。本研究采用CO2通量作为模型的输出。表1给出了包括最小值、最大值、中值、中值、标准差和变异系数在内的统计参数。

2.2输入变量和数据处理

选择一组适当的输入变量是开发一个满意的预测神经网络的先决条件。有两个基本的选择原则:一是输入输出关系的确认,一是输入变量之间的独立性。独立性这一特点是非常重要的,因为相关数据可以提供冗余信息,从而增加了找到最优权重的可能性。有两大类技术,无模型和基于模型的方法,来检验替代输入和输出之间的关系,如相关分析和逐步分析。在这项研究中,我们结合相关分析,敏感性分析,数据的可用性和领域知识,选择一组最佳的输入变量模型。

由于变量具有不同的单元,所以在将这些变量通过人工神经网络之前,应将其缩放到一个均匀的范围,以避免收敛问题和极小的加权因素。就像文学作品没有特定的框架一样,归一化处理也没有特定的方式。在这项研究中,标准化是通过以下等式完成的:

在这项研究,Y表示数据值归一化后,Xmax和Xmin是每个变量的最大和最小值,Ymax和Ymin表示特定范围的边界值,分别为1和-1。

完整的二氧化碳排放数据包括21个国家的235个水库。在这项研究中,70%的样本与整个选定的输入变量是用来建立和培训模型,而其余的数据被用来测试模型。

2.3人工神经网络

人工神经网络(ANN)是遵循人脑行为的抽象计算模型。人工神经网络被广泛应用于环境领域的预测和预测,因为它们被认为能以极高的精度逼近任何有限非线性函数。传统上,ANNs分为前馈网络和递归网络。前馈网络分为许多类型,如多层感知器(MLP)和径向基函数(RBF),用于研究最流行的架构。在前馈人工神经网络中,输入信号通过网络向前传播,从输入层到隐藏层,再到输出神经元。在这项研究中选择前馈网络中的BP神经网络和GRNN神经网络进行研究。

2.3.1反向传播神经网络

反向传播神经网络(BPNNs)是典型的多层感知器神经网络(MLP)和误差反向传播(BP)网络学习算法。BPNNs组织包括一个输入层,几层分层网络,隐层(S),和一个输出层。一般来说,人们认为具有一个隐层的BPNNs能够描述具有任何复杂关系有限的非线性关系。每个层都有几个神经元,通过一组权值传输输入值并处理到下一层(图1)。在每个神经元中,通过激活函数将输入变量及其权重的积和转化为输出值。

2.3.2广义回归神经网络

广义回归神经网络(GRNNs)与BPNNs不同的是,广义回归神经网络(GRNNs)不依赖于他们的训练迭代程序但依靠标准统计技术——核回归。GRNNs由四个层组成,即输入、模式、求和和输出层

在第一(输入)层,输入单元通过输入权重将输入变量传递给模式层。在第二(模式)层,每个神经元呈现训练模式,输入模式之间的相似性用距离函数计算(方程式(4))。第三(求和)层包含两种不同类型的求和,包括单除法和求和单位。在模式层的每个神经元连接在求和层s-summation和d-summation神经元。s-summation神经元计算模式层的加权响应的总和,而d-summation神经元计算在模式层未加权的输出神经元。最后(输出)层只是把d-summation神经元除每个s-summation神经元代表网络预测。

其中,m和n分别是输入向量的元素数目和训练模式的数目。d是高斯函数。(Xj-Xji)表示第i个训练数据的增加,大概表示为Xj点之间的差异。sigma;是传播(平滑)参数的最优值,可以通过实验评价。Yi表示是在模式层与求和层s-summation神经元之间的权重关系。

选用GRNN神经网络是因为其快速的学习和收敛的最优性质。此外,它还有另一个优点,即网络架构是固定的,且只有一个单一被命名的传播参数需要优化。在这个研究里每个GRNN模型都有不用的传播价值。

2.4统计回归模型

将ANNs的表现与多元线性回归模型(MLR)和多元非线性回归模型(MNLR)比较。这些模型与ANNs有相同的输入,并使用相同的数据进行开发和测试。MLR显示在等式(6)中。要确定一个合适的MNLR,尝试对各种数值进行转换,如倒数、对数、平方根(方程(7))。

其中,Xm是输入,alpha;m是一次投入系数,Fm代表传递函数,对于输入,beta;m是转移输入的系数。

2.5性能指标

建模的结果是与其他相关文献一致的,均方根误差(RMSE)和平均绝对误差(MAE)测量残余误差,这表明模型值和观测值之间的差异。在某些情况中决定系数(R2)与相关系数(r)的平方是用来估计模型变异的程度。纳什–萨克利夫效率(NSE)是一个受欢迎的定义监测数据与模型输出的拟合优度的似然函数。较小的均方根误差和MAE值和较大的R2和NSE值表示更好的模型性能指标。

3.结果

3.1替代输入变量选择

原始的输入数据集是通过Spearman相关性分析CO2通量与其它九个变量之间的关系。选用Spearman相关系数是因为由于CO2通量数据即使经过几次不同的改造尝试也不是正常分布的(Kolmogorov Smirnov试验),p<0.001)。通过在不同的年份收集了很多时间段水库的数据,这意味着这些水库有一套以上的数据,这些数据除了年龄和C02排放量以外都有相同的参数。因此,Spearman关于年龄和CO2流量的相关分析是由原始值进行的,而Spearman关于CO2流量和其他参数(LAT,叶绿素a,WT,MD,RT,DOC,TP,和npp0)的相关性分析是基于算术平均数。

基于相关分析的结果(表2),具有绝对值的变量相关系数和显著系数的低相关值分别为年龄、平均深度和npp0。此外,在以前的研究中纬度是一个关键的因素,而且有足够的可用样本量。因此,纬度也被视为一种输入量,并通过敏感性分析对其进行合理检验。因为它们显然是独立的,所以不必分析这些参数的相关性。因此,选择了四个特征作为二氧化碳预测模型的替代输入变量。水库数据中四个参数必须可用有效,否则这组数据将被删除。删除无效数据后,选择了包含251组数据的数据集进行模拟。

3.2模型参数选择

这项研究选取了一个3层BP神经网络模型。为了确定网络的拓扑结构,尝试了从1到15范围不同的隐层节点数的BP神经网络,并将它们的均方根误差进行了比较。结果表明有九个隐藏神经元的神经网络具有最佳性能(RMSE = 399.01mgCm-2d-1)。因此,本研究中使用的BP神经网络拓扑结构有四个输入神经元,九个隐藏神经元和一个输出神经元。

至于GRNN模型,传播常数是通过比较得到每个模型具有不同的传播常数的RMSE值从0.1到1不等的尝试。最低均方根误差为0.1的传播常数(RMSE = 279.69mgCm-2d-1)。

3.3模型表现

随机抽取251组数据中175组(约70%)的数据进行训练,其余76组为测试数据。表3给出了训练和测试CO2流量的统计参数。

统计性能指标MLR,MNLR,BP神经网络,表4给出了GRNN用于训练和测试的数据集。根据平均成绩统计,广义回归神经网络模型在训练和测试阶段都实现了最佳的性能。

MLR,MNLR,BPNN CO2通量的观察值和预测值,GRNN模型的训练和测试阶段绘制在图3。上述三种模式的比较表明,GRNN一般比BPNN,MNLR和MLR模型更精准。从拟合直线方程中也可以清楚地观察到这一点。

MLR和MNLR方程在方程(8)和(9)展示

4.1讨论

4.1模型所得结果的比较

模型中的训练和测试阶段的结果表明ANNs表现最适合回归模型。GRNN模型比BP神经网络模型更精确,而MNLR在预测水库的CO2排放量这方面优于MLR。

这样的结果是与其他相关文献一致的,例如,MLR,MNLR,GRNN被用来预测国家的温室气体排放量,结果表明,GRNN模型给出了最好的结果。当法拉特等人从不同的研究数据基础上预测冲刷深度圆形桥墩,GRNN模型表现的比BPNN和MLR更好。在不同类型的人工神经网络模型中,BPNN常常表现平平,因为最好的模型可以在模型校准后重复调整参数。然而,过度的训练往往伴随着精度问题,因为大量的权重和偏差是从不断地迭代中产生的。相比之下,GRNN是一个单程学习网络,和BP神经网络需要不停的迭代不一样。因此,GRN

全文共6013字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[16300],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。