使用薄板光滑样条插值平均降雨量外文翻译资料

 2022-12-11 07:12

英语原文共 20 页,剩余内容已隐藏,支付完成后下载完整资料


使用薄板光滑样条插值平均降雨量

M. F. HUTCHINSON使用薄板光滑样条插值平均降雨量,国际地理信息系统学报, 9:4, 385-403, DOI:10.1080/02693799508902045

链接到这篇文章:http://dx.doi.org/10.1080/02693799508902045

在线发布:2007年2月05日

将您的文章提交到此期刊

文章意见:2377

查看相关文章

引用文章:254引用文献

研究论文

使用薄板光滑样条插值平均降雨量

M. F. HUTCHINSON

澳大利亚国立大学资源与环境研究中心,GPO Box 4, Canberra ACT 2601, Australia

电子邮箱:hutch@cres.anu.edu.au

摘要:薄板光滑样条插值提供准确的、超前和计算效率高的解决空间问题的解决方案,能提供从标准期的年平均降水量的插值以及许多短期降水的插值。这种分析取决于观测降水量的空间变异统计模型,其中考虑由于噪声的标准估计方法。这个模型的结构有两个组件,分别是表示观测的短期与标准期间方法的空间相关性的偏离和标准期平均降雨量表示的不相关的位置和高程的功能。薄板光滑样条,通过广义交叉验证GCV(generalized cross validation)的最小化来确定,也可以用最大似然法GML(Generalised max likelood)或期望真实平方误差MSE(expected true square error)最小化确定两种方式估计这种平滑函数。首先,可以通过估计相应的非对角误差协方差矩阵直接调整数据的空间相关误差。 其次,通过使用线性回归将观察到的短期数据标准化为标准期平均估计,可以消除数据误差结构中的空间相关性。当应用于数据时,两种方法给出类似的插值精度,并且拟合曲面的误差估计与保留数据的残差很好地吻合。还提供了数据错误模型的简单解释。使用这些模型获得的插值精度仅略低于用更完整的统计模型获得的插值精度。结果表明,能获得连续的空间上变化的表面的高程的较高的插值精度。数字高程模型结合其他要素,希望能进一步改善。

1.引言

研究月份,季节和年份的气候能了解生物活动的空间性(Nix, 1986, Booth et al. 1987, Mackey e t al. 1989, Hutchinson e t al. 1992)。确定平均降雨量和其他平均气候变量的空间分布也是发展随机天气模型的必要的第一步,以便对气候影响进行更精确的评估(Hutchinson 1987),并为空间插值提供依据。达到以每月,每周甚至每天的时间步长模拟实际天气值(Hungerfordetal. 1989, Hutchinson 1995)。气候在确定总体循环模式方面也发挥了关键作用(Gates e r a l .1992年)。如“国际地圈 - 生物圈计划”(IGBP-BAHC 1993)水文循环生物圈方面的气象发电机项目。“国际地圈 - 生物圈计划”(IGBP-BAHC 1993)水文循环生物圈方面的焦点4天气发生器项目依赖于准确的空间插值方法的发展,将观测和模拟的大气候为中尺度,支持这种分析的网络在全球范围内严重不足。本文的目标是提高从现有数据网络获得的插值精度。 由于只有少数几年的记录的气象台在数据网中占据绝大多数,所以这个过程中的重要一步是通过适当使用降雨记录来最大限度地提高数据范围的空间密度,从而最大化插值精度。

在标准气候变量中,降水在时间和空间上的变化最大,对时空分析技术的需求最大。因此,降雨也是最常测量的气候变量。基于地面点数据的平均降水插值方法从简单的趋势表面分析(Edwards 1972,休斯1982)和基于thiessen多边形(Thiessen 191 I),反距离权重(Shepard 1968)和delauney三角测量(Akima 1978)的局部双变量插值技术,到更复杂统计方法。最后一个包括地统计方法(Chua and Bras 1982, Hevesi et al. 1992, Phillips et al. 1992) and thin plate splines (Hutchinson and Bischof 1983)。这些方法可以估计产生插值误差的空间分布,所引用的研究都表明了加入降水对海拔的空间格局有很大价值。

内插降雨时,短暂记录的标准期间,要考虑到年降雨量大的变化。因此提出了观测降水量空间分布的适当统计模型。该模型的误差结构允许由于缺失记录而导致的观测降雨量从标准期间平均值的偏差,以及平均降雨量因为位置和高程平滑功能的不足。误差的第一个组成部分是由于年降雨量相对较大。引起这种变化的广泛规模过程是观察到的方法与重叠记录周期的强相关性。因此,该组件可能会在不同数据位置之间呈现强烈的依赖关系,具体取决于常见记录的年数。误差的第二个组成部分主要是由于局部效应低于数据网络的空间分辨率。这些可以被假设为在不同的数据位置之间是独立的。通过同时采用时间和空间相关性,基于该误差模型的方法是比方法有重大进步,如Bennet等(1984),其通过分别并入这些依赖关系来估计丢失的数据。

数据误差模型的非对角协方差结构可以通过拟合使用相应的非对角线误差协方差矩阵的样条直接进行反演。或者,观测到的短期降水量可以通过采用与附近站进行线性回归的常规做法来标准化,以更准确地估计标准期间的手段。然后可以通过用对角线误差协方差矩阵拟合样条来插值标准化装置,从而允许跨数据网络的空间变化的误差方差。这两种方法都允许使用基本上所有时段记录的降雨量。

这些方法的主要不足是数据量的需求。澳大利亚东南部一个地区的年平均降水量数据的误差结构可以由更简单的不相关误差结构代替,导致内插表面的精度略差。对于这些最简单的模型,只需要降雨量和记录长度。这些简单的总结数据可能是某些地区可用的唯一降雨数据。

薄板光滑样条也允许直接并入不同程度的地形依赖性,特别是当它们被扩展到包括线性参数子模型时。这样的功能称为部分样条。本文最后通过检查多个样条和部分样条模型,其结合不同程度的依赖于地形,包括坡向和高程。在经度,纬度和高程三维平滑样条函数中使用的高程缩放显示对其性能至关重要。

  1. 部分薄板样条模型

部分薄板样条已由Wahba(1990)详细描述。它们包括薄板样条(Wahba and Wendelberger 1980)作为特例。Hutchinson(1991)发现总结了基本方法论,主要考虑气候插值。 Gu and Wahba(I 993)、Mitasova和Mitas(1993)已经展示了针对各种地理应用的进一步发展。Hutchinson(1993a)提出了与地统计学(克里金)方法的近似比较,其中样条分享密切的正式关系被Hutchinson (1993a)、Hutchinson 、Gessler (1994) and Laslett (1994).薄板样条与地统计技术的主要优点是样条不需要事先估计空间自协方差结构。这种结构可能难以验证。在下面的几乎所有分析中,数据错误的差异在数据网络中变化时,可能不会使用标准变差函数拟合技术来估计此模型。此外,可以通过最小化广义交叉验证(GCV)来简单地优化由薄板样条引起的数据平滑量。这种易于操作并不会牺牲精度,并且样条中体现的数据挖掘范式允许有效检测数据错误(Hutchinson 1993a,Hutchinson和Gessler 1994)。已经开发了用于计算和优化薄板样条的高效计算技术,并在下面描述。

通过设置给出位置x i处n个数据值zi 的部分样条观察模型

其中f是未知的平滑函数估计,是一组p已知功能和beta;j是一组还有待估计的未知参数。xi通常表示二维或三维欧几里德空间中的坐标。是由协方差结构给出的零均值随机误差。

其中V是正定ntimes;n矩阵,可以是已知的或未知的。误差,如果V是对角线则不相关,否则相关。通过最小化来估计函数f和参数Pj

其中和

是根据f的m次导数定义的样条函数f的粗糙度的量度,是平滑参数为正数。可以明确地解决最小化问题的解决方案,其估计是根据距离每个数据位置的标量函数的扩展。标量函数的形式取决于xi的维度和定义粗糙度的导数m的阶数(Wahba,1990)。当没有参数子模型(即,当= 0时),该解决方案减少到普通薄板平滑样条。光滑参数决定了数据误差和表面粗糙度之间的折衷。通常通过最小化GCV来计算。这是通过去除计算的拟合表面的预测误差的量度。 依次对每个数据进行相加,并将适当加权的省略的数据点与装配到所有其他数据点的曲面的差异的平方相加。因此可以有效地计算GCV。直观地,GCV是对拟合表面的预测能力的一个很好的测量,在理论上和在实际和模拟数据应用中已被验证的(Wahba,1990,Hutchinson和Gessler,1994)。该方法通过类比线性回归提供的估计。可以通过将该估计与的可用估计值进行比较来评估适合度。用于确定平滑参数和求解f和beta;j的计算技术已针对速度和存储空间进行了优化(Hutchinson 1984,Bates e t a l 1987)。数据点的数量通常受到对尺寸略小于n的全矩阵进行三对角化的要求的限制。然而,当有超过几百个数据点时,薄板样条函数f可以根据限制的数据位置或结点来定义。然后可以排列计算,使得只有具有等于结数的阶数的矩阵必须被存储和分解(Hutchinson 1984)。这允许在计算机上容易地处理高达几千点的数据集,只要拟合的样条函数可以很好地描述不超过几百结点的数据集。这种技术在FORTRAN中的实现已经由Hutchinson(1984)和Bates(1987)等人描述。作者提供了一个名为ANUSPLIN的软件包。

3.一系列连续不完整的年平均降水量

1955年至1988年34年期间的各种子集的年降雨量可在澳大利亚东南部地区195个地点获得,如图1所示,数据的空间密度倾向于澳大利亚首都直辖区的中部地区。数据包括Hutchinson和Johnson(1991)在初步研究中使用的数据。图I中绘制的整个区域地势超过1600m。如图2所示,相对较少的站点已经完成甚至接近完整的记录。为了评估各种插值策略的准确性,从表面拟合分析中可以显示出18个站点,如图1所示。使用ANUSPLIN软件包中的SELNOT程序对这些站点进行了大约等距采样,其中经度,纬度和高程各自被缩放以具有单位差异。通过初始选择所有数据点,然后连续地从网络中最靠近的数据中删除具有较短记录周期的数据点,直到仅剩18个点来选择保留点。该选择程序对所提出的插值方法施加了严格的测试,因为保留数据点(其中大多数具有30多年的记录)通常被认为是最适合用于配合表面的数据点。一些被保留的站台与其他数据点相距甚远,特别是在高程方面。

图1 195个数据点的地理位置:用于表面拟合的177个数据点( )和用于验证的18个数据点,内在的实线界定了澳大利亚首都,虚线界定图4,5中绘制的区域。

图2 每个记录的站数,每个站点至少有5年的记录。

3.1标准化到34年

众所周知,从i记录的年份开始,i点的年降雨量平均值zi具有差异,其中是位置i年降水量的方差。基于这样的假设,即平均值是估计无限长期的“真实”长期平均值。这是否存在是有争议的,特别是当气候被认为是变化的时候。更明确定义的概念是指定标准期间的平均值。附录中显示,位置i的数据意味着1955年至1988年期间34年平均值的估计值有差异

如果观察记录完整,则该值为零,否则为正数。这些值在195个完整数据集上的平均值为65.9 mm,降雨量的8%左右为870mm。这个计算的基础是合理假设时间平稳性较弱,因为在34年标准期间,年降雨量差异假定为不变。

每个观测到的降水平均值通过回归观测到的年降雨量的年降雨量被更新到34年平均值的更准确的估计值,以便在更长的记录周期内填补缺失值。对于每个短期降水平均值,选择具有最小估计误差方差的回归估计。该方差包括当所选择的长期本身没有完整的观察记录时由回归引起的误差的方差和方程(5)给出的误差的方差。对于所选的177个数据点,标准期估计的估计误差方差的均方根为20.6 mm,仅为平均值的2%。由于18个保留数据点的记录时间较长,误差方差估计的均方根为16.5毫米,也是网络平均值的2%。

使用18个保留数据点的标准周期回归估计及其估计的误差方差来评估下面描述的内插薄板平滑面的精度。应该注意的是,保留的数据并不用于优化平滑参数,而只是为了验证各种误差估计。在每种情况下,通过最小化GCV,估计的表面误差最小化。在普通应用中,所有195个数据点将包含在表面拟合过程中。

  1. 统计范式内插降雨

4.1非对角误差协方差模型

在每个位置观测到的降水量的相对完整的统计模型由等式(1.2)给出,其中的误差结构,通过设置分解成两个分量

其中R表示从34年标准期间观测到的平均值的偏差,S表示由平滑函数g给出的平均降水空间模型的不足。附录中显示,R的元素由下式给出,

其中ni和nj是位置i和j处记录的年数,nij是共同的年数,pij是每个位置的年降雨量之间的相关性 ai2和aj2是每个地点年降雨量的差异。

可以合理地假定,由于测量误差和低于数据网络的空间分辨率的其他局部效应,由g给出的模型中的缺陷是独立于一个位置到另一个位置,并且该误差的幅度与每个地点的年降水量差异。如果需要,雨量计读数的系统偏差可以通过首先系统地扰乱观察到的数据来适应。因此,S被假定为具有给定的对角元素的对角矩阵

其中m是未知常数因子。

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[27442],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。