

英语原文共 18 页,剩余内容已隐藏,支付完成后下载完整资料
集合离散度与预报误差关系的评估
T. M. Hopson
美国科罗拉多州, 博尔德, 国家大气研究中心应用研究实验室
(2012年4月10日收到初稿,最终定稿于2013年7月19日)
摘要: 集合预报系统(EPS)代表其自身变化的预测误差的潜在能力,为在较低成本的确定性预测中产生EPS提供了强大的动力。传统上,这种能力已经通过将已实现的预报误差与集合的离散联系起来进行评估。本文回顾了技能-离散度相关性的局限,但是利用相关性方面来引入两种度量方式旨在评估一个集合预报系统提供值得信赖的判断其自身误差的可能性的能力。当使用一种完美的集合预报系统,技能-离散度相关性被显示受限于其对”技能”与“离散度”的定义的依赖程度,也许最致命地是它无法从正在建模的物理系统的稳定性属性中提炼技能-离散度的可靠性。在此基础上,我们认为应该从两个方面评估集合的离散。首先,在离散过程中是否有足够的变率来证明集合预报系统所耗成本的合理性。控制离散度-误差相关性理论上限的因素可以被用于诊断这一问题。其次,集合的变量离散是否与预报误差的变量期望有关?表示与理论极限有关的离散度-误差相关性可以提供对上述问题的简单诊断。这些概念的环境背景可以通过评估两种运行集合来评估:后处理前后美国西部温度预报和雅鲁藏布江流量。结果表明,通过后处理可以提高EPS系统的“技能-离散度”可靠性,但将会以集合预报系统的变量离散的潜在信息内容为代价。
关键词 集合预报 技能-离散度相关性 离散度-误差相关性 离散评估
1 引言
集合天气、气候和水文预报的发展带来了新的机遇,为整个“最佳预测”预报提供了重要的经济和人道主义的优势 (例如,Richardson2000;Zhu et al;2002;Palmer 2002)。集合预报系统(EPS)的一个潜在的显著的特点是能够预测自身的预报误差。如果EPS通过其随时间变化的集合分散提供对其时间变化误差的精确期望,则可以实现这一点 (Molteni et al . 1996;Toth和Kalnay 1997;Houtekamer et al.1996; Toth et al.2003; Zhu et al.2002 ; Hopson和Webster 2010)。
一般来说,预计结果是较大(较小)的集合离散意味着预测中的不确定性更多(更少)。 过去的研究使用Pearson相关系数(Stigler 1989)作为诊断,将不同的集合离散度测量与不同的预测误差测量相结合。然而,使用这个度量所得出的结论在许多研究中是模棱两可的(Barker 1991; Molteni et al.1996; Buizza 1997; Scherrer et al.2004)。
为研究技能-离散度相关性的不确定性,Houtekamer(1993),Whitaker和Loughe(1998)以及Grimit and Mass(2007)使用Kruizinga和Kok(1988年,以下简称KK)最初提出的一个统计模型,该模型基于一个 EPS完美的预报假设:其中预报误差的基本概率分布函数(PDF)是已知的,集合中的个体成员是从这个分布随机抽取,集合离散度提供了预期的预报误差的度量方法。在 KK模型的背景下,这些作者表明,即使是一个完美的EPS,技能和离散度之间的相关性也不需要太大。特别是,线性相关的大小取决于离散度的日常变化:对于集合离散度中存在大的时间变化的验证数据,离散度与技能之间的相关性是最大的(但仍然小于1)。相反,集合离散度在时间上更均匀的预测,离散度与技能之间的相关性是最小的。 Grimit和Mass(2007)也评估了在不同连续和不同类别的离散度和误差度量以及有限大小的集合系统的情况下,相同KK模型的离散度-误差相关性的行为(也参见Kolczynskiet al,2011),结果表明离散度-技能的相关性也取决于这些其他因素。
尽管在一个特定的统计模型(即KK)的背景下进行,但这些研究得出的一般结论是,线性相关作为一种验证方法,由于其依赖于EPS预报结果之内的的其他因素而受到限制。本文的一个目的是进一步从更理论的角度阐述和概括这一点。通过这样做,我们分离了控制技能-离散度相关性的一般化因素,并且指出我们认为应该被评估的一个集合的离差变化,以证明EPS的效用是合理的。也就是说,集合预报离散的日常变化是否与预期的预报误差的日常变化有关?其次,或许更根本的是,在EPS离散中是否有足够的变率来证明集合产生的代价是合理的呢?出于这些考虑,从我们更多的关于离散度-技能相关性的限制的理论研究结果出发,我们提出了两个进一步的指标来测试一个EPS的效用,以及这些指标的小样本集所造成的这些指标自身的不确定性。
其他研究还设计了一些指标来评估集合的离差变化的效用,而这些指标不受离散度技能Pearson相关系数的限制。尤其是,Wang和Bishop(2003)提出了一种这样的方法,通过创建选择性离散度度量(在他们的研究中称为集合方差)的分箱,然后平均这些箱子相应的误差度量(例如,集合平均的平方差)去除统计噪音。在这个箱子平均之后,恰当匹配的点差和误差测量应该相等(除去观测误差),因此,完美的EPS预测应该产生沿着45°线的点。由于集合分散的变化变得不那么重要,这条曲线的斜率(分段误差与分段分布)变得更加水平。然而,由于这种方法在视觉上具有信息量,因此,由于本测试所需的足够数量的箱子和每个箱子中的点数的不确定性,特别是对于小型验证数据集,EPS的误差离散度可靠程度的不确定性会有所上升。同样,Wang and Bishop(2003)也认为,分箱误差度量变得不稳定的速率随着分箱大小(即样本大小)变小而降低,并且分箱误差样本中的峰度都提供了EPS误差变化预测准确度的度量。然而,后两种方法都依赖于高斯假设来进行正确的解释。
在第二部分中,我们使用EPS完美预测假设,没有抽样限制,为不同匹配的离散度-技能度量的Pearson线性相关的理论简化提供了明确的计算。计算提供了对本文其余部分有用的一般化因素。在第三部分我们讨论第二部分的计算结果,显示了离散度-技能相关性的理论渐近极限如何随着使用哪种离散度-技能度量而产生巨大的变化。我们也提供KK模型的结果作为一个特定的案例研究。 在第四部分中,我们讨论了两个进一步的指标来评估集合的时间变化离散的效用,在第五部分,我们把我们的分析放在两个特定EPS离散度和误差的例子中:使用美国西南部某一地区的温度集合预报和孟加拉国的河流量预测。
2 计算
在这一部分中,我们考察了代表集合离散度-技能关系的线性相关的弱点。为了做到这一点,我们从一个完美EPS的环境背景中分离出控制离散度-误差相关范围的因素,对于不同的连续集合离散度和误差度量的配对,没有采样限制(即,大的集合数)。因为我们表明在这种情况下,相关性可能会有所不同,这就在预测集合离散的预期预报误差方面限制了其诊断实际EPS性能的能力。
图1提供了适用于集合离散度-技能关系概念的示意图。显示的是对于三个不同的预测初始化时间,从总体Psi;得到的连续随机变量psi;的六元集合预测。集合成员由六根细的黑色垂直线表示,其中隐含的PDF p(psi;; si),其中成员是由钟形曲线给出的样本。PDF表示无抽样限制的渐近极限的预报。相应的预报观测值由垂直的红线表示,集合平均值由竖直的虚线给出。如果这些集合是由一个完美的EPS产生的,那么这些集合与观测值一同表示从每个特定的p(psi;; si)的随机抽取样本。对于每个预测,某些误差ε得测量方式(这里表示为观测值距集合平均值的距离)也显示出来,同样也是集合成员离散度s的一些度量方式,我们把si作为psi;分布p(psi;; si)的一个参数。请注意,ε和s是相对于时间演化预报PDF p(psi;; si)而定义的,而不是来自固定气候分布的异常,因此它们涉及集合成员的联合分布和观测值。这就是p(psi;; si)的“宽度”变化如何与观察到的预报误差相关性值得探讨的原因。
图1 相关系数简化计算示意图。 细实线表示从高斯形状的灰色PDF曲线随机绘制的变量psi;的六元集合预报,其平均值由垂直虚线给出,以及离散度s1,s2和s3 分别对应预报时间t1,t2和t3的定义。 与集合预报相应的观测(验证)由垂直红线给出,预报误差ε1,ε2和ε3在这里被定义为集合平均值到观测的距离。详情参见文本。
Pearson相关系数在应用于相应的技能-离散度测量的样本时表示为:
其中s是集合离散度的一些度量,ε是预测误差的一些度量,平均值位于验证集合中的所有预测观察对{i}之上,并且其中 ,扩展和简化之后,r也可以写成:
预报成员离散度估计值s通常被定义为标准偏差(Ssd),集合成员关于集合平均值(Smad),方差(Svar)的平均绝对差异,或者不太常见的,在表1的第1列中给出关于所选集合成员(Smd)的集合成员平均绝对差异。第2列给出了用于分布度量的表示符号,其中在第3列给出了度量的有限样本估计版本。此外,我们把关于平均值(Sm4)的集合成员的第四个时刻包括在内,在计算中显示出了结果。
表1 一个给定预报集合Psi;i的集合离散度度量。他们的有限集合大小为M的样本估计在第3列中给出,并且在第4列中给出了总体EV表示(即,M无穷大)。如果Psi;i是正态分布的,则它们的EV在第5列中给出。这里是集合平均的意思。
表2 使用集合误差度量及其符号表示(第2列)。集合大小为M的有限样本估计显示在第3列中。请注意,在εaee和εsee的情况下,度量被定义为单个值,而不是所有集合成员的平均值。在第4列中给出了总体EV,其中所有可能的集合成员的观测值以及完美EPS(其中 )的预报i的所有可能的观测值的度量都进行了平均,表明了误差度量的EV如何等于离散度度量。当每个集合预报成员集合呈正态分布时,第5列显示第4列的EV。 第6列和第7列提供了类似的EV结果,但是在相关系数计算中使用度量的平方(ε2)集合平均值表示为。
表2给出了类似的误差度量结果。集合预报的预报误差通常是以验证(观测)与集合平均预报(分别为εsem或εaem)或任何一个随机选择的集合成员(分别为εsee或εaee)。 后两个度量表示确定性预测误差(即,单个实现),经常用于扩展-误差相关性。请注意,后两个指标也可以定义为所有集合成员的平均值,而不是单个成员;如果是这种情况,则由于(2)中的ε2项减少,离散度误差相关性(平均值)将会增加。
因为我们想要消除取样变异性(即集合大小)对r值的影响,所以我们使用通常样本的s(如表1第4列中给出的)的预期(或“期望”)值(EV)如(2),而不是使用有限样本估计(如表1第3列中给出的)。这相当于使用隐含的PDF的p(psi;; si)来计算i预测中Si的平均值,如图1所示。举一个例子,考虑大小为M的集合预测的标准差的离散度度量,其样本估计值Ssd由下式给出
其中波浪线代表集合整体平均值。如果相反,M是无限的,但psi;m是离散的,则有限估计Ssd被其相关的EVsigma;代替:
对于给定的预测i或对于连续分布,在总体群体Psi;i上进行求和,
(4)或(5)的EV计算中用“括号”表示法简写:
在(4) - (6)中。 在本文中,我们使用波浪线代表集合成员m的平均值,直线代表平均超过预测{i},而lt;.gt;F代表EV对应的分布F.
为了进一步消除采样变异性对r的影响,且不失一般性,我们可以计算(对于每个预测观测对i)(2)中每个项的EV在集合的可能状态(Psi;i)和观察值 (Psi;i0)分布:
由于我们正如前面所讨论的那样计算s在应用r之前的EV,所以(7)式中的s对于集合的所有可能状态的平均是不变的,而且它也与观测状态无关。因此,s可以从括号中取出,并且(7)可以简化为
我们用这个方程式代替ε和s的EV表达式来得到r的简化表达式。
表1和表2中的值可以直接代入(8)。在这两个表的第4列中,我们分别列出了s和ε的总体EV形式,第5列给出了如果集合成员全体(Psi;i)是正态分布的结果。在我们的计算中,我们使用了完美的EPS假设,所以在表2中,我们给出了时在所有可能的观测状态下ε的EV的表达式。另外,在表2的第6和第7列中,我们提供了误差度量平方的EV结果。请注意,表2的第4-7列中,误差度量的EV变换成与EV计算后的离散度度量成比例,第5列和第7列仅与正态分布预测的总体标准偏差sigma;的幂成正比。正是由于误差度量的EV与离散度度量(在没有采样限制的完美EPS的情况下)之间的这种关系,(8)中的项可以代数简化。
当将预期误差与具有相同时刻(物理单位)的集合离散度直接相关时,可以说只有这些误差和离散度度量的某些配对是适当的。在表1和表2中的度量中,我们将1)误差测度的方差与方差作为离散度度量,2)误差度量的绝对误差与标准偏差或平均绝对差作为分布度量。表3和表4给出了这些配对的简化相关系数结果,下一部分给出了一个例子,附录中给出了另外两个例子。
计算举例:Smad与εaem的联系
在本节中,我们将给出一个计算示例,即在没有抽样限制的完美的EPS中如何简化(Smad,εaem)的相关性。我们从(8)开始,参考表1和表2作为替代。
如表2所示,这种离散度-误差配对特别适合,因为(对于完美的EPS)误差度量的EV是离散度度量本身。 注意到(
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[21561],资料为PDF文档或Word文档,PDF文档可免费转换为Word
您可能感兴趣的文章
- 气候系统模式BCC_CSM1.1对东亚高空对流层急流和相关瞬变涡流活动的模拟外文翻译资料
- 基于FAO Penman-Monteith方程与每日天气预报信息估算参考蒸散量研究外文翻译资料
- 稳定非饱和渗流条件下的无限大边坡稳定性外文翻译资料
- CMIP5模式下中国极端降水指数。第二部分:概率投影外文翻译资料
- 2013年2月8-9日东北部地区暴风雪过程的偏振雷达和微物理过程研究外文翻译资料
- 华南前汛期香港中尺度暴雨的研究外文翻译资料
- 边界层对极地春季臭氧损耗现象起止的影响外文翻译资料
- 一种利用神经网络从具有高光谱分辨率的红外光谱 反演温度信息的方法外文翻译资料
- 1961 ~ 2004年青藏高原夏季降水的时空分布外文翻译资料
- 中国中东部地区冬季雾——霾日的年际变化及其与东亚冬季风的关系外文翻译资料
