质量控制:方法与应用外文翻译资料

 2022-11-22 11:11

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


质量控制:方法与应用

PIERRE GAUTHIER,CLEacute;MENT CHOUINARD

和BRUCE BRASNETT

加拿大气象局

多瓦尔,魁北克,加拿大

  1. 简介

所有同化方法都依赖于从多个渠道收集到的数据。有传统的数据源如地面观测,探空资料,到现在在卫星数据内逐渐增加的飞机和船舶数据(也见R. Swinbank在《大气观测》及J. N. Theacute;paut在《同化遥感在数值天气预报的意见》的某些章节)。仪器误差可能由于一个不正确的校准或随机误差导致的系统误差导致,反映了测量的精度和代表性。在这个进程中,同化方法表明,由于仪器故障问题,在同化中使用的数据存在无偏误差且没有任何严重错误。这种误差被称为粗差。

粗差有几个来源。这些可以与仪器校准,数据被传播给运营中心时的传输问题以及接收数据的预处理等相关。必须找出方法以检测出这样的错误,从而剔除所有具有高几率粗差可能的数据。背景场反映了我们从过去的观测场中所获得的先验知识大气当前的状态。我们将这个观测结果表示为矢量y,去检验其是否在期望值内合理变动。他们将与和观测场相当的背景场H()作比较,其中H表示观测算子。更新矢量y- H()则是针对常见的大气状态每个观测量的偏差的量度。这个信息对于评估是否有任意类型的粗差污染了新数据是非常有用的。这些想法可以通过采用条件概率加以形式化,以此评估在给定背景状态与已知的(或假设的)误差概率分布下基准y正确的概率。在本文中,质量控制将使用贝叶斯的角度对数据进行同化。

本文将在仪器运营中心常规运行的观测监测阶段通过某种仪器,使用更新矢量诊断潜在问题,以此评估仪器是否存在偏差。在简要介绍了条件概率和贝叶斯定理后,下面将对背景检查程序和变分质量控制加以阐述。

2. 贝叶斯方法的资料同化

Lorenc(1986)所撰的文章显示,该数据同化的统计估计问题可以用条件概率和贝叶斯定理求得。本节简要地介绍了这种方法,读者可在本文和Rodgers (2000)所撰述的文章中了解更多详情。x的联合概率分布为大气状态矢量,y为观测向量,则p(x,y)可以定义边际概率密度p(x)和P(y)为:

其中,P(x)和P(y)是由积分y和x的所有可能值而分别取得。假定背景误差概率分布满足高斯分布,那么:

 (1)

其中,B为背景误差协方差矩阵,C为归一化常数。在没有任何其他信息的情况下,P(x)代表我们的先验知识状态的氛围中包含背景状态。在没有任何其他信息的情况下,最可能的状态必须为。同样,P(y)代表我们的先验知识的真实价值的观测。例如,在高斯情况下,它将对应:

 (2)

其中R是观测误差协方差矩阵,为一个归一化常数。为测量的实际值。

条件概率p(y | x = )代表的y取特定值的概率,由于x = 。这可以表示为:

一一 一一一一一一一 (3)

同样的,

一一 一一一一一一一 (4)

由(3)式和(4)式可推出:

(5)

令为大气状态的真值x,为与观测相关联的实际值,则(4)和(5)意味着:

 (6)

这是贝叶斯定理在条件概率下所表达的概率分布。因为已被观测到,x是大气状态的真值,这个论点的关键在于x = ,这意味着 = H(。在高斯分布的情况下,y =对应的概率对应为:

(7)

在这里,我们假设R包括代表性的错误。它的均值集中在H()上,这种条件概率就完全被观测误差的概率分布所描述。因此贝叶斯定理意味着:

一一(8)

通过p(x|y),x是真值的后验概率分布,这指出最可能的状态下,最大似然估计由最小化(8)式得到。在高斯分布的情况下应用(1)式和(7)式,我们可以得到:

一一一一 (9)

当误差满足高斯分布时,该式对应统计估计问题的变分形式。然而,(8)式可以考虑非高斯概率分布。这些将在第四部分进行讨论。

注意:如果H是线性的,那么(9)式意味着后验概率分布也是一个高斯分布,为其平均值,其均值和协方差对应。

3.观察检测和背景检查的质量控制

在同化中所使用的背景场被作为进行估计大气的先验条件,它提供了一个共同点,对所有的观测都可以进行比较。更新矢量,其中H(,而H=part;H/part;X是观测算子的雅可比。这里假设包括了代表性误差。通过数个观测类型平均化更新矢量,就会发现观测值和背景误差是否是无偏的。该阶段是观测的监控,允许检测问题严重的数据。图1所示的是计算了辐射数据超过ATOVS水平的1-D数据的4个微波渠道更新矢量的时间序列。更新矢量(红色绘出)已经被平均为同化接收的所有数据,并已示出2001年1月该图的情况。数据显示信道MSU-3的偏差(虚线曲线)和标准偏差(实线) 在同一水平。这样的数据对分析是非常有害的,必须加以剔除。在添加新的仪器时,该监测可用于校准,对表征测量误差非常有用。

图1. 时间序列的更新矢量ATOVS 1d辐射。更新矢量(O-F偏差)用红色线绘制,分析偏差(O-A)以蓝色线绘制。两个偏压绘为虚线,标准偏差绘为实线。

假设观测和背景误差是无偏的,更新矢量满足下式:

并表示了与具有概率分布的更新矢量相关的误差协方差。假定这些满足高斯分布,则:

 X (10)

对于每个数据来说,这意味着在观测位置,更新矢量分布满足:

 (11)

在此基础上,人们得出结论,认为更新矢量为以下结果的概率很小:

其中,lambda;被定义为取决于观测类型和地理位置的拒绝标准。例如,如果lambda;= 2,则这样的事件发生的概率小于5%。此背景检查过程用于标记具有高概率错误的数据。需要注意的是,最好使用背景检查来消除显然存在误差的数据。在这种情况下,lambda;应选择相对较大的值。

4. 变分质量控制

与测量精度和代表性相关的观测误差是随机的,通常可将其描述为以平均值和方差:记作,)。然而,也有独立于真实值之外发生严重粗差的可能。如Lorenc和Hammon(1988)所讨论的,可以假定容许粗差的值在这一限定范围内。据Dharssi等(1992)和Ingleby及Lorenc(1993)所证,观测误差的概率分布呈现为如下形式:

(12)

图2. 变分QC-Var成本函数(Jo),其梯度和相关的权重WQC表示为背离估计真值yt= 中的观测值y的归一化函数。粗差的概率已被设置为P= 0.01

其中,P表示粗差的总概率, 1/D,为一常数。最终,)=(,并假定。在此阶段,=H(x)代表基于我们目前对大气知识用x表示的观测的真值估计。

在贝叶斯公式中,参数是P(y | x)= (y – Hx)。假设这些观测误差是互不相关的,那么:

(Hx,))

其中gamma;= P/D。如Andersson和Jauml;rvinen(1999)在文中所述,为方便在此重写高斯形式,可导出

V一一一一 一一一 (13)

此时gamma;=,其梯度为

一一 一一 (14)

图3.

图3. 与5个具有背景场的风观测资料对比导致4个良好观测数据被剔除的情况示意图。运用QC-VAR后,与背景状态最相符的数据最终被剔除。

在这种情况下,为方便在高斯情况下进行计算,我们认为观测误差是互不相关的。对每个数据利用(13)式求得的值,利用(14)​​式求出梯度。这被称为QC-Var成本函数。运用与高斯误差统计相关的数据作适当的微调,该成本函数很容易就能实现。图2所示为相关的成本函数,其中梯度和权重为y=的函数:这个数字类似于Andersson和Jauml;rvinen(1999)在图2中所示。对于偏差超过4的数据,梯度变得相当平坦,其观测对最小化的影响不大。

早些时候推出的背景检查过程中假设背景场为一个等同于观测场的合理模型,任何显著的偏差都可表明观测是错误的。但是,确实存在背景状态本身有误的状况,此时背景场可与观测场显著不同。如图3所​​示,背景检查过程会剔除有用的数据的而接受错误的。这个数据强调了以下事实,即如果预测错误地放置了一个低压系统,则大部分在区域中的数据会倾向于向东重新定位系统这种状况。如果这个比较是与背景状态对比,除了位于最靠近最低预测的数据的所其他数据最终都会被剔除。但是,执行基于所有可用的数据的初步分析将导致该系统的重新定位。在这种情况下,相对于这个分析的观测偏差来说,与背景场最为接近的初始数据是最为重要的。

在最优插值法(OI)的内容中,Lorenc(1981)使用仅涉及少数观测量,,hellip;的简化分析提出了质量控制程序。一组关于K的分析是基于之外的所有数据而获得的。如满足,(其中lambda;是预先设定的标准)则该数据将被剔除。这需要对误差方差的分析进行计算,当观测量较少时可以完成。该过程与观测的一个子集之间的一致性进行了间接比较,并剔除了与该数据的其余部分不相一致的数据。Ingleby和Lorenc在1993年发现了对这个程序的正式处理方法,并将其称之为OI质量控制。

在QC-Var算法中,这是通过允许估计部分来自观测集合所包含的信息受益而实现(Andersson和Jauml;rvinen,1999)。因此,有限的迭代次数通过在最小化的初始阶段关闭QC-Var进行多次迭代来完成,从而让迭代基于所有观测分析的主要特点而构建。此时QC-Var被激活,并且在QC-Var成本函数中使用模型状态的后验估计,引入观测偏差y - H(X),从而评估数据是否应被无保留地剔除。如果QC-Var在最小化的初始阶段被激活,来自背景场的小权重在赋给数据时将有大的偏差。这将给最接近背景状态的观测以更多的可信度,并将那些与它不相符的数据无保留剔除。这就是为什么首先让多次迭代次数最小化,再令大量数据进行重新定位分析。实验表明,如果收敛需要一百次迭代,在起初的30次左右迭代关闭QC-Var就足够了。当QC-var开启时,错误数据将被赋予较小的权重。

5 . QC-Var实验

这里提出的结果由加拿大气象中心的三维变分资料同化系统(CMC)获得,其中既包括背景检查也包括变分质量控制。该系统已在2001年12月(Gauthier等,1998,1999)得到落实。它显示了如何估计观测误差的概率分布。比较显示,相比于从OI质量控制所获得的剔除率,从OI质量控制获得的剔除率中已经剔除了一部分数据。

此前,加拿大气象中心的三维变分同化依赖于一个以前从CMC继承的最佳插值分析的质量控制手段 (Mitchell等,1996)。该QC-Var不明确接受或剔除数据。在这里,如果后验权重小于0.25,即认为数据被QC-Var剔除。表1给出了由背景检查和QC-VAR(权重在收敛计算中)使用的剔除率和限制。上述步骤的OI-QC对应于Lorenc(1981)所述。

表1. CMC最优插值分析和QC-Var对拒绝率和质量控制界限的比较(包括背景场检验)

时间范围从2001年1月19日至2001年1月31日。

观测类型

观测变量

拒绝率(%)

近似拒绝界限

QC-Var

OI-QC

QC-Var

OI-QC

SYNOP

压力(高度)

温度-露点差

温度

2.7

0.3

2.2

1.9

0.0

1.2

3.6 hPa

8.5 K

6.6 K

n/a

22 K

16.6 K

SHIP

压力(高度)

温度-露点差

温度

7.6

2.3

0.3

1.5

0.5

3.5

0.0

0.9

8m/s

8.5hpa

9.5K

5.7K

19m/s

n/a

26K

11.7K

DRIBU

压力(高度)

温度

2.8

3.1

3.1lt;

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[30256],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。