用于非线性估计的Unscented卡尔曼滤波器外文翻译资料

 2022-07-14 02:07

英语原文共 6 页,剩余内容已隐藏,支付完成后下载完整资料


用于非线性估计的Unscented卡尔曼滤波器

Eric A. Wan and Rudolph van der Merwe

Oregon Graduate Institute of Science amp; Technology

20000 NW Walker Rd, Beaverton, Oregon 97006

ericwan@ece.ogi.edu, rvdmerwe@ece.ogi.edu

摘要

扩展卡尔曼滤波器(EKF)已经成为许多非线性估计和机器学习应用中使用的标准技术。这些包括估计非线性动态系统的状态估计,用于非线性系统识别的参数(例如,学习神经网络的权重)以及其中估计状态和参数两者的双重估计(例如,期望最大化(EM)算法)。

本文指出了使用EKF的缺陷,并介绍了一种改进方案,即由Julier和Uhlman提出的Unscented卡尔曼滤波器(UKF)[5]。在卡尔曼滤波器中执行的中心和重要操作是通过系统动力学传播高斯随机变量(GRV)。 在EKF中,通过GRV近似模拟状态分布,然后通过非线性系统的一阶线性化方程以非线性方式传播。这可能会在转换的GRV的真实后验均值和协方差中引入巨大的误差,导致次优性能和有时候滤波结果的发散。UKF采用确定性抽样方法解决了这个问题。同样的再次用GRV近似模拟状态分布,但现在用最小的一组谨慎选择的采样点表示。 这些采样点完全捕获GRV的真实均值和协方差,并且当通过真正的非线性系统传播时,可以准确地将后验均值和协方差精确到任意非线性三阶(泰勒级数展开式)。相反,EKF只能达到一阶精度。 值得注意的是,UKF的计算复杂度与EKF的计算复杂度相同。

Julier和Uhlman在非线性控制状态估计的背景下证明了UKF的显着性能收益。但没有考虑机器学习问题。我们将UKF的用途扩展到更广泛的非线性估计问题,包括非线性系统辨识,神经网络训练和双重估计问题。我们的初步结果见[13]。在本文中,此算法进一步开发和说明了一些额外的例子。

  1. 简介

EKF已被广泛应用于非线性估计领域。 一般应用领域可以分为状态估计和机器学习。 我们进一步将机器学习划分为参数估计和双重估计。下面简要回顾这些领域的框架。

状态估计

EKF的基本框架包括估计离散时间非线性动态系统的状态,

(1)

(2)

其中表示系统的未观测状态,而是唯一观测到的信号。过程噪声驱动动态系统,观测噪声由给出。请注意,我们不假设噪音源的可加性。系统动态模型F和H假定已知。在状态估计中,EKF是实现状态的递归(近似)最大似然估计的标准方法。 我们将在第2节中回顾EKF本身,以帮助进一步引出Unscented卡尔曼滤波器(UKF)。

参数估计

经典的机器学习问题涉及确定非线性映射 (3)

其中是输入量,是输出量,并且非线性映射G由矢量参数化。非线性映射可以是前馈或递归神经网络(是权重),例如回归,分类和动态建模。 学习对应于估计参数。通常,训练集提供由已知输入和期望输出组成的样本对。 机器的误差定义为,并且学习的目标涉及求解参数以最小化期望的方差。

虽然存在许多优化方法(例如,使用反向传播的梯度下降),但EKF可用于通过写入新的状态空间表示来估计参数

(4)

(5)

其中参数对应于由过程噪声(方差的选择决定跟踪性能)驱动的具有身份状态转换矩阵的固定过程。 输出对应于上的非线性观测值。 然后可以将EKF直接用作学习参数的高效“二阶”技术。 在线性情况下,卡尔曼滤波器(KF)和递归最小二乘(RLS)之间的关系在[3]中给出。 Singhal和Wu[9]以及Puskorious和Feldkamp[8]开发了使用EKF来训练神经网络的方法。

双重估计

机器学习的一个特殊情况出现在输入量未被观察时,并且需要耦合状态估计和参数估计。对于这些双重估计问题,我们再次考虑离散时间非线性动态系统,

(6)

(7)

其中系统状态和用于动态系统的模型参数组必须仅从同时观察到的噪声信号估计。第4.2节讨论了双重评估的方法。

在下一节中,我们将解释使用EKF的基本假设和缺陷。在第3节中,我们介绍了Unscented卡尔曼滤波器(UKF)作为修正EKF缺陷的一种方法。最后,在第4节中,我们介绍了使用UKF进行非线性估计在不同领域中的结果。

2.EKF及其缺陷

考虑如方程1和方程2中的基本状态空间估计框架。给定噪声观测YK,XK的递归估计可以用如下形式表示(参见[6]),

(8)

假设先验估计和当前观测值是高斯随机变量(GRV),这个递归提供了的最优均方误差(MMSE)估计。我们不需要假设模型的线性。 这个递归中的最优项是由

(9)

(10)

(11)

确定的。其中的最优预测被写为,并且对应于随机变量和的非线性函数的期望(类似于最佳预测的解释),最优增益项被表达为后验协方差矩阵()的函数。注意这些条件也需要考虑先前状态估计的非线性函数的期望。

卡尔曼滤波器精确地在线性情况下计算这些量,并且可以看作是通过线性系统动态分析传播GRV的有效方法。然而,对于非线性模型,EKF将最优项近似为:

(12)

(13)

(14)

其中预测被简单地近似为估计的先验均值的函数(没有预期采用)协方差是通过线性化动态方程,

然后对线性系统分析确定后验协方差矩阵来确定的。 换言之,在EKF中,状态分布通过GRV近似,GRV然后通过非线性系统的“一阶”线性化分析进行传播。读者参考[6]的显式方程。 因此,EKF可以被看作是对最优项提供“一阶”近似。但是,这些近似值可能会导致变换(高斯)随机变量的真正后验均值和协方差中的大误差,这可能导致次优性能和有时过滤器的发散。正是这些“缺陷”将在下一部分使用UKF进行修改。

1噪声方法用和表示,通常假定为零。
2虽然EKF的“二阶”版本存在,但它们增加的实现和计算复杂性往往禁止它们的使用。

3.Unscented卡尔曼滤波器

UKF解决了EKF的近似问题。状态分布再次由GRV表示,但是现在使用一组精心选择的采样点来指定状态分布。这些采样点完全捕获GRV的真实均值和协方差,并且当通过真正的非线性系统传播时,为任何非线性准确地捕获后验均值和协方差到三阶(泰勒级数展开式)。为了详细说明这一点,我们首先解释Unscented变换。

Unscented变换(UT)是计算经历非线性变换的随机变量的统计量的方法[5]。考虑通过非线性函数传播随机变量(维度L)。 假设具有平均值和协方差。为了计算y的统计量,我们根据以下公式形成2L 1个西格玛向量(具有相应的权重)的矩阵:

(15)

其中是缩放参数。确定西格玛点在周围的扩展并且通常设置为小的正值(例如,1e-3)。是一个二级缩放参数,通常设为0,用于合并的分布先验知识(对于高斯分布,是最优的)。是矩阵平方根的第i行。这些西格玛矢量通过非线性函数

(16)

传播,并且使用后西格玛点的加权样本均值和协方差来近似表示的均值和协方差,

(17)

(18)

请注意,这种方法与一般“抽样”方法(例如,蒙特卡罗方法,如粒子滤波器[1])有很大不同,后者需要数量级的更多采样点,试图传播准确的(可能是非高斯的)状态分配。对UT采取的看似简单的方法导致对于所有非线性度的高斯输入准确的三阶近似。对于非高斯输入,近似值至少精确到二阶,三阶和更高阶矩的精度由选择和(参见[4]关于UT的详细讨论)确定。图1显示了一个二维系统的简单例子:左图显示了使用Monte-Carlo采样的真实均值和协方差传播;中心图使用线性化方法显示结果,这将在EKF中完成;右边的图表显示了UT的性能(注意只需要5个西格马点数)。UT的超高性能很显而易见。

实际(采样) 线性化 (EKF)UT

图1:均值和协方差支持的UT示例。 a)实际的,b)一阶线性化(EKF),c)UT。

Unscented卡尔曼滤波器(UKF)是UT直接扩展到等式8中的递归估计,其中状态参数R被重新定义为原始状态和噪声变量的级联:。 将UT西格玛点选择方案(等式15)应用于这个新的增广状态RV以计算相应的西格玛矩阵。 UKF方程在算法3中给出。注意,不需要明确计算Jacobians或Hessians来实现该算法。 此外,该计算的总数与EKF的顺序相同。

4.应用程序和结果

UKF最初是为状态估计问题而设计的,并已应用于需要全状态反馈的非线性控制应用中[5]。在这些应用中,动态模型表示一个基于物理的参数模型,并且假定已知。在本节中,我们将UKF的用途扩展到更广泛的非线性估计问题,结果如下。

4.1.UKF状态估计

为了说明UKF的状态估计,我们提供了一个与噪声时间序列估计相对应的新应用实例。

在这个例子中,UKF被用来估计被加性高斯白噪声破坏的底层净时间序列。使用的时间序列是Mackey-Glass-30混沌系列。

初始化为:

此处

计算西格玛点数:

时间更新:

测量更新方程:

其中,合成缩放参数,增强状态的维数,

=过程噪音协方差,=测量噪音协方差

=质量 按照公式15计算。

算法3.1:Unscented卡尔曼滤波(UKF)方程

净时间序列首先被建模为非线性自回归方程

(19)

其中模型(由表示)通过训练前向神经网络对净序列进行逼近。收敛后的残差被认为是过程噪声方差。

接下来,在纯粹的Mackey-Glass系列中添加高斯白噪声以生成噪声时间序列。相应的状态空间表示由下式给出:

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

(20)

在估计问题中,噪声时间序列是EKF或UKF算法(都使用已知神经网络模型)的唯一观测输入。请注意,对于这种状态空间公式,EKF和UKF都是指令复杂性。 图2显示了由EKF和UKF生成的估计的一个子段(原始噪声时间序列具有3dB SNR)。UKF的卓越表现清晰可见。

Mackey-Glass时间序列的估计:EKF

Mackey-Glass时间序列的估计:UKF

估计误差:EKF vs UKF在Mackey-Glass上

图2:估计Mackey-Glass时间序列与EKF和UKF使用已知的模型。 底图显示了完整序列估计误差的比较。

4.2.UKF双重估计

回想一下,双重估计问题包括同时估计纯粹状态和来自噪声数据的模型参数(见公式7)。如前所述,针对这个问题存在许多算法方法。我们介绍Dual UKF和Joint UKF的结果。用

全文共8751字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[9521],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。