英语原文共 9 页

基于自适应结构局部稀疏外观模型的视觉跟踪

摘要

稀疏表示法已应用于视觉跟踪中，通过目标模板寻找重建误差最小的最佳候选对象。然而，大多数基于稀疏表示的跟踪器只考虑整体表示，并没有充分利用稀疏系数来区分目标和背景，因此当场景中存在相似的对象或遮挡时，可能会失败，可能性更大。本文提出了一种基于结构局部稀疏外观模型的简单而鲁棒的跟踪方法。这种表示方法基于一种新的对齐池方法，同时利用目标的部分信息和空间信息。通过在局部补片之间汇集获得的相似性不仅有助于更精确地定位目标，而且还能处理遮挡。此外，我们还采用了一种模板更新策略，将增量子空间学习和稀疏表示相结合。该策略使模板适应目标的外观变化，减少了漂移的可能性，同时也降低了被遮挡目标模板的影响。对具有挑战性的基准图像序列进行定性和定量评估，结果表明，所提出的跟踪算法与几种最先进的跟踪方法相比，具有良好的性能。

1. 介绍

视觉跟踪一直是计算机视觉领域的一个重要课题，特别是在监控、车辆导航和人机界面等方面的应用。尽管已经提出了许多跟踪方法，但由于部分遮挡、光照变化、姿态变化、背景杂波和视点变化等因素，这仍然是一个具有挑战性的问题。

目前的跟踪算法可以分为生成式和识别式两种。识别方法将跟踪描述为一个分类问题，目的是区分目标和背景。它使用来自目标和背景的信息。Avidan[2]将一组弱分类器组合成

一个强大的做合奏跟踪。在[7]Grabner等人提出了一种在线增强方法来更新识别特征，随后在[8]中提出了一种半在线增强算法来处理漂移问题。Babenko等人。[3]使用多实例学习（mil），将所有模糊的正负样本放入袋子中，学习用于跟踪的识别模型。卡拉尔等。[9]提出P-N学习算法，利用正、负样本的底层结构，学习有效的目标跟踪分类器。王等。[20]基于超像素的识别外观模型，便于跟踪器区分目标和背景。

生成方法将跟踪问题表述为搜索与目标模型最相似的区域。这些方法基于模板[13、5、15、1、10]或子空间模型[4、18]。为了适应姿态变化和光照变化引起的目标外观变化，对目标外观模型进行了动态更新。Matthews等人[15]开发一种模板更新方法，通过与第一个模板对齐来减少漂移问题。在[18]中，在跟踪过程中逐步学习低维子空间表示，以适应目标外观的变化。权等。[10]将观察模型分解为多个基本观察模型，以涵盖各种姿势和照明变化。大多数方法使用整体模型来表示目标，因此无法处理部分遮挡或干扰。

最近，提出了几种基于稀疏表示的跟踪方法[16，12，17，11]。梅等。[16，17]采用对象的整体表示作为外观模型，通过求解最小化问题来跟踪对象。刘等人。[11]提出了一种基于局部稀疏模型的跟踪算法，该算法采用稀疏系数直方图和均值漂移算法进行目标跟踪。但是，该方法基于静态局部稀疏字典，并且在场景中存在类似对象时可能会失败。gamma;₁

本文提出了一种基于结构局部稀疏模型和自适应模板更新策略的有效跟踪算法。该方法对目标区域内重叠的局部图像进行采样。我们观察到具有空间布局的局部图像块的稀疏编码同时包含目标对象的空间和部分信息。在一个候选区域内，通过所提出的局部补丁的对齐池方法，得到了相似性度量。这有助于更准确地定位目标并处理部分遮挡。此外，局部稀疏编码词典是由动态模板生成的，动态模板在增量子空间学习和稀疏表示的基础上进行在线更新。更新方案使跟踪器能够考虑目标的外观变化。由于外观模型和模板更新策略的简单性，我们的方法能够有效地跟踪目标。

这项工作的贡献总结如下。首先，利用对象中具有空间布局的局部图像块的稀疏编码对其外观模型进行建模。对于稀疏码，我们提出了一种对齐池方法，以提高跟踪精度，减少遮挡的影响。第二，分别采用增量子空间学习和稀疏表示的方法对模板进行更新，以解决漂移问题和局部遮挡问题。对具有挑战性的基准图像序列进行的实验表明，所提出的跟踪方法与几种最先进的方法相比具有良好的性能。

2. 相关工作和背景

稀疏表示已成功地应用于许多视觉应用[21、16、12、17、11]。在稀疏约束下，一个信号只能用几个基向量的线性组合来表示。在[16，17]中，目标候选对象稀疏地表示为字典中原子的线性组合，该字典由动态目标模板和普通模板组成。通过引入普通模板，跟踪器可以处理部分遮挡。然后通过非负性约束的最小化来解决稀疏表示问题。在[12]中，在稀疏表示中引入了包括空间邻接和时间邻接的动态群稀疏性，以增强跟踪器的鲁棒性。在[11]中，采用局部稀疏表示方法对目标的外观进行建模，然后用稀疏编码直方图表示目标的基分布。由于局部补丁的表示，它们的方法在处理局部遮挡时表现得很好。然而，仅局部稀疏系数的直方图不能提供足够的空间信息。为了更好地跟踪目标，采用了均值漂移算法[5]和基于稀疏表示的投票图。gamma;₁

我们的工作在使用局部稀疏表示方面与[11]有些相似。然而，我们选取了具有固定空间布局的较大重叠局部图像块，其中空间结构信息较多。此外，我们还充分利用了稀疏编码系数，利用所提出的对齐池方法，而不是利用直方图和核密度来测量相似性。我们不使用固定模板[1]或从第一帧学习的字典[11]，而是使用动态模板自适应地更新字典。在动态场景中，静态模板的对象跟踪可能会由于外观变化而失败。在[16，17]中，模板根据分配给每个模板的权重以及模板之间的相似性和目标候选对象的当前估计进行更新。与模板更新方案不同的是，我们采用了增量子空间学习和稀疏表示的方法来自适应更新模板。这种模板更新方法减少了漂移问题，并在目标的重要部位增加了权重。此外，它还减少了部分遮挡对模板的影响。

3. 结构局部稀疏外观模型

给定目标模板的图像集=[T1，T2，hellip;，TN]，我们用一个空间布局在目标区域内采样一组重叠的局部图像补丁。这些局部补丁被用作字典来编码可能候选区域内的局部补丁，即T

D·D，其中是图像补丁向量的维数，是目标模板的数目，是在目标区域内采样的局部补丁的数目。中的每一列都是通过对从中提取的矢量化局部图像块进行归一化得到的。每个局部补丁代表目标对象的一个固定部分，因此局部补丁完全可以代表目标的完整结构。由于本地补丁是从许多模板中收集的，因此本词典捕获了不同模板的共性，并能够表示这些部分的各种形式。对于目标候选，我们提取其中的局部补丁，并以同样的方式将其转化为向量，用=[y1，y2，hellip;，yn]isin;r表示。Dnngamma;₂^D^times;N

图1。通过对齐池（颜色较深的元素具有较大的值）显示特征形成。

在稀疏假设下，目标区域内的局部斑块可以表示为线性组合。-

图2。比较通过对齐池获得的好候选和坏候选的合并特征。上排和下排显示了一个好候选人（即接近地面实况跟踪结果的地区）和一个坏候选人（即具有

跟踪误差大）。

通过求解，只计算字典的几个基本元素

（1）

S.T. lt; 0乙_我

其中表示第-次矢量化局部图像补丁，isin;ris表示该局部补丁对应的稀疏码，lt;0表示的所有元素都是非负的。注=[b1，b2，hellip;，bn]表示一个候选对象的稀疏代码。根据向量的每个元素对应的模板，将每个局部面片的稀疏系数分为若干段，即：YBBBB_我我_我^{（ntimes;n）times;1}_我我

北京广播电视台 , 在哪里？（IK）gamma;Rntimes;1表示K-系数向量的th段_我. 这些分段系数被加权得到_我对于我第-补丁

V（2）

K= 1

其中，向量对应于第-个局部补丁，是一个规范化术语。由于模板包含具有某些外观变化的目标对象，因此经常出现在这些模板中的块（如其稀疏代码所示）应比其他块加权更多，以获得更健壮的表示。这个加权过程是由等式2及其稀疏代码来实现的。一个候选区域中的局部补丁的所有向量形成一个正方形矩阵，并用一种新的池方法进一步处理。变频调速_我我C_我

尽管对于单个局部补丁，我们只考虑其自身的系数向量（如上所述），从而丢失空间信息，但我们使用一种新的方法将局部补丁的响应集中在候选区域内，从而缓解了这一问题。为了提高位置估计的准确性，我们提出了一种对齐池算法而不是最大池方法[22]。获得后，在候选对象的某个位置上的每个局部补丁由模板的不同位置上的补丁表示。补丁的局部外观变化最好由模板相同位置的块来描述（即使用具有对齐位置的稀疏代码）。例如，图1中目标对象的左上角补丁最好由的第一个元素描述，因为它应该具有最大的系数值（通过公式2及其块位置）。因此，我们将正方形矩阵的对角线元素作为集合特征，即：变频调速_我₁

f=迪亚格（v）（3）

集合特征向量在哪里？由于加权运算提高了稀疏编码的稳定性，该池方法根据结构块的位置进一步将目标候选对象和模板之间的局部模式对齐。在算法中，对齐的跟踪结果也有助于模板更新的增量子空间学习。使用对齐池过程的建议表示法以块的形式捕获目标对象的结构信息。此外，该外观模型能够处理局部遮挡。发生遮挡时，外观更改会使被遮挡的局部面片的表示密集。但是，未被遮挡的局部面片仍然有稀疏的表示。f

图3。比较三种池方法在目标对象周围一定范围内获得的置信度图。红色块表示较大的系数（置信度）值，蓝色块表示较低的值。使用我们的表示得到的置信度图表明，中心附近的补丁可能属于目标，而不是其他补丁。

在跨这些局部补丁汇集之后，异常值的影响会减小，并且在表示中保留结构信息，以便更好地定位目标。图2显示了通过我们的方法获得的好目标和坏目标候选的向量和集合特征。当目标对象为部分遮挡时，未被遮挡的图像斑块仍然只能由字典中少数具有大系数的原子表示，而被遮挡的斑块具有密集的表示（如图2顶行所示）。然而，对于一个不好的候选，局部图像补丁有更密集的系数，并且集合的特征更小（如图2的下一行所示）。为了证明该算法的优越性，我们比较了三种方法在目标周围一定范围内获得的置信度图。基于如图3所示的这些观察结果，可以通过使用对齐池的提议局部稀疏表示实现目标对象的精确定位。V_我

4. 模板更新

固定模板跟踪在动态场景中很容易失败，因为它不考虑由于照明和姿态变化等因素而导致的不可避免的外观变化。然而，如果我们用新的观测频繁地更新模板，误差可能会累积，跟踪器会偏离目标。已经提出了许多更新模板的方法[15、18、16]。罗斯等人。[18]扩展了序贯Karhunen-Loeve算法，并提出了一种新的增量主成分分析（PCA）算法，以在新的观测数据到达时更新特征值和平均值。然而，基于PCA的图像表示对部分遮挡很敏感，因为假设重建误差是高斯分布的，且方差很小。Mei和Ling[16，17]将稀疏表示应用于视觉跟踪，并使用目标模板和普通模板来处理异常值和部分遮挡。然而，这种方法没有任何机制来处理漂移问题。本文将子空间学习引入稀疏表示，使模板适应目标的外观变化，同时减少了目标模板的遮挡影响。

在许多跟踪方法中，早期的跟踪结果更准确，因此它们应该比模板堆栈中新获取的结果存储更长的时间。平衡新旧模板的一种方法是为模板分配不同的更新概率。我们生成一个累积概率序列

, （4）

并根据单位区间上的均匀分布生成一个随机数[0,1]。通过确定随机数所在的区域，我们可以选择要替换的模板。这导致旧模板更新缓慢，新模板更新迅速，从而缓解了漂移问题。R

利用稀疏表示和子空间学习的优点对更新后的模板进行建模。我们收集目标对象的跟踪结果，然后执行[18]中提出的增量学习方法。这种增量方法不仅能适应外观的变化，而且能保留采集到的观测结果的共同视觉信息。估计的目标可以通过PCA基向量和[16]中使用的附加小模板的线性组合进行建模。

Puuml;i= UQ, （5）

其中表示观测向量，是由本征向量组成的矩阵，是本征向量的系数，表示被破坏或遮挡的像素。由于遮挡和噪声引起的误差是任意的、稀疏的，我们将其作为正则化最小二乘问题来解决。puuml;q e pgamma;₁

C, （6）lt;/

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可： Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版

注册

找回密码

基于自适应结构局部稀疏外观模型的视觉跟踪外文翻译资料

摘要

1. 介绍

2. 相关工作和背景

3. 结构局部稀疏外观模型

4. 模板更新

您可能感兴趣的文章

登录

注册

找回密码

摘要

1. 介绍

2. 相关工作和背景

3. 结构局部稀疏外观模型

4. 模板更新

您可能感兴趣的文章