英语原文共 8 页，剩余内容已隐藏，支付完成后下载完整资料

通过图割的快速近似能量最小化

摘要

在本文中，我们解决早期视觉中出现的的一大类能量函数的最小化问题。主要的限制是，能量函数的平滑项只涉及像素对。我们提出了两种算法，使用图割来计算局部极小值时即使非常大的动作是允许的。第一次移动，我们考虑的是一种alpha;-beta;交换：对于一对alpha;、beta;标签，这次移动交换了任意一套标记为alpha;的像素和另外任意一套标记为beta;的像素之间的标签。我们第一算法产生一个标记，以便不会进行减少能量的交换移动。第二次移动我们考虑一种alpha;-扩展：对于标签alpha;，此举将指定任意一套像素标签alpha;。我们的第二算法，要求光滑项为一个度量，产生一个标记以便不会发生减少能量的扩展移动。此外，这种方法包括一个全局极小值的已知因素。我们用实验证明我们的方法在图像复原、立体声及运动方面的有效性。

1 早期视觉的能量最小化

许多早期的视觉问题需要从噪声测量中估计一下空间变化量（如强度或差距）。这样的量往往是分段光滑的，它们大多数情况下平滑变化，但在对象边界发生显著变化。每一个像素pP在一些集合L中必须被指定一个标签，对于运动或立体声，标签是不等的，而对图像恢复它们代表强度。目标是要找到一个标记来指定每个像素个标签，其中是分段光滑的，这与所观察的数据相一致。根据能量最小化，这些视觉问题可以很自然地得到确切的阐述。在这个框架中，一个寻求能量最小化的标记

这里表示不分段光滑的程度，而表示和观察到的数据之间的不符合程度。文献中已经提出了许多不同的能量函数。的形式通常是

，

这里表示如何对所指定的观察到的数据中的像素设定一个标签。例如在图像复原中，通常是，其中是所观察到的像素的强度。的选择是一个关键问题，并提出了许多不同的函数。例如，在基于视觉的，使到处都很光滑。这会导致在对象边界处几乎没有结果。没有这个问题的能量函数被称为“不连续性保护”。

已经提出了大量的不连续性保护的能量函数（见例如）。杰曼和杰曼的开创性论文为许多能量函数给出了贝叶斯解释，并提出了基于不连续性的能量函数的马尔可夫随机场（的）。

早期视觉能量最小化的主要困难在于巨大的计算成本。通常这些能量函数有许多局部极小（即它们是非凸的）。更糟糕的是，可能的标记的空间维数，这是成千上万的。有无数次尝试设计能量最小化的快速算法。模拟退火算法通过在计算机视觉中得到了广泛的推广，得到了广泛的应用，因为它可以优化任意的能量函数。不幸的是，最大限度地减少一个任意的能量函数需要指数时间，作为结果，模拟退火是非常缓慢的。在实践中，退火是低效的，部分原因是在每一个步骤，它改变了一个单一的像素值。

在本文中我们考虑，在各种不同的语境中产生的能量函数，包括马尔可夫的贝叶斯标记。

我们允许是任意的，并考虑平滑的形式

(1)

其中N是相邻像素对的集合形式。在特殊情况下，这样的能量可以完全地被最小化。如果可能的标签的数量是=2，那么精确解可以通过计算某一图的最小成本在多项式时间内发现。如果是一个有限的一维集且相互作用势是，那么通过图割也可以有效地发现精确的最小化。一般来说，然而，问题是NP-难。

在本文中，在两类相对公平的相互作用势：半度量和度量下，我们开发的算法大概能最大限度地减少任意一组有限的标签的能量。如果对于任意一对标签alpha;，beta;，它满足2个属性：和。被称为标签空间上的半度量。如果也满足三角不等式

(2)

对于任意属于的，，，那么被称为度量。请注意半度量和度量都包括不连续性保持相互作用势的重要情况。例如，截断的L2距离和Potts互动罚都是度量。

本文中所描述的算法概括了我们最初开发的情况下的Potts模型的方法[2]。特别是，我们计算了一个标签，这是一个地方的最小，即使非常大的动作是允许的。我们首先概述了我们的基于图割的能量最小化算法。我们在第3节中描述的第一个算法，是一种基于alpha;-beta;互换的移动，并为任何半度量工作的。我们在第4节描述的第二种算法，是基于更有趣的alpha;-扩展移动，但是仅仅适用于度量的（即额外的三角不等式是必须的）。注意：alpha;-扩展移动产生一个已知的E的最小的因素的解决方案。这一个证明可以在[8]中找到。

2通过图割的能量最小化

这些方法的最重要的属性是它们能产生局部极小，即使在允许大动作时。在这一节中，我们讨论我们允许的移动，这是就分割而言的最好描述。我们简述算法和列出它们的基本属性。然后，我们正式的介绍图割的概念，这是我们的方法的基础。

1.以任意一个标记开始

2.设置成功率：=0

3.对于每一对标签

3.1在中的一个alpha;-beta;交换得到的中找个（第3节）

3.2如果，设和成功率：=1

如果成功率=1则转去2
返回

1.以任意一个标记开始

2.设置成功率：=0

3.对于每一个标签

3.1在中的一个alpha;-扩展得到的中找个（第4节）

3.2如果，设和成功率：=1

如果成功率=1则转去2
返回

图1：我们的交换移动算法（顶部）和扩展移动算法（底部）

2.1分区和移动空间

任意标记可以唯一地表示图像像素的一个分区，其中是一个子集的像素分配标签。因为在标记和分区有一个明显的对应关系，我们可以互换地使用这些概念。

给定一对标签alpha;，beta;，如果对于任何标签有，从一个分区（标记）到一个新的分区（标记）的一个移动被称为一个alpha;-beta;交换。这意味着，和之间唯一的区别是一些像素以前在中标记为alpha;，现在在中标记为beta;和一些像素以前在中标记为beta;，现在在中标记为alpha;。

给定一个标签alpha;，如果对于任何标签有和，从一个分区（标记）到一个新的分区（标记）的一个移动被称为一个alpha;-扩展。换言之，一个alpha;-扩展移动允许任何一组图像像素把它们的标签改为alpha;。

注意到一个给一个单一像素的任意标签的移动是一个alpha;-beta;交换和alpha;-扩展。作为结果，标准的移动空间用于退火是我们的移动空间的一种特殊情况。

2.2 算法和性质

我们已经开发了两个能量最小化算法，这是图1显示的。算法的结构是非常相似的。我们将称步骤3.1-3.2一个单一的执行为一个迭代，步骤2-4的执行为一个周期。在每个周期中，算法对进行迭代的每一个标签（扩展移动算法）或每队标签（交换移动算法），在一定的顺序可以是固定的或随机的。如果在任何迭代中发现一个严格更好的标签，那么这个周期是成功的。该算法在第一次不成功的循环后停止，因为没有进一步的改进是可能的。显然，在交换移动算法进行周期为的迭代，在扩展移动算法进行周期为的迭代。

这些算法有几点重要性质。首先，该算法是保证在一个有限数量的周期终止；事实上，在相当一般的假设下，我们可以证明终止在周期[8]。然而，在我们报告的5节中的实验中，该算法在几个周期后停止，并在第一个周期中发生大部分改进。其次，一旦该算法已终止，所得到的标签的能量是一个本地最小值相对于一个交换或扩展移动。最后，我们在[8]中证明扩展移动算法产生的标记，这样，其中是完全最小值和。

2.3 图割

每个算法的关键部分是步骤3.1，其中图割是用来有效地找到。让是两个重要的顶点加权图称为终端。一个的分割是一组边缘，这样终端在诱导图中是被分离的。此外，没有适当的C的子集能在G(C)中分离终端。割C的费用表示|C|，等于它的边的权重的总和。

最小割问题是要去找到最小的费用。对于这个问题的低阶多项式复杂度有许多算法；实践这些方法在近似时间运行。

步骤3.1在一个图的容量是上用了一种单一的最小割。每一次迭代后，该图是动态更新的。这个最小割的细节有很大的不同，用于交换移动和扩展移动算法，如下两节所描述的。

3 寻找最优的交换移动

给定一个输入标记（分区P）和一对标签alpha;，beta;，我们希望找到一个标记，在的一个alpha;-beta;交换中的所有标记中最小化E。这在图1的顶部所给定的算法中是至关重要的步骤。我们的技术是基于计算一个标记对应一个图上的最小割。这个图的结构是由当前分区P和标签alpha;，beta;动态确定的。

本节组织如下。首先我们描述构建对于给定的（或P）。我们表明，在上的割C对应的自然方法是在的一个alpha;-beta;交换移动中标记。定理1表示了一个割的费用是加一个常数。这一推论定理证明了我们的主要结果是，所需的标记等于，其中C是的最小割集。

图2：图的一维图像的例子。图像中的像素集是，其中，

图的结构示于图2。易读性，此图显示一维图像的实例。对于任何图像的结构将如下。顶点集包括两个终端alpha;和beta;，以及在集合和的图像像素p（那是）。因此，顶点集包括alpha;，beta;和。每个的像素通过边缘和分别连接到终端alpha;和beta;。为简便起见，我们将参考这些边缘作为（终端连接）。对于每对相邻（即）像素的边缘，我们将其称为（相邻连接）。因此边缘集包括（）和（）。分配给边缘的权重是

任何上的割C必须完全地切断（包括）对于任何像素的一个：如果在C上没有，在终端之间有一条路径；而如果所有的被切断，然后C的一个真子集将是一个割。因此，任何割遗留的每个像素完全是一个。这定义了一个自然标记对应于上的一个割C。

(3)

换言之，如果像素p是在上，那么当割C从终端alpha;中分离p时，p分配了标签alpha;；类似的，当割C从终端beta;中分离p时，p分配了标签beta;。如果p不在上，那么我们保持其初始标签。这意味着

引理1 一个对应于上的一个割C的标记是远离初始标记的一个alpha;-beta;交换。

一个割C切断上相邻像素之间的一个当且仅当C遗留了连接到不同终端的像素p和q是很容易的。形式上

属性1 对于任何割C和任何：

这些属性的说明在图3。下一个引理是属性1和公式3的结果。

引理2 对于任何割C和任何

引理1和2加上属性1产生

定理1 在上的割集C和从中的一个alpha;-beta;交换的标记之间有着一对一对应。此外，上的一个割C的费用是加一个常数。

证明：第一部分是从一个事实，即被切断的唯一确定分配给像素的标签p和必须被切开。我们现在计算一个割C的费用，这是

（4）

图3：对于通过连接的两个像素的的一个割C的属性。虚线显示了通过C边缘的切割，实线显示了在诱导图中边缘的剩余

注意对于我们有

引理2在（4）中给出了第二个术语。因此，一个割C全部的费用是

这可以改写为，其中

对于所有的割C是相同的常数。

推论1 中最优的alpha;-beta;交换是，其中C是上的最小割。

4 寻找最优的扩展移动

给定一个输入标记（分区P）和一个标签alpha;，我们希望找到一个标记，在的一个alpha;-扩展中的所有标记中最小化E。这在图1的底部所给定的算法中是至关重要的步骤。在这一节中，我们描述了一种技术解决这一问题。假设每个是一个度量，从而满足三角不等式（2）。在介绍中给出了一些重要的度量的例子。我们的技术是基于计算一个标记对应一个图上的最小割。这个图的结构是由当前分区P和标签alpha;确定的。像以前一样，在每一次迭代后，图都动态变化。

图4：图的一维图像的例子。图像中的像素集是以及当前分区是，其中，，。在当前分区引入相邻像素之间的两个辅助节点，。在集合的边界处添加辅助节点

本节组织如下。首先我们描述构建对于给定的（或P）和alpha;。我们表明，在上的割C对应的自然方法是在的一个alpha;-扩展移动中标记。然后，根据一些简单的属性，我们定义了一类基本割。定理2表示了基本割是在的一个alpha;-扩展中标记之间的一对一对应，同时，一个基本割的费用是。这一推论定理证明了我们的主要结果是，所需的标记等于，其中C是的最小割集。

图的结构示于图4。易读性，此图显示一维图像的实例。顶点集包括两个终端alpha;和，以及所有的图像像素。此外，对于在当前分区（即）分割的每队相邻像素，我们创建了一个辅助顶点。当时，在分区集之间的边界介绍了辅助节点。因此，顶点集合是。每个的像素相应地通过和被连接到终端和。不是被分区P（即）分割的每对相邻像素连接了一个。对于每对相邻像素，如此，我们创建了一个三重的边缘，其中是相应的辅助节点。边缘和连接像素p和q到，及连接辅助节点到终端。所以我们能够写出所有边缘集合如下

分配给边缘的权重是

就像在第3节，任何上的割C必须完全地切断（包括）对于任何像素的一个。这定义了一个对应于上的割C的自然标记。形式上，

（5）

换言之，如果割C从终端alpha;中分离p时，那么像素p分配了标签alpha;；以及如果割C从终端中分离p时，p分配了原来的标签。注意到对于的终端代表的标签分配给其初始标签。显然我们有

引理3 一个对应于上的一个割C的标记是远离初始标记的一个alpha;-扩展。

一个割C切断上相邻像素之间的一个，以至于当且仅当C遗留了连接到不同终端的像素p和q是很容易的。换句话说，当我们用替代beta;时属性1保持。我们将把这个作为属性1（）。类似的，对于里的，我们可以证明，属性1和方程（5）建立引理2。

图5：对于两个像素以使得的上的最小割C的属性。虚线表示被C分割的边缘，而

剩余内容已隐藏，支付完成后下载完整资料

资料编号：[151642]，资料为PDF文档或Word文档，PDF文档可免费转换为Word

原文和译文剩余内容已隐藏，您需要先支付 30元 才能查看原文和译文全部内容！立即支付

发小红书推广免费获取该资料资格。点击链接进入获取推广文案即可： Ai一键组稿 | 降AI率 | 降重复率 | 论文一键排版

注册

找回密码

通过图割的快速近似能量最小化外文翻译资料

1 早期视觉的能量最小化

2通过图割的能量最小化

2.1分区和移动空间

2.2 算法和性质

2.3 图割

3 寻找最优的交换移动

4 寻找最优的扩展移动

您可能感兴趣的文章

登录

注册

找回密码

1 早期视觉的能量最小化

2通过图割的能量最小化

2.1分区和移动空间

2.2 算法和性质

2.3 图割

3 寻找最优的交换移动

4 寻找最优的扩展移动

您可能感兴趣的文章