基于背景差分建模法的运动目标检测外文翻译资料

 2022-04-05 09:04

英语原文共 12 页,剩余内容已隐藏,支付完成后下载完整资料


基于背景差分建模法的运动目标检测

Wei Liu, Hongfei Yu, Huai Yuan, Hong Zhao, Xiaowei Xu

东北大学研究院,沉阳110179,中华人民共和国

阿肯色大学小石城分校信息科学系,2801 S.,University Avenue,Little Rock 72204,

美国阿肯色州

电子邮件:lwei@neusoft.com

摘要

本研究提出了一种用于实时检测运动目标的分层背景差分建模法。在第一级,提出了一种基于像素的新型背景建模方法来粗略检测。该方法可以利用借贷策略为每个像素动态分配最佳数量的组件。并且灵活的学习率为了适应场景变化,呈现每个分量。另外,一个新的引入框架无限状态机的机制来维护和更新背景模型。在第二级,为了处理突然的照明变化,采用基于块的前景验证方法精确检测。作者将所提出的方法与最先进的方法和实验结果进行比较各种场景展示了所提出方法的稳健性和有效性。

1简介

背景建模和运动目标检测的减法是自动视频分析的关键技术之一,特别是在视频监控领域。背景减法的思想是从参考背景模型中减去或差分当前图像。在过去的二十年中,取得了很大的进展。但是,仍然存在一些具有挑战性的问题,例如动态背景,渐变或突然照明变化。为了解决这些问题,已经提出了大量的背景减法方法,并且可以在中找到最近的调查。

高斯混合(MOG)和码书是最流行的像素方式。 这些方法可以处理渐变照明效果以及移动背景元素。 然而,在许多先前的工作中,高斯分量的数量是不变的,例如当最近观察到的像素值频繁变化时,恒定数量的高斯分量并不总是足以估计动态背景。Bouwmans等人确定了该方法的局限性,并指出,由于多模态在空间和时间上是可变的,因此在检测精度和计算时间方面对每个像素使用相同和固定数量的组件是不理想的。为了解决这个问题,Carminati和Benois-Pineau使用迭代自组织数据分析技术算法(ISODATA)算法为训练集中的每个像素估计最优数量的高斯分量,而不是固定混合模型中的分量数量。 但是,这种方法的适应性较差,因为一旦训练过程完成,组件的数量就会保持不变。许多研究人员还提出了各种改进的MOG方法,这些方法可以为每个像素自动选择适当数量的组件。 但是,考虑到可用存储器和计算能力,每个像素的可用组件数量存在固定的上限,并且对于所有像素都是相同的。Codebook中也存在类似的问题。 Camplani和Salgado提出了一种用于动态修改MOG参数的多级适应策略。该策略是有效的,但太复杂。内核密度方法也可以应用于像素方式。Elgammal等人通过非参数核密度估计器对每个像素值进行建模,该参数比使用多个高斯更灵活,更鲁棒。主要缺点是对高存储容量和计算能力的要求。

由于像素级方法有一些缺点,例如照度变化,噪声,相机运动,动态背景元素的影响。为了减轻这些,提出了一些基于块或者集群的方法。Fang等人应用了一种基于块的MOG模型。与像素方式的MOG模型相比,该方法对噪声不太敏感,但是耗时。 提出了MOG模型的推广以处理动态背景,其将背景似然估计中的空间邻域的使用与半参数MOG表示的紧凑性相结合。尽管如此,它不适合实时视频分析,因为该方法中使用的马尔可夫随机场(MRF)模型不幸在计算上要求很高。Pokrajac和Latecki分解视频时空块。将纹理与运动矢量组合的紧凑块矢量被用于背景减法。 该方法对相机运动是鲁棒的,而检测不太精确,因为只有块被检测到赵等人利用时空补丁来表征外观和运动信息。这种方法对剧烈的光照变化不敏感,但计算成本高。 Zhong等人用一组加权自适应局部直方图构造了每个像素的背景模型,从而可以获得更加可靠和鲁棒的背景减法结果。该方法也存在其耗时的缺陷。 Poppe等人提出了一种时空多模式方法。通过引入基于边缘的图像分割,改进了MOG方法的前景检测结果。

本文主要关注两个具体问题,一个是如何构建一个简单有效的背景模型,它可以适用于动态背景和逐渐变化的照明。另一个是如何处理突然的照明变化。 为了解决这些问题,我们提出了一种分层的方法:在一个像素层面上,应用了一种新颖的基于像素的背景建模方法。建模方法可以动态地为每个像素分配最佳数量的组件,并且灵活的学习速率对于每个像素都是可变的和不同的,因此可以处理动态场景(例如,树木,水波纹,渐变照明变化)。在更高层次上,引入了基于块的前景验证(FV)方法,该方法可以克服由突然照明变化和相机抖动引起的误报,同时以像素精度获得前景检测结果。

论文结构如下。 在下一节中,我们从三个方面说明问题:组件的最佳数量,学习率以及现有多模式方法中模型更新和维护的机制。本节还简要介绍有限状态机的框架。在第3节中,我们描述了我们的技术和细节我们的主要创新:背景建模,背景初始化和更新机制。在第4部分中,我们提出了一种基于块的FV方法。 在第5节中,我们报告并分析了实验结果。 最后,第6节给出了一个结论。

2问题陈述

在现有的多模建模方法中(如MOG和码本),每个像素都具有多重特征组件或代码字。每个组件(码字)对应于观察模型的每个像素传入图像与相关背景进行比较组件和其值不符合的像素背景组件被视为前景。对于MOG,高斯分量K的数量确定背景的多模式。更大K,处理背景的能力就越强变化。但是,较大的K也会导致较高的值计算成本。因此有一个

折衷能力的模型和计算成本。Stauffer和Grimson [6]建议将Kto设置为一个值在3和5之间。对于码本,码字的数对应于MOG中的组件数量。

虽然每个像素可以基于样本的变化有不同的码本大小,但考虑到的局限性硬件资源在实际应用中的长度码书必须是有界的[24]。像之前在第1节中提到,尽管许多论文提出自动选择适当数量的方法即每个像素的分量存在一个固定的上限为每个像素可用组件的数量,它是在限制内所有像素都相同的增量和减量必须执行每个像素的组件(代码字),这将限制能力描述动态场景。通常对于那些不同的像素组件的数量可能会达到最大和额外的组件将不能被添加。对于那些像素变化很少的,使用较少的组件就足够了,所以剩下的可用组件算作冗余而导致内存和计算浪费。因此,根据场景分配最佳数字每个像素的动态成分至关重要。而且,目前如何调整学习率方法也是其中之一在许多背景建模中讨论最多的话题。否低学习率不能适应突如其来的场景变化,学习速度很快会导致缓慢移动的前景像素会更新到背景模型中。虽然很多论文提出了调整学习的方法自适应速率[25,26],但至今仍是一个挑战。此外,在许多情况下,算法可能会运行在嵌入式硬件如数字信号处理器(DSP)等低内存的背景建模方法需要和快速的处理速度。即使是在个人计算机(PC)上运行的算法,服务器,多声道视频序列也需要同时处理。因此,设计一个简单的背景建模方法尤为重要。为了解决上述问题,本文提出了一种新颖的方法背景建模方法。与现有相比多模方法,这种方法的模型参数少得多,而培训和检测过程更简单,更有效。这个方法可以动态的为每个像素分配最佳数量的组件借贷策略。核心思想就是那些经常变化的像素可以借用其余的由此,这些像素的分量很少变化提高描述动态背景的能力。

图1有限状态机的框架

同时,我们也提出了一个不灵活学习的概念考虑到数据的局限性,可以根据样本变化情况调整学习速率的改变。通过结合学习率和建议更新以及维护机制,照明变化可以得到有效处理。 上述直觉是集成在图1中的有限状态机框架中。有限状态机包含四个状态(SA,SB,SC,SD)和五个转移过程(T1,T2,T3,T4,T5)。(SA,SB,SC,SD)代表初始状态,背景状态,候选背景一个组件的状态和终端状态临时状态。 初始化完成后,状态转移到SC(T1,T2,T3,T4,T5)表示在组件的两个状态之间传输进程。T1对应于初始化组件的过程。T2对应于生成背景的过程组件。 T3和T4对应的过程删除组件。 T5对应的过程维护和更新组件。在下一节中,我们阐明我们提出的关注这些状态的方法和过程。

3 建议的背景建模方法

该方法描述为灰度图像,但它也可以稍作修改即可用于彩色图像。每个像素,我们构建一个或多个组件。这些组件可以分为两种:候选背景组件和背景组件。

3.1初始化组件

让Pj表示在Im*n(图像大小是m*n,j=1,2,hellip;,m*n)位于J处的像素,Cj,t,表示像素灰度值,t表示时间,Li,t表示像素的组件,Lj表示组件输入的数字,表示第i个像素的分量,在T时。

在文本中,每个组件由三个参数组成,表示平均值,表示在像素pj和组件之间累积匹配和连续不匹配时间的总和,在代码书[5]中的最大运行时间很相似。关于参数的更多信息将会在第3.2章的(2)-(4)中说明。

在初始时刻t0,我们为每个设置一个初始组件像素pj及其参数被定义为:

lj,t0=1,,, (1)

3.2维护和更新组件

学习每个像素的组件参数根据现场变化不断更新。我们按升序对进行排序并检查每个像素Pj针对lj个组件。如果它满足以下条件(2),它表明Pj和是相符的,也就是说,;否则,不属于。

(2)

其中sigma;是第i个分量的方差。Greiffenhagen等[27]比较了不同的参数初始化真实的数据和模拟的数据,并发现计算结果的方差和重量是不稳定和不可靠的。受他们发现的启发,在这里我们使用固定值sigma;而不是方差计算。

组件匹配后,每个参数组件根据以下公式进行更新:

请注意,本文提出了一种不灵活学习的概念速率来适应单个组件的平均值。不像MOG方法和Codebook[5]使用固定的和相同的所有组件的学习率,建议灵活学习速率是可变的,并且对于每个组件都是不同的组件的收敛速度和适应性显着改善。正如我们在(5)中所见,灵活学习率alpha;是。有一个相反的关系灵活的学习速度和匹配次数之间。在模型初始化之后的短时间内,匹配次数少,学习率高。 灰色值的当前像素对平均值有很大影响的组件。 因此,背景可以迅速学习。随着匹配次数的增加,学习速度变小,所以对平均值的影响从当前像素的灰度值会减少并且可以获得稳定的组件,这将会准确地描述当前像素的灰度值。

现场突然发生变化时,现有的组件将不适应新的场景。因此,我们的方法将增加新的组件重新学习背景迅速。因此,我们提出了更新机制不仅能适应现场变化,而且与那些相比,也减少了误报使用固定学习率的方法。

请注意,为了防止这种情况下的学习率趋于接近零(匹配时间趋于接近无穷大),我们可以设置一个最大匹配时间,这意味着学习率有一个最低限度的下限。

3.3分配最佳数量的组件

动态分配最优数量的策略组件如下:

删除组件(相应的过程是T3和T4):用于背景成分或候选人后台组件,如果组件已过期(a匹配像素很久没有出现),我们删除组件以节省内存空间,以便它可以被需要更大数量的其他像素使用的组件,操作如下:

这是衡量组件是否具有的阈值过期与否。当两个组件的意思不同时,小于阈值,即分量对应于更少的匹配时间将被删除剩余组件的平均值被更新如下:

添加组件(相应的过程是T1):如果像素pj的灰度值不匹配现有的背景部分或候选人背景成分,但符合约束条件(8)和(9),那么所提出的方法增加了一个新的候选元素自动到像素pj,组件的参数可以根据初始化(10)和(11)。

借贷参数指出的上限每个像素允许的组件数量,mtimes;n表示输入图像的大小,K代表平均值每个像素的可用组件数量(哪个对应于组件的最大数量MOG方法中的每个像素),Kle;r。对于K = r,这意味着我们的方法与现有的多模相似方法[10,11]就K和K的选择而言这意味着如果可用组件的数量对于频繁变化的像素达到平均数K,它可以借用几乎不变的像素分量。

如果像素pj不符合(8)的约束条件和(9),其中匹配次数最少的组件对应于(12),将被替换为新的候选人组件,新组件将根据初始化到上述(11)。

3.4生成背景组件

到目前为止,许多生成背景组件的方法已经提出。例如,在MOG中方法,组件按降序排列权重和第一个N 分量,其中的总和权重大于预定义的阈值,被视为作为背景组件。 在Codebook中,训练阶段和输入阶段采用不同的策略生成背景码字:使用最大负运行长度lambda;和停留时间来生成背景代码。

通常,在给定的时间段内,会出现背景与之相比,更频繁和更稳定前景物体和噪音。因此匹配代表背景像素的组件的时间将会比那些组件的那些更大前景或噪音。基于这个事实,我们提出了一个更简单的方法来生成背景组件:

对于候选后台组件,如果其匹配时间比阈值大,那么它将被转化为背景组件。 和门槛决定背景组件的数量。如果阈值太大,多模式模型将转化为一个单峰模型。

如果一个像素没有背景成分(这个现象可能在学习阶段和学习阶段都存在检测阶段),现有方法不判断像素是否是前景像素。 这样做的好处是误报不会发生。 但是,对于一些高度安全的特殊场合(银行,监狱等等),需要实时检测输出。这些场合更关心漏检率而不是虚警率。所以我们给一个生成临时背景的可选策略组件如下:

等式(14)表示如果像素不具有满足(13)的背景组件,该方法将会采取候选的背景组件,这是作为临时背景,与当前匹配组件来确定像素是否是前景像素或在下次没有

全文共20559字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[14551],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。