基于增强时空置信的高斯混合模型的图像背景重建外文翻译资料

 2022-08-11 11:08

英语原文共 8 页,剩余内容已隐藏,支付完成后下载完整资料


基于增强时空置信的高斯混合模型的图像背景重建

摘要:

在图像处理中,从一个图像序列中进行背景重建是一个重要的课题。然而,大部分现行的重建算法在应用于处理复杂图像时,并不能得到预期的良好效果。高斯混合模型通常用于表示图像的特征和重建复杂图像的背景。于是我们提出了一种基于高斯混合模型的背景重建算法,它通过评估时间置信度和空间置信度值来获得多个最可靠的模型,从而来判断一个图像的像素是属于前景图像还是背景图像。在这个过程中,使用了一个Sarsa(lambda;)来实现在处理过程中与图像进行交互的自适应,从而获得最大增强的时空置信度。为了获得更好的重建结果,在进行背景处理前采取了一系列的预处理方法来去除噪声(如阴影、日光变化和突然的噪声)的负面影响,比如阴影的检测和去除,减轻日照的变化和发现并消除突然出现的噪声。测试结果表明,我们提出背景重建效果很好

关键词:图像处理,背景重建,高斯混合模型,强化学习,Sarsa(lambda;)

发表日期:2015年1月22日;

接受日期:2015年5月9日

介绍:

在计算机视觉领域,运动目标的检测和分割是一个非常重要的问题,它广泛应用于视频监控,流量监控和图像压缩等许多方面。通常有三种方法来进行运动检测,它们分别是光流法,相邻帧差法和背景减法。

光流法能够在不需要了解背景区域的情况下就能够跟踪和检测目标;然而,光流法对噪声比较敏感,而且计算量很大需要有强大的硬件设备作为支撑。相邻帧差法是一种减去背景来检测的方法,但它利用的是前一帧的背景而不是通过某种算法建立的背景模型,相邻帧差法非常高效而且能适应动态环境的变化,因而实现实时的运动检测。然而,相邻帧差法得到的运动目标的细节是不完整的。背景减法通过减去当前帧的背景参考帧,然后对得到的图像使用阈值进行二值化来得到目标。背景减法是最常用的方法之一,它能够简单有效地检测物体而且没有相邻帧差分法的缺点。背景减法的最简单实现方法之一就是先选择一个没有任何移动目标的背景图像,然后用当前帧减去预定义的背景图片。但是,由于背景环境通常会发生变化,例如一天中不同时间的日照,不同季节的变化以及摄像机位置的改变,因而背景图像应该能够进行自适应更新。为了解决这一问题,有一种经典的方法是使用所获得的背景图像的近似值,在一段时间内对图像序列进行平均来得到在这段时间上平均的背景图片。但是该方法错误地吧背景图像和运动目标混合在了一起,从而导致了一种混合现象。

在现实世界中,图像序列通常会受到阴影,日光变化和突然产生的噪音的影响。有一种在色调部分数值和饱和部分数值都比预定义的阈值小的情况下,通过比对在HSV空间中的阴影像素与背景像素的阴影部分,来检测和去除阴影的算法被提了出来。他可以被视作一个阴影点。阳光的变化对于背景重建的影响是非常大的。

在本次工作中,我们提出了一种中值滤波算法,它具有能够改变的自适应过滤窗口并且根据实际情况的中值滤波窗口比例,来适应阳光变化的情况,从而降低阳光对结果的影响。突发性噪声,尽管持续时间很短,但是它的出现不可预测而且难以消除影响。它会严重干扰到背景重建的检测。在噪声通常仅在相邻图像帧中持续存在的情况下,我们提出了一种自适应突发噪声消除算法来消除突发性噪声。我们采用了一系列的减法来有效的消除突发性噪声。特别是我们提出了一个基于背景重建的时空置信度评估的混合高斯模型。该算法对于图像中的像素建立了多个高斯分布模型,并计算每个高斯分布对应的置信度。模型中的每个分布都对应一个置信度等级,并按照置信度的降序排列。从而,我们可以得到可靠的分布模型。我们通过该模型来判断一个像素是前景像素还是背景像素。强化学习能够通过与环境的交互来优化策略。作为一种强化学习算法,Sarsa(lambda;)可以通过交互获来得最低的环境成本的经验。因此,我们使用基于Sarsa(lambda;)的算法来实现与图像交互的自动适应,它在处理过程中获得最大增强的时空置信度,以便算法可以在交互过程中进行自动适应。测试结果表明,我们提出的算法能很好地运用于背景重建。

相关工作

近年来,人们在研究背景减法如何实现自适应更新上付出了很多努力。这些努力可以被分为两类:通过背景模型和自适应参数来构成背景图像,和根据特定的假设从先前的图像中选取像素来构成背景图像。Ridder等人将Kalman滤波器用于背景图像,即使光照发生变化以便系统也可以正常工作。弗里德曼和罗素将像素的灰度值作为三个高斯分布的值加权,这三个值分别对应于背景、前景和阴影,并且使用EM算法实现了模型参数。由于背景通常很复杂,使用高斯分布来表示像素是不够的。Staufer和Grimson则提出利高斯混合模型来代表背景的像素分布。 但是KaewTraKulPong和Bowden发现它需要大量的计算时间,无法检测到运动物体的阴影,于是提出了一种改进的自适应混合模型来减少计算量,进而实现阴影检测。

Elgammal认为只使用极少数的高斯混合模型来代表分布背景仍然是不太准确的;但是增加高斯分布的数量将会降低运动检测灵敏度的,并且会增加计算量。于是他们提出了一种非参数核密度估计算法,以提高运动检测的灵敏度。但是这种方法仍然需要大量的计算。

Magee指出,一些先前的工作仅建立了多个高斯混合模型,而不是前景模型。于是他们做出了许多前景模型,以此来实现更有效的运动检测。Xia等人使用了基于每个像素的高斯分布模型。Toyama等人则从图像的像素级别、区域级别、框架级别以及帧数级别的特征来重建背景图像,并利用自适应Wiener波来完成后台更新。但是,这种方法仍然存在一些缺点。首先,这种方法需要初始化一种模型,这种模型通常被假设为在开始阶段时,前景的移动对象不属于背景图像,这一模型在实践中很难被实现。其次,建立的模型有时很难描述出准确背景图像,运动对象有时会被划分进背景部分。Gloyer等人提出了一种中值方法,该方法将图像序列的像素灰度值的中值作为背景像素灰度值。但是,如果对背景像素的实际灰度值低于这一半时间的观察值,改方法往往会产生错误的结果。

基于高斯混合模型的背景重建

高斯模型需要高斯概率密度函数,正态分布曲线,才能精确量化通过高斯概率密度函数被转化为模型的物体。图像的直方图能反映图像灰度值的出现频率。它可以作为灰度值概率的密度估计。如果目标区域大于背景图像区域并且背景区域的灰度值与目标区域的不同,则图像直方图会以双峰谷的形式出现,一个峰对应于目标对象,而另一个峰则对应于背景的中心灰色区域。复杂图像通常拥有多个峰。直方图的多峰特征可以看成是多个高斯分布的叠加。假设背景是静止不动的,则前景是指任何进行有意义移动的物体。重建建模的基本思想是从当前帧中提取前景,从而使得到的背景模型更接近当前背景,这意味着使用当前帧和当前背景帧序列来更新背景的加权平均值。同时,它也无法处理突然产生的光照变化和外部环境的变化。高斯混合模型是最有效的背景重建方法之一。高斯混合模型使用K高斯模型代表图像中每个像素的特征,然后使用新的帧数的图像来更新模型。

在背景重建过程中,与高斯混合模型匹配的像素被视为背景像素,如果这个像素不与混合高斯模型匹配则被视为前景像素。使用高斯混合模型来重建背景的过程显示在 算法1 中。

强化学习

强化学习为直接从实现目标过程中的交互学习提供了一个框架。在强化学习框架中,有五个基本要素:代理人,环境,状态,奖励与行动。代理人是指具有认知能力,解决问题的能力以及沟通能力的一个实体。通过代理人可以建立一个拟人的控制模型。因此,我们可以控制该系统的行为并且统一其他的控制单位元,并提供统一的方法描述。因而,我们可以说代理人是事实上的与环境互动的学习者和策略制定者。代理做出选择的决定;环境对动作产生反应,对代理人生成一个新的场景,然后反馈奖励。强化学习框架如图表1所示。

图表 1 代理在强化学习框架中选择一个动作;环境会生成新的场景,作为代理对环境采取的行动回应的奖励。agent:代理人 ;reward:奖励 ;state:状态;environment:环境;action:行动;

代理在每个位置都与环境交互并在离散时间序列中步进。在每个时间步骤t,代理人都会获取环境状态,其中S是所有可能状态的集合;代理人在某些策略下选择一个行动,其中是所有可能的行动集合。通过采取行动,代理人得到一个激励并且进入一个新的状态,代理人的最终目的是最大化在长时间内的奖励总和。从状态到动作选择的映射是代理策略。

作为一个重要的算法,时间差异(temporal difference,简称TD)学习能够在不了解外界环境的情况下直接从原始经验学习。除此之外,这个能够通过时间差异学习的模型会根据部分学习结果,而不是最终的学习结果来进行更新。时间差异的这两个特征使它特别高效而且适合增量学习。通过策略pi;给定一些经验,时间差异学习算法更新估算的中的,作为:

其中 是在时间步骤t之后的实际返回值。并且 是一个步长参数。时间差异学习通过观察激励和估算来更新时间步骤中的。在S中根据策略,令

为采取策略a的价值。可以被定义为

Sarsa(State action return State action)是一种在线TD算法,而Sarsa(lambda;)是Sarsa中的一种使用资格迹的算法。的更新方式如下:

其中 且

图像预处理

阴影消除

前景移动物体的阴影会导致对运动物体的错误检测,从而造成重建错误的背景。因而,找出并且去除移动目标的阴影是十分有必要的。由于阴影通常是黑色的,因此我们可以通过比较候选阴影像素的值与背景像素的像素来确定阴影部分。在HSV空间中,如果色相部分的值和饱和部分的值都为小于预定义的阈值,可以将其认为是一个阴影点。决策过程在算法2中表示。在算法2中,阴影区域中的值参数V通常小于背景区域中的值,其中参数beta;是测量亮度的强度,而且光的亮度与beta;的值成反比。

减轻光照变化的影响

无法避免的日照变化会对背景产生负面影响。很明显,完全黑暗的情况与有光照的情况有很大的不同。该算法的基本思想是使用中值滤波。 但是中值过滤窗口必须被预定义,因而无法更改窗口比例。

我们在此提出一种能够适应日光变化来减轻光照对结果影响的自适应算法。

为了解决这个问题,我们在此提出一种自适应中值滤波方法,它的基本思想是根据实际情况自动改变中值滤波窗口的比例。主要处理步骤如算法3所示。

消除突发性噪声

突然产生的噪音,比如飞鸟和落叶产生的噪声,虽然通常发生和存在的时间很短,但仍然会对背景重建造成严重的干扰。然而,移除突发性噪声总是很困难的。为了消除突发性噪声,我们提出了一种基于前提条件的自适应突发性噪声消除算法,突然的噪音通常只持续很短的时间因而它被认定为背景是非常不合理的。首先,我们得到当前图像的前一个图像帧和背景图像帧。然后我们得到当前图像之间关于当前背景信息和噪声信息的差异。由于两帧图像之间的间隔很短,突发性噪声会同时出现在这两帧图像中。因而我们可以通过减法来去除突发性噪声。在完成了减法之后,我们能得到前景对象和背景图像的相应像素。处理步骤在算法4中显示。

增强时空置信度

在图像序列中,处于稳态的像素值最有可能是背景像素,但是如果前景对象移动非常缓慢或暂时保持静止,则处于稳态的像素值通常会是前景像素。

在本次工作中,重建算法主要通过使用几种进行后台更新的算法,来恢复过去观察到的背景图像。在第一种情况下,背景会定期更新,即在明确的时间段里利用算法3来提取多个图像序列,这适用于在背景变化缓慢的情况下进行背景重建。在第二种情况下,使用突变策略来进行背景更新。如果在当前图像中与参考图像中不同的像素的数量超过了阈值,则采用算法4来进行背景重建。对于大多数的其他情况,我们应该使用另一种方法去得到背景。一些研究工作表明,各种信息的整合更有利于达到一个合理的重构效果,即有必要考虑优化在时间特征和空间特征上的像素分类。Milan Sonka已经在理论上证明了这点,而且他们实验的结果也表明,与仅使用单个方法相比,综合的集成信息可以获得一个更加合理的结果。

在这项工作中,我们整合了图像的时空信息,并与相关的置信度值结合,提出了一种新的背景重建算法

该算法为图像中的每个像素建立了多个高斯分布模型,并且计算了每个高斯分布模型对应的置信度。模型中的每个分布的都按置信度的降序排列。因此我们可以得到置信度最高的p分布模型和置信度最低的q分布模型。在这一处理过程中,虽然可靠的分布模型被放在了不可靠的分布模型前面,但是不可靠的分布模型仍然可以通过累加匹配分布模型的像素来进行重新排列,然后就能得到一个可靠的分布模型。然而在另一方面,这种方法也能让可靠的分布模型变成不可靠的分布模型。当我们处理一些新的图像时,该算法会按顺序检查与当前像素值相匹配的每一个高斯分布,从而决定改像素是属于前景像素,背景像素还是一个不可靠的像素。在此之后,基于混合高斯模型,我们会去选择是创建一个新的分布还是更新当前的分布。与此同时,当前图像中被确定为背景值的像素将被用于生成背景图像。为了增加模型的适应性,这个算法也会删除过时的可靠模型和即时的模型。我们也要利用强化学习的优点,从而使得该算法能在交互过程中进行自动适应、

在强化学习里,行动定义了代理人的学习行为。在这个算法中,行动的定义放在了表1中。

在我们的工作中,代理人会根据不同的条件做出决定,

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[237472],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。