英语原文共 13 页,剩余内容已隐藏,支付完成后下载完整资料
外文翻译
鲁棒字典学习背景减法
Cong Zhao,1 Xiaogang Wang,1, 2 and Wai-Kuen Cham1
- Department of Electrical Engineering, The Chinese University of Hong Kong, Hong Kong
- Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen 518055, China
Correspondence should be addressed to Cong Zhao, czhao@ee.cuhk.edu.hk
我们提出了一种基于学习的背景减法的稀疏表示和字典学习理论的基础上。我们的方法使以下两个重要的假设:(1)场景的背景有一个稀疏的线性表示在一个学习字典;(2)的前景是“稀疏”,在这个意义上,大多数像素的帧属于背景。这两个假设使我们的方法来处理突然和渐进的背景变化优于现有的方法。正如讨论的文件,学习字典的方式是成功的背景建模在我们的方法的关键。要建立一个正确的背景模型训练样本时,是不是前景免费的,我们提出了一个新的强大的字典学习算法。它会自动修剪前景像素是在学习阶段异常。定性和定量比较与竞争的方法的实验表明,获得的鲁棒性对背景的变化和更好的性能在前景分割。
1.简介
从视频序列中分割前景物体是一个最基本的视频监控和重要的一步,把ffiC监控、视频会议、视频编辑,和许多其他应用。背景减法(BGS)是用在这些应用中,每个视频帧的背景模型相比,这些像素显著偏离模型被认为是属于前景。这些“前台”像素进一步进行目标定位和跟踪。
BGS的总体框架通常包括四个步骤:预处理、背景建模、前景检测,及后处理。预处理步骤收集训练样本和去除图像噪声;背景建模步骤建立背景模型,在一般的强大到一定的背景变化;前景检测步骤产生候选人的前景可以通过计算从背景模型的像素偏差;最后,后处理阶段的阈值的候选人形成前景遮罩。这四个步骤中,背景建模是最具挑战性的一对一的BGS法成功。
营造一个良好的背景模型的难点主要体现在以下两个事实。
(a)背景变化。在实践中,背景可能发生复杂的变化。这些变化可以在低频率,例如,通过全局光照引起的强度变化;他们可以在高频,喜欢雨,树摇不规则运动,水浪;他们也可以通过不同的配置之间的二ff背景切换引起的重复性和突发性的变化,如交通ffi几个状态为C图2说明了在光开关。背景像素进行这些复杂的变化,容易被误判为前景目标。
(b)训练样本的异常值。在实际情况下,如交通ffiC监测是另一个挑战,它经常地ffi邪教费力在基于学习的BGS方法建立背景模型当前帧与前景。直接从视频记录中提取的训练样本通常包含背景区域和不希望的前景像素。直接使用nonrobust学习方法会导致不准确的背景建模和前景检测性能不佳。
在本文中,我们提出了一个新的战场,更好的处理方法,后台配置的变化。它利用了两个稀疏假设的背景建模以及前景对象检测:(1)的背景有稀疏的线性表示相对于一个博学多才的字典,其中每个原子特征的背景配置之一。(2)前景是稀疏的,在这个意义上,大多数帧中的像素属于背景,这些前景像素空间相关。基于这两个假设,我们制定的背景建模步骤的字典学习问题,前景检测步骤作为一个修改后的稀疏编码问题。此外,为了背景模型与前景目前的训练样本,我们提出了一个强大的学习方法。它同时检测前景像素离群值,并建立正确的背景模型在学习阶段。
本文的其余部分组织如下。第2节调查背景减法的文献,第3节给出的数学公式的拟方法。在第4节中,我们与现有的方法相比,实验结果,并在第5节,我们得出的结论。
- 相关的工作
现有的BGS的方法大致可以分为两大类,基于怎样的背景和前景有:像素级模型和框架模型。
像素级的方法通常在本地和独立的帧中的每个像素的分布模型。其中最有代表性的例子是架地fferencing,这是快速但不能够捕捉移动的物体内部的像素均匀着色。沿着这个方向,更先进的方法,称为混合高斯(MOG),[ 1 ]中提出的。它指出,一个静态的场景,可以合理地模拟与高斯分布的混合物。弗里德曼用三个高斯混合(对应的道路,阴影,和车辆,分别。)模型在TRAffiC监控应用的背景和前景。STAUffER和Grimson [ 2 ]扩展这个想法,使用多个高斯多假设和发现有用的模拟动态场景如挥手树木,海滩,雨和雪。MOG的方法很受欢迎,通常被视为大量相关技术的基础上。当所选择的假设强加的假设失败,非参数方法更适合。一种流行的非参数方法是使用内核。在该方法中,创建一个内核周围的每一个以前的样本和密度估计使用平均超过内核。而二ff不同的内核可以考虑,正常的内核是由Elgammal等人提出的。[ 3 ]。这种方法的优点是它的能力,在处理任意形状的密度函数。最后但并非最不重要的是,卡尔曼滤波器应用于[ 4,5 ]
具有动态纹理的模型背景。卡尔曼滤波器,利用更复杂的状态向量往往包括高阶运动特性,如速度和加速度,并能够捕捉到更复杂的动态行为。这些方法直接建模的背景中的每个像素的分布,和一个新的像素,他们计算它的前景或背景的概率。然而,像素级BGS方法苏ff二从不足,面对在1节所提到的两个挑战,因为这些方法往往忽略背景变化的空间相关的线索。无知导致信息不ffi效率在背景建模和前景分割。例如,像素强度变化的全局光照变化引起高度的空间相关性,当单独考虑他们在本质上是无底fferent比前景物体的存在造成的,因此很容易被误。
二ff不同像素级方法,帧级方法处理一帧的背景像素作为一个整体形象,发现背景变化的内部结构。由于引入更高级别的信息,他们可以更好地模拟全球背景变化。这一系列作品的代表作包括应用主成分分析及其变种版本。的基本假设是,由于光照变化的背景变化是低维,和一个背景图像可以表示为一组学习的基础矢量称为本征背景[ 6 ]的线性组合。后来在[ 7 ],作者提出了一种增量PCA方法来预测模型的状态,它可以用来捕捉运动特性的背景。在实际应用中,有类似的交易ffiC监控前台免费训练样本不可用。为了使算法在这种情况下,作者在[ 8,9 ]提出了一种鲁棒PCA模型,这是要快得多[ 10 ]进一步发展,更有效和更实用ff。这些模型的主要优点是,如照明变化的背景变化处理全球和更好的建模相比,像素级的方法。
此外,最近几年在解决BGS问题见证了成功就业的压缩感知理论[ 11 ]。该理论指出,一个信号可以几乎完全恢复,只有少数的测量,如果它是稀疏[ 12 ],也就是说,它的大多数元素是零或接近零。这些方法假定在一个框架中大部分的像素属于背景,因此前景是稀疏的背景减法后可以从几个测量几乎完全恢复。由于前景中像素的数目明显小于整个帧,前景检测步骤在摄像机的传感器上具有显著的功率降低。这个想法是由[ 13 ]进一步发展,其中Markov Random Field(MRF)来对像素施加E组ff等因为它们空间相邻时,形成一个“对象”。后来在[ 14 ]的作者提出了一种替代方法动态组稀疏(DGS)。
图1:背景减法框架。
图2:背景切换几个配置,交通灯状态控制。
在本文中,我们提出了一种新的使用方法。这是关系到本征背景的方法,在这个意义上,一组有代表性的基向量学习和保留的背景建模。二ff分是我们的方法提供了一种开关一套其表示原子间不涉及所有的人在同一时间背景自动机制。我们的方法也与压缩感知方法在其假设,在前景中的像素是组稀疏类似于[ 13,14 ]。然而,二ff分,我们还假设有一个稀疏表示和学习字典描述背景变化的背景。这使我们的背景模型来处理二ff不同配置造成的,例如,TRAffiC光开关底ff二ENT状态者。此外,该词典的学习是不同于传统二ff字典学习方法如[ 15,16 ]对异常值的鲁棒性。所提出的学习方法不需要前景免费
训练样本,并建立一个正确的背景模型与外围前景像素自动裁剪出来。这是一个重要的实际和方便时,前台免费训练样本二ffi邪教在类似场景ffiC监测获得TRA。
总之,本文的主要贡献和取得的优点如下。
(a)利用字典学习模型的背景,以便更好地处理不同的配置之间切换地ff引起背景变化。
(b)为了学习方法与损坏的训练样本的工作,我们提出了一个强大的词典学习(RDL)的方法,其中自动修剪多余的前景对象在学习阶段,大大降低了人的劳动参与。
(a)原始帧X (b)候选人前景XF
(c)分布的分数 (d)前景物体
图4:作为学习词典。
(c)我们模型的前景检测问题为L1测量和L1正则化优化的全局最优解,可以有效发现ffi。此外,我们使用E组ff等特征分割前景目标。
- 方法
现有方法的共同框架的制定背景减法作为一个线性分解的问题:找到一个背景分量XB和前景成分一起构成一个给定的帧X XF:
x = xB xF , |
(1) |
在XB,XF,和X的大小列向量的像素数。实现分解,我们依靠对XB和XF之前的假设。成功的关键是背景的XB的建模,而变化的不同方法之间的ff迪。例如,在[ 1,2 ],在XB的像素被假定遵循分布为高斯分布的混合物。和芳是在一般被视为偏差X从XB在某种意义上说,每当一个前景像素看起来闭塞同位背景像素,和XF反映了从一个背景一个x像素的信心。
工作[ 6 ]观察到,在不同的照明条件下的场景的背景是低维结构。要确定的结构,他们建立了一组基向量进行PCA的一组训练后地面帧。这种观察是合理的,因为光照变化的尺寸应显着低于图像。然而,这种假设经常被侵犯在实际情况下(1)的局部和突然的变化,一个场景的背景经历和(2)前景对象,目前所收集的训练样本用于背景建模。这些场景可能会引入不准确的背景建模步骤和性能下降的前景检测步骤。
在本节中,我们将讨论如何模拟这些突发和局部变化所造成的背景之间的一些配置开关。以数字2为例,背景的配置不同地ff当TRAffiC灯光在地ff不同状态。在第3.2节中,我们模型的背景作为一个稀疏的线性组合的原子从字典D,每个原子的特征之一的配置。然后,我们制定在第3.3节的前景检测作为一个稀疏的编码问题,同时恢复稀疏的前景和稀疏码的背景。在第3.4节中,我们将讨论如何建立一个字典D的背景建模,使一个新的框架可以巧妙地选择只有几个原子的背景表示。
3.1。稀疏的假设。假设一个场景C配置,我们假设背景每个配置较低维的特征可以用一组基向量。通过叠加这些向量为一个矩阵的狄列,我们说i配置背景XB具有线性表示XB =底alpha;我,我是在alpha;COEffi系数向量。我们定义一个新的矩阵,D为所有连接的C矩阵a [ D1,D2,hellip;,直流],从而改写了XB
xB = Dalpha;, |
(2) |
在alpha;=〔0,hellip;,0,0,0alpha;ti,hellip;,△T是稀疏向量的条目coefficient零点的位置是理想的话,除了在这些组织中的with是给你的。这导致我们的第一个假定:稀疏
假设1。一个特定的帧X背景XB已经稀疏。
此外,观察的前景对象通常占据少数像素的帧,我们做另一个稀疏假设的前景。
假设2。一帧的候选前景XF是稀疏的背景相减后。
3.2。背景减法。与上述两个假设,BGS问题可互操作如下:给定一个框架x,找到具有稀疏分解
(a) (b) (c) (d)
(e) (f) (g) (h)
图5:健壮的字典更新步骤。(a)-(c)一些原子更新的样本。(d)更新原子通过K-SVD [ 15 ]。(e)-(g)由我们的方法裁剪出来的异常值。(h)用我们的方法更新原子。
这里alpha;0是L0范数计算非零元素的个数,D是字典捕获所有的后台配置的一个场景,在3.1节中提到的,和lambda;是加权的两个术语之间参数的平衡
找到最佳的解决方案(3)是NP由于l0范数的非凸性。在压缩感知[ 11 ]主张稀疏信号可以通过使用一个贪婪的追求算法或其严格的convexation版本的L1范数代替L0范数恢复理论的新发展。然而,问题(3)是二ff不同从CS文学因为它涉及到两个稀疏而不是只有一个:稀疏的前景Xminus;Dalpha;以及稀疏编码的背景alpha;。在[ 17 ]作者解决了这种类
问题(3)和重写为
在beta;是alpha;和Xminus;Dalpha;,拼接就是beta;= [alpha;;Xminus;Dalpha;],和D是D的级联和单位矩阵,即a [二]。由于(4)是一个标准的稀疏编码的问题,也可以解决无地ffi水平在一般的CS架
在本文中,我们通过不同的方式在二ff扩大词典进行二ff不同改性:首先用L0范数和L1范数和L1,L1正则化测量得到的凸优化问题:
这一重述在[ 1
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[27062],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。