基于新的匹配度量受监督非负矩阵分解的图像多标签标注方法外文翻译资料

 2022-11-03 10:25:19

基于新的匹配度量受监督非负矩阵分解的图像多标签标注方法

徐佳 孙福明 李浩杰 曹玉东 张兴

摘 要

非负矩阵分解(NMF)在模式识别和数据挖掘领域一直吸引了许多学者的研究。迄今为止,学术界已经提出了大量的改进方法,并且成功地应用于图像检索和图像单标签标注(SLA)中。然而,NMF在多标签标注(MLA)的有效性方面遭遇了困难,因此这仍然是一个开放的研究点。为了解决这个难题,本文提出了一种新的匹配度量监督NMF,以提高MLA精度。与具有稀疏或判别约束的其他NMF算法相比,本文提出的NMF算法实现了一种监督训练方法,同时使其特征维度得到减少。此外,我们通过分别考虑正、负样本来改进新的匹配度量功能,并证明了其更适合于MLA。最后,通过使用投影梯度法对本文所提出的NMF目标函数进行优化,并且用于实现图像标注。在NUSWIDE数据集的实验结果表明,在错误拒绝率(FRR)和错误接受率(FAR)两个指标上,本文提出的算法比现有算法可以达到更强的性能。

【关键词】 非负矩阵分解 多标签标注 监督学习 匹配度量

  1. 介绍

对于图像特征分析和维数降低,有以前使用过许多规范的矩阵分解方法,如主成分分析(PCA)、线性判别分析(LDA)和独立成分分析(ICA)。在这些方法中,分解矩阵中的每个元素可能是正或分解后为负。从代数的角度来看分解的积极或消极因素是合理的,但是实际应用中的负面成分几乎没有意义。例如,图像像素值必须是非负值,同样,文件统计资料的负值也是无意义的。为了使结果更具有解释性,一种称为非负性的新型范例矩阵分解(NMF),最近几年引起了更多的关注。这种方法首先由Lee和Seung提出。前面提到的它与规范矩阵分解方法的主要区别是强加非消极性约束NMF中的分解矩阵,即给定的非负矩阵,可以发现两个矩阵和满足方程式(1)。

, (1)

其中,,

,,,

近年来,NMF已被广泛应用于模式分类和数据挖掘,如特征维度减少或SLA。但是,它可能不能保证使用原始NMF方法可以实现高分类精度,原始的NMF方法只需要分解矩阵非负。因此,提出了一些除非消极性之外强加其他约束的NMF变体。然而,对于MLA问题,几乎没有讨论这些NMF算法是否有效。为了解决这个问题,本文提出了一种新的改进的图像MLA问题的NMF算法。本文的主要贡献总结如下:(1)除特征维数减少过程外,在提出的NMF模型中也实现了监督训练过程;(2)在监督训练阶段,分别采用正负样本两种不同匹配函数的新匹配度量方法作为NMF约束项;(3)图像标注可以通过使用提出的NMF直接实现,无需分类器。

本文的其余部分安排如下:在第二节中,一些相关的作品得到了解决。在第3节中,提出了一种用于MLA的新匹配度量的改进的NMF方法。第4节给出了一种预测的梯度算法来解决所提出的NMF目标函数。我们描述了在多标签图像数据集上进行的实验,以证明在第5节中提出的算法的有效性。最后,结论在第6节中得出。

  1. 相关工作

近年来,已经在SLA中应用了许多基于NMF的算法。最初,仅需要满足方程式的基本NMF(1),其中分解矩阵和的列分别代表特征基础和系数向量 ,并且这些系数向量可以被看作是新的特征向量。但是,如前所述,只使用具有唯一非消极性约束的基本NMF很难获得良好的标注结果。因此,添加附加约束条件 作为NMF中的正则化项,如公式(2)。

, (2)

一般来说,约束可以分为以下四类,用于图像分类或标注:

  1. 稀疏NMF

稀疏NMF需要分解矩阵和的充分稀疏,即两个矩阵的范数必须尽可能地最小化。当然,规范的解决方案是NP难题,难以解决。因此,这个问题通常是根据压缩感知理论来解决范数。先前的研究强制基于矩阵的稀疏约束,这意味着每个基向量表示基于部分或基于局部的图像特征。此后,它可以检测图像中呈现的材料。类似于稀疏约束,拉普拉斯正则化被表示为保留中的实例之间的局部性和相似性的依赖属性。

  1. 正交NMF

为了减少不同特征库之间的冗余,[14]提出了正交NMF。它要求基矢量是正交的,即。为了保持减小空间内的局部邻域几何结构,Wen提出了一种用于特征提取的邻域保持正交投影非负矩阵分解(NPOPNMF)方法。除了图像分类之外,正交NMF也可以应用于图像聚类,并引入了两种新的方法,即EM样算法和增强拉格朗日方法来解决正交NMF函数。

  1. 判别NMF

对于图像分类和标注,监督学习比无监督学习更为常见。因此,为了最大化由不同标签标注的图像之间的距离,经常可以在NMF中添加判别约束。在实际应用中,如面部识别,薛和扎维里乌将线性判别分析纳入到NMF算法中。然而,判别性NMF通常不能保证收敛到一个稳定的极限点。在[19]中得到了解决,并提出了一种使用投影梯度的新型DNMF方法。除了分类性能和收敛之外,还需要考虑计算复杂度。因此,在[20]中提出了改进的光谱投影梯度,大大减轻了计算问题。

  1. 流形中的NMF

流形学习方法可以发现高维数据空间的固有几何结构。对于图像聚类,在[21]中提出了超图形正则化的NMF,其将流形规则化器纳入标准NMF框架,导致新的性能。

所有上述NMF方法已经应用于图像聚类或标注,取得了很好的效果。在这些方法中,鉴别NMF明显优于监督学习,因为除非否定性之外,它对系数矩阵施加了判别约束,这意味着不同标签的图像之间的相似度尽可能低。在分解后,分解系数矩阵中的所有列向量可以被认为是新的特征向量,这些新特征需要被输入到分类器中并输出标注结果。换句话说,图像标注任务除矩阵分解之外还需要分类处理。显然,这将需要一定的时间。为了提高实时性能,提出的算法通过解决NMF功能同时实现了特征维度减少和分类,其中添加了新的匹配度量作为MLA的正则化项。据我们所知,迄今尚未讨论这个问题。下面,我们集中力量来解决问题。

  1. 通过新的匹配度量改进NMF

凸函数优化问题常用于解析NMF,其目标函数重写为公式(2)。显然,对于MLA问题,提出的NMF算法应该满足以下两个条件:(1)所提出的约束项应有助于图像分类; (2)目标函数必须是凸函数。基于上述分析,对于等式(2),重要的是验证约束项是否合理有效。对于具有稀疏、正交和流形约束的NMF方法,分解矩阵从不同的角度反映了原始矩阵的一些重要属性,但不能保证这些属性对MLA有帮助。已经观察到,鉴别NMF具有优于其他方法的优点,所获得的特征向量在相同类别内具有高相似性,并且不同类之间具有相似性,其中相似性和不相似性通常通过欧几里德距离或曼哈顿距离来测量。然而,还没有确定这些距离测量是否适合于图像标注。

请注意,MLA的实时性能是另一个关键问题。从第2节,通过使用NMF标注图像时,通常需要一个合适的分类器。无疑设计一个分类器是一件麻烦的事情。 这是一个非常自然的想法,我们只能使用NMF模型直接标注图像而不设计分类器?我们会解决这个问题。

对于MLA问题,有一组类标签,其中是数据库中图像标签的数量。令是有限维空间的实例空间,图像可以表示为向量,,并标注为,如果标签被分配给,则,否则。MLA的目的是从训练样本得到映射函数,并且为给定图像准确且快速地预测标签向量。为了达到这个目标,在提出的NMF算法中,我们将提高分解矩阵的含义,即矩阵中的每个元素不会代表新的图像特征,而是决定图像是否可以被标签标注。

假设存在通过从个训练图像中提取特征而获得的训练样本的向量集合,并且它们的标签根据监督学习理论获得为先验知识。在提出的MLA的MLF中,理想情况下,当分解为时,和的列分别被视为基本向量和标签向量。实际上,分解标签矩阵和实际标签矩阵的精确度是相同的,但是和应尽可能的接近。因此,我们在基本NMF上增加一个约束项提出NMF函数,如式(3),

,, (3)

其中,表示和之间的距离,测量两个不同矩阵之间的相似度,即和的匹配度量,并且得出结论,匹配度量函数的选择将直接影响标注精度。

为了测量特征向量之间的相似性,经常采用欧几里德距离和曼哈顿距离。这两个距离函数如公式(4)和(5):

(4)

(5)

其中a和b表示两个n维向量。在某些情况下,这些测量是足够有效的。 然而,对于图像标注,既不能反映两个标签向量之间的匹配度。因此,需要提出合适的匹配度量。

从上述分析可以看出,对于标签向量,我们给出了一个新的解释:是NMF之后的r维系数向量,也可以作为MLA的标注结果,应该靠近其标签向量。为了给出合理的匹配度量,我们需要分别考虑正、负样本,并提出两个匹配函数和。

  1. 正样本

假设每个基本向量 反映了标签图像的一个重要特征,标签向量表示第个图像可以由标签标注,并且分解系数被认为是实际上第个图像与标签,所以和之间的距离必须尽可能的小。在本文中,我们提出了匹配度量的新观点,即对于的正样本,分解系数越大,和之间的匹配度越高,距离越小,相反,较近的为零,距离将越大,图像越不可能包括标签图像的特征。得出的结论是,所提出的匹配函数是单调递减的,因此,如果使用欧几里得距离或曼哈顿距离作为匹配函数,一旦分解系数大于1,匹配函数值,即距离将随的增加而增加。这与以前的分析不一致,所以两次距离测量不适合作为匹配函数。

除了单调性之外,功能凸度凹凸还是需要关注的另一个问题。在NMF中,提出的匹配函数不仅表示匹配度,而且可以看作是匹配损失,我们的目标是使匹配损耗尽可能低。那么接下来的事情是,我们将讨论如何“绘制”正态样本的损失函数的合理曲线。 假设存在两个分解系数和,以及判断图像是否可以标注的阈值,即如果,则第个图像可以由标号标注。假设gt;,,其中是正常值,,和的分布包括以下三个特殊情况:

图1. 当x = 1时,正样本的匹配函数曲线

  1. 当时,我们认为第个和第个图像都被标签标注,没有任何争议,所以损失差应该足够小,其中;
  2. 当j时,第个图像被精确地标注。和的差异非常小,但是第个图像的标注结果是错误的,所以损失差应该大于,其中;
  3. 当时,精确的标注几乎是不可能的,这对我们是绝对不能接受的,所以应该远大于和,且,其中。

如果足够小,和,则包含,即函数是凹函数。

从上述分析可以看出,对于正样本,提出了一个合适的匹配函数(6),其功能曲线如图1示。

, (6)

  1. 负样本

对于负样本,也需要考虑匹配函数的单调性和凸凹度。类似于正样本的分析,标签向量表明第个图像不能由标记标注,对于的负样本,和之间的距离也必须小 因此,分解系数越高,和之间的匹配度越小,即匹配损耗越大,则得出所提出的匹配函数单调递增,。

对于函数凸凹度,同样地,也假设有两个分解系数、和一个阈值,其中,,。还有三个特例如下:

  1. 当时,我们认为第和第个图像没有任何争议的标注标注,所以损失差应该足够小,其中;
  2. 当时,第个图像不被标号标注。和的差异非常小,但是第个图像的标注结果是错误的,所以损失差应该大于,其中;
  3. 当,准确的标注几乎是不可能的,也是我们绝对不能接受的,所以应该远大于和,且,其中。

如果足够小,和,则得出结论:,即函数也是凹函数。

从上述分析可以看出,对于负样本,如方程(7)提出了一个合适的匹配函数,其函数曲线如图2所示。

, (7)

图2. y = 2.5时负样品的匹配函数曲线

目前,已经提出了包含两个匹配函数和的新匹配度量。因此,整个NMF函数可以如式(8)。

, (8)

(9)

(10)

(11)

(12)

(13)

其中表示两个矩阵和的点积,矩阵中所有元素均为1,是监督学习的标签矩阵,和是平衡参数。

  1. 基于投影梯度法的目标函数解

在本节中,应用投影梯度法来解决(8)给出的优化问题。投影梯度法的主要概念是通过连续迭代近似优化目标函数,直到获得最优解。

在所提出的算法中,方程(8)中的目标函数可以表示为方程(14):

(14)

通过拉格朗日定理,

(15)

和偏差

(16)

(17)

(18)

(19)

因此,乘法更新规则如方程(20)和(21)所示。

(20)

(21)

其中提出的算法的单调收敛可以根据[2]中描述的推导方法来证明。

所提出的MLA训练和测试算法分别在算法1和算法2中总结。

算法1:

输入训练集,平衡参数和,以及匹配度量参数和。

步骤1:初始化和,其中每个矩阵元

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[141316],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。