基于半监督空间辨别的高光谱结构图像分类外文翻译资料

 2022-11-17 10:47:35

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


基于半监督空间辨别的高光谱结构图像分类

摘要:基于图像的半引导性学习方法已成功应用于高光谱图像(HSI)分类,具有有限的标记样本。基于图形的方法的关键步骤是学习相似图,近年来已经开发了大量的图形构造方法。但是,现有的方法通常从原始数据空间返回相似矩阵。在这篇文章中,我们提出了一种用于半监督的HSI分类的表示空间的鉴别图,它可以同时学习样本的表示和表示的相似矩阵。此外,我们明确地将样本和类之间的概率类关系(可以通过部分标签信息估计)纳入到上述模型中,从而进一步提高图的可识别性。Hyperion和AVIRIS高光谱数据的实验结果表明了该方法的有效性。

索引项——图、高光谱图像(HSI)分类、表示空间、半监督学习(SSL)。

介绍

在高光谱图像(HSI)分类中,我们经常会遇到这样的问题:标记数据的获取是相当昂贵和耗时的,而大量未标记的数据则可以毫不费力地获得。因此,半监督学习(SSL)已经被提出解决上述问题,它可以将未标记的样本和标记的样本进行分类。在现有的SSL方法中,基于图形的SSL方法得到了大量的关注,因为它们具有很好的数学公式,并且可以得到一个近似的解决方案。基于图形的SSL的关键是构造一个能够很好地捕获内部数据结构的相似图。基于图形的SSL方法通常包括两个步骤。首先,从所有样本中构造一个图,节点表示所有样本,边权表示数据点之间的关系。然后,通过图形将标签数据的标签信息传播到未标记的数据。尽管在不同的基于图形的SSL方法中使用了不同的目标函数来描述传播过程,但它们中的大多数都试图遵循所谓的“集群假设”,即如果老或结构可能具有相同的标签,那么就可以使用相同的样本。一般来说,基本的流形是由一个由所有样本构成的图近似地建模。因此,图形构建对于基于图形的SSL方法至关重要。

近年来,已提出了许多图形施工方法。传统的方法如高斯核(GK)局部线性重构(LLR)和局部线性嵌入(LLE)主要采用欧几里得距离来构建图,只能捕获局部数据结构。因此,这些方法对数据的噪声和误差非常敏感。此外,传统的方法总是有一些固定的参数,这些参数需要在图结构中手动调整,它们不能产生数据自适应的社区。

另外,基于压缩感知的发展,提出了几种稀疏表示(SR)的方法来构造图。与传统的方法不同,基于sr的图将每个样本表示为其他数据样本的稀疏线性组合,可以利用数据的全局结构。此外,通过求解1个优化问题,这些方法可以自动和同时获得图的邻接结构和权值。具体来说,Cheng等人和 Yan等人提出了一个1-图结构,通过将每个样本编码为其他样本的稀疏线性组合,来度量数据点之间的相似性。Gu和Feng将1图应用于HSI分类。由于非负性特征对图权值很重要,他等提出了一个稀疏概率图,将表示系数强制为非负的。此外,Wang等人提出了一种修改后的SR版本,它在识别潜在的子空间时,即使有噪声数据也很有效。本文提出了一种图形正则化的方法,构造了一个拉普拉斯图正则化的局部结构。利用低秩表示的优势(远程雷达)、Zhuang等人正规化稀疏表示半监督HSI(PCSSR)图分类,将概率类结构的数据加入到老的表示系数保存数据样本的类结构,并获得一个更有识别力的图。

虽然上述图的构建方法在半监督分类任务中表现出了令人印象深刻的性能,但它们直接基于原始数据之间的距离或数据表示的相似性来学习相似矩阵。本文提出了一种基于表示空间的识别(RSD)图,用于半监督的HSI分类,并同时学习数据表示及其关联矩阵。所提出的图结构是根据样本的表示之间的距离构造的,潜在的假设是,如果样本的表示距离较短,样本应该具有相同的标签。此外,我们明确地将样本和类之间的概率类关系纳入模型中。这样的先验信息可以保证类分布较小的样本具有更大的权重。在考虑了样本的表示和类分布之间的距离之后,我们可以得到一个信息更丰富、更有辨别力的图。

本文的主要贡献可以概括为三个方面。1)提出了一种新的图形生成方法,可以同时学习样本的表示和表示的相似矩阵。2)为了进一步提高表示法的相似性矩阵的辨别力。3)我们明确将概率类关系引入到图学习模型中。

原理

在这一节中,我们将介绍所提议的RSD图模型。首先,建立了RSD模型的目标函数;其次,讨论了优化的细节;最后,我们介绍了一个基于图形的半监督分类框架。

A:给出一组数据的RSD图模型X = [Xl,Xu] isin; Rdtimes;n,Xl = [x1,x2,...,xl] isin; Rdtimes;l表示标签样本,Xu = [xl 1,xl 2,...,xl u] isin; Rdtimes;u是通过结合SR和LRR模型,提出了一个非负的低秩和稀疏图结构。最近,邵等人提出了一个概率类结构样本。那么每个数据样本可以由X的一个线性组合表示为自表示的:

X = XZ (1)

考虑到可以无限可行解的问题(1),我们对Z施加一些约束,l2规范Z简单有效,因此我们选择它来约束表示Z。当然,还可以选择其他选项(例如,稀疏和低级别约束)。通常,如果两个数据点的表示距离较小,那么它们应该有更大的概率共享相同的标签,并且它们之间的权重也应该更大。因此,确定权重的一种自然方法是解决以下问题:

s.t. forall;i WiT 1 = 1,Wi ge; 0 (2)

LW = Dminus;W ,L是拉普拉斯矩阵,D是一个对角线度矩阵D ,Z是xi xj,的表示,Wij是从同一个类中反映出它们的概率。然而,解决问题(2)可能导致只有最接近的表示可以是Zi与权值1的邻接,其他所有样本的权重为0。为了解决这个问题,我们也在W上强加了l2规范。

另一方面,提出了一种概率类结构正则化器,有效地提高了图像的可分辨性。它最小化了以下问题:

PLWP

此时表示样本i和j之间的概率类分布的欧几里得距离,当最小化R正则化器时,它倾向于将较小的权重分配给具有更多不同类分布的样本,从而产生一个更有区别的权重矩阵。

根据数据样本的概率类分布定义为样本与类之间的概率关系。对于标记样本,类分布矩阵Pl isin; R1times;c 可以直接获得,Pij = 1 时,数据的标签xi属于j ,j isin; {1,2,...,c} ,否则Pij = 0 。对于未标记的样本,采用以下方法来估计类分布矩阵。对于每一个标记样本xk isin; Xu ,它可以被编码为所有标记样本的稀疏线性组合:

Xl: a = argmin

a isin; Rltimes;1 时,这表示未标记样本xk和每个标记样本之间的相似性。因此,我们可以得到每个未标记样本xk 的类分布向量:

Pk = aT Pl (5)

基于以上观察,我们更倾向于在图学习中考虑概率类结构正则化器。现在,在此基础上,提出了RSD图模型。RSD模型可制定如下:

(ZLWZT )

Z,E,W

PLWPT

s.t. X = XZ E; forall;i WiT 1 = 1; Wi ge; 0 (6)

是噪声项,lambda;1, lambda;2, lambda;3, 和gamma; 是影响对应项是否平衡的四个参数。

该问题(6)可以用乘数法(ADM)的交替方向法求解。为了在我们的方法上应用ADM,我们首先引入一个辅助变量J来分离目标函数,问题(6)可以重新定义为:

(JLWJ

Z,E,W

gamma;tr(PLWPT )

s.t. X = XZ E; J = Z; forall;i WiT 1 = 1; Wi ge; 0 (7)

然后,我们可以得到问题的增广拉格朗日函数(6)如下:

(JLWJ

gamma;tr(PLWPT ) Phi;(Lambda;1,Xminus;XZminus;E) Phi;(Lambda;2,Jminus;Z)

(8)

定义 ,表示内积算子,mu;是一个积极的点球标量,Lambda;1和Lambda;2拉格朗日因子。

为了得到函数L的最优解,我们在保持其他变量不变的情况下交替更新变量E、Z、J和W。更多优化细节请参考补充材料。在得到表示形式的相似矩阵W后,我们可以得到一个对称权图:

W = (W WT )/2 (9)

半监督分类

在本小节中,在上图中进行了一种称为高斯谐波函数的标记传播方法,用于估计未标记数据点的标签。

Y = [Yl,Yu]T isin; Rntimes;c 成为一个标签矩阵。如果标签样本Xi 属于j,j isin; [1,2,...,c] ,否则Yij = 0 。GHF利用图形和已知的标签<stron

剩余内容已隐藏,支付完成后下载完整资料</stron


资料编号:[24222],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。