基于CNN和LBP特征的人脸识别系统进行分类器优化和融合外文翻译资料

 2022-11-25 14:47:11

英语原文共 11 页,剩余内容已隐藏,支付完成后下载完整资料


Available online at http: / / www.cnki.net

2018年2月25日(1):37 - 47

中国邮电大学学报。中国邮电高校学报(英文版)。中国邮电高校学报(英文版)



http: ∥jcupt.bupt.edu.cn

基于CNN和LBP特征的人脸识别系统进行分类器优化和融合

吴玉林 蒋明艳

山东大学信息科学与工程学院,济南250100

摘要:人脸识别一直是模式识别领域的热门话题,其中特征提取和分类起着重要作用。 然而,卷积神经网络(CNN)和局部二值模式(LBP)只能提取面部图像的单个特征,而不能选择最优分类器。 针对分类器参数优化问题,提出了基于人工蜂群(ABC)算法优化的支持向量机(Support Vector Machine,SVM)的两种结构,分别对CNN和LBP特征进行分类。 为了解决单一特征问题,提出一种基于CNN和LBP特征的融合系统。 通过提取和融合脸部图像的全局和局部信息可以更好地表示脸部特征。 我们通过融合特征分类器的输出来实现目标。 Olivetti研究实验室(ORL)和人脸识别技术(FERET)数据库的明确实验结果表明了所提出方法的优越性。

关键词 CNN特征,LBP特征,分类器优化,融合系统,人脸识别

1 介绍

在过去的几年中,人脸识别已成为日常生活中几个领域的热门话题,并且具有广泛的应用,如识别,访问控制,普适计算等[1]。 与其他生物识别系统(包括指纹,掌纹等)相比,可以轻松收集人脸识别。 然而,人脸识别必须处理许多问题,例如表情变化,噪声,姿态[2]和照明。 出于这个原因,学习功能在人脸识别中有效地发挥重要作用。 CNN和LBP已经被应用到了脸上的识别和分类[3-4]。 这样的算法已经取得了卓越的性能 尽管如此,通过单人脸特征很难完全表达人脸信息。

收稿日期:23-08-2017

通讯作者:姜明艳,

邮箱:jiangmingyan@sdu.EDU.CN

DOI:10. 19682 /j.CNKI.1005-8885.2018.0004

近年来,基于深度学习的特征学习方法在人脸识别的应用中备受关注。 最典型的算法之一是CNN。 作为处理全球形象的全球性方法,CNN由LeCun等人提出。 [5],它可以直接从原始图像中学习特征,避免了复杂的特征提取过程。 CNN已成功应用于人脸识别,手写数字识别,车牌识别和语音识别[6-7]。 LBP旨在提取不同的局部特征用于识别图像,已被广泛用于许多识别应用中,如面部分析,纹理分类,场景分类等[8-9]。但是,这些方法仍然存在一些问题。CNN的结构是全连接层和输出层之间的线性分类器。例如,很难达到很好的分类效果。LBP功能还需要更好的分类器。

支持向量机是深度学习领域内强有力的分类工具之一,取得了很好的效果。Boser等人提出了一种用于最优边缘分类器的训练算法[10]。Platt等人 提供了分解算法的顺序最小优化(SMO)并提供了内核优化方法至提高该性能的SMO。Cherkassky等人总结了基于经验设置SVM参数的方法[11]。但是,根据经验选择的参数可能不是最佳的。群智能优化算法是优秀的参数优化方法之一,已成功应用于SVM参数的优化。Raj等人使用粒子群优化(PSO)算法来优化SVM参数并获得满意的效果[12]。但是,大多数优化算法很容

易陷入局部最优。ABC由DervisKaraboga等人提出。作为一种新的群体智能优化算法。ABC在很大程度上可以避免陷入局部最优位置。 并已成功应用于许多领域[13]

一方面,提取图像的不同特征是图像表示的关键因素。 对于上述方式,仅以单一方式表达面部特征是不够的。 另一方面,上述方法忽略了分类器参数的选择,因此选择支持向量机的最优参数也很重要。

1.1动机

对于人脸识别应用,选择深度学习方法和传统方法来获取人脸特征,可以提高识别的准确性。 尽管前面提到的一些方法已经成功应用于人脸识别领域,但仍有很大空间改进。 以下两个方面没有被全面考虑:

1)如何为深度学习方法和传统特征提取方式选择合适的分类器。 上面提到的方法如CNN和LBP是很好的特征提取器而不是有效的分类器。 即使在选择分类器时,现有算法也没有考虑到最优参数原理。

2)如何充分利用图像的全局和局部特征。 结合深度学习方法和传统方式,可以获得更完整的面部信息表达。 一些现有的方法在局部特征面具有不同的特征[14],而其他方法的面部信息在全球进行处理[15]。 这两种方法不能全面地捕捉人脸的特征。

1.2贡献

为了解决上述问题,采用最优分类器原则来防止分类器参数落入局部最优[12]。 并且将全局和局部的人脸信息融合在一起,而不是为脸部组件提取单个信息[6]。提出了在每个特征提取分支之后采用最优分类器的两种结构。融合系统也被设计为提取全局和局部特征。主要贡献总结如下:

1)提出了两种结构。用ABC算法(ABC-SVM)优化SVM,取代全连接层和输出层之间的CNN线性分类器。 ABC算法用于优化SVM中径向基函数(RBF)核函数的参数。 它可以避免陷入局部最优的参数。 另外还采用ABC-SVM作为LBP获取面部特征后的最优分类器。

2)将深度学习法CNN与传统LBP方法相结合,设计融合系统。 CNN可以提取全局面部特征,LBP用于获取局部面部信息。 采用两个ABC-SVMs对收购进行全局和部分特色的分类。然后根据最大概率原理将输出融合。

1.3组织结构

在第2节中,简要介绍了相关的工作。在第3节中,详细描述了两个提出的结构和融合系统,包括分类器参数的优化过程和方法。实验结果显示在第4节中,最后在第5节中得出结论。

  1. 相关工作

2.1CNN

CNN是由哺乳动物大脑视觉皮层中发现的生物证据提出的一种特殊设计,用于识别二维图像[17]。稀疏连接和权值共享两种结构特征使其广泛应用于图像识别和分类领域。美国有线电视新闻网的传统结构如图1所示,主要由三层组成:卷积层、采样层和全连接层。

卷积层的输出特征图如下:

其中和分别是L和L-1层的第j和第i输出特征映射,是第i特征映射与第j特征映射之间的核,“*”是指卷积计算,是L层的第j特征图的偏置矩阵,n是L—1层的特征图编号f是激活函数。

采样层的输出特征图如下:

其中D是下采样函数,是第L层第j个特征映射的标量参数。

让由M类组成的输出单元是y=[y1,y2,hellip;,y,ym]全连接层的输出如下:

其中n是在输出层之前的层上的特征图的数目,m是每个特征映射的神经元的数目,a是权重,而bi是I类的偏倚。

2.2 LBP

LBP是一种用于描述图像局部纹理特征的传统算子,具有旋转不变性和灰度不变性等显著优点,将原始LBP算子定义为3times;3窗口,通过对灰度值的比较,总结出图像的局部特征。中心像素为八个相邻像素,通常将原始图像分为多个块,分别提取每个块的信息。

在提出了原始LBP后,研究者们不断地对人脸识别进行了各种改进[18],其中一个改进是减小LBP模式的维数的均匀模式,让P表示邻域集合中的采样点和PAT的数目。通过这样的改进,模式的个数从2P改变为P(P-1) 2。

2.3 SVM

支持向量机是一种有监督的深度学习算法,可以解决分类和回归问题[19]。 它最初是一种二元模型。 后来它发展成分类器,在特征空间中找到了最佳的分割超平面。

让一组线性可分的训练数据是D ={(x1,y1),(x2,y2),..., . . ,(xM,yM)},xkisin;R,ykisin;{ 1, - 1},yk表示样本被分成两类。 这个问题可以转化为凸二次规划(QP):

其中w是权重向量,b是偏差。 全球最优解可以通过求解方(4)。但是,在实践中,训练数据不是线性的可分。出现拉格朗日对偶问题,SMO算法可以解决这个问题。同样的时间,内核函数可以构造一个在特征空间中分类超平面并进行分类不必执行所有矢量计算。

i

内核函数表示为:

其中phi;(x)是x的映射,phi;(x)Tphi;(z)代替了内积的计算。

SVM模型优化的目标函数变为:

其中是拉格朗日乘子。

当存在噪声时,模型的泛化能力通过松弛变量得到改善。 目标是将双重问题与松弛变量结合起来,函数可以被重写为:

其中C表示用于控制的惩罚因子分类间隔和培训之间的平衡错误。

2.4 ABC算法

Karaboga等人提出的ABC算法 是一种智能优化算法,它模拟蜜蜂的自然觅食行为以找到最优解[20]。ABC算法的优点是不需要设置太多的参数,也不容易陷入局部最优。

ABC算法由三个基本部分组成:食物来源,就业觅食者和失业觅食者,以及三种行为模式:寻找食物来源,招募食物来源和放弃食物资源。蜜蜂分为三类:从事采集的饲养员,追踪采食者和搜寻采集者。

随机搜索食物来源如下:

其中Xj是第j维和第i个可行的解,phi;表示从0到1的随机数。

搜索当前位置附近的新位置如下所示:

其中k和j是随机生成的并且不相同,rj是从零到一的随机数。

以下觅食者选择食物来源根据概率:

其中Ns是可行解的数目,Ti(Ti,Tmisin;T)表示适应度函数。

3建议的方法

3.1两种结构分别基于CNN和LBP特征

在引入两种结构之前,首先针对两种识别结构确定最优分类器。ABC-SVM不容易陷入局部最优[21]。SVM模型的目标函数如式(1)所示。(7),并且大量的经验证明了RBF核函数可以表现出较高的分类性能。我们选择RBF作为SVM的核函数,它可以表示为:

其中,gamma;gt; 0是RBF核函数的参数。

SVM模型的泛化性能取决于C和gamma;的选择。 在一定程度上,两者之间也有很多相互作用参数[22]。 采用交叉验证(CV)方法获得目标函数来评估SVM模型的性能,SVM模型的均方误差可写为:

其中f-(xl)是判别函数,Lambda;是拉格朗日乘子,G(C,gamma;)是C和gamma;的函数。

我们使用ABC算法来优化C和gamma;。食物来源,采食采食者和失业采食者被设定为相同的数量Ns。ABC算法优化SVM的步骤详述如下:

步骤1 算法初始化:初始化食物来源数量,最大迭代次数和最大限制时间,并根据方程式随机初始化食物来源。(8)。

步骤2 就业搜寻者通过公式搜索当前位置附近的新位置。(9),选择方程(9)的最优值。(12)基于贪婪标准。

第3步 失业的饲养员选择就业采食者按照Eq。(10),并重复第2步中采用的饲养员的行为。

步骤4 记录步骤2,3的最佳值和参数值。

步骤5 如果搜索时间大于最大限制时间,则通过公式更新搜索位置。(8)。

第6步 如果没有达到最大迭代次数,则转到步骤2,否则算法结束并输出最优值和最优参数值。

当输入图像时,使用图1的结构来获得图像特征。 然而,采用ABC-SVM代替CNN结构的线性分类器,可以更好地处理非线性数据。基于CNN特征的建议结构如图2所示。

图2基于CNN功能的结构

另一种传统的图像特征提取方法是LBP。它具有旋转不变性和灰度级不变性的优点。LBP用于提取图像的纹理特征:输入图像先分成块,然后再根据LBP均匀图案对图像进行维度提取,以提取图像的局部纹理特征。ABC-SVM用于分类LBP特征。 基于LBP特征的建议结构如图3所示。

图3 基于LBP特征的结构

  1. 2 融合系统

由于单幅图像特征不能充分表达图像信息,因此采用了全局和局部图像特征,提出了将深度学习方法CNN与传统方法LBP相结合的融合系统。 并采用决策层融合方法。

融合系统的两个分支已经完成在章节中介绍。 3. 1.该系统中的融合目标是两个ABC-SVM的输出。 融合方法基于最大后验概率原理。 使用sigmoid函数将ABC-SVM输出拟合到图像类别的后验概率。 单分类器的后验概率矩阵可以表示为:

其中k是第k个分类器,意味着xn样本的后验概率被确定为m类,m是类号,n是测试样本的数量。

通过为每个分类器设置权重来执行多个分类器的融合。 系统的后验概率输出可以写为:

其中Ek表示第

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[22525],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。