英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料
基于卷积神经网络的指纹活性检测
罗德里戈·弗雷泽托·诺格拉,罗,伯托·德·阿伦卡尔·洛图福,鲁本斯·坎波斯·马查多
摘要—近年来,随着生物特征认证系统的日益广泛应用,伪造指纹检测变得越来越重要。在本研究中,我们使用卷积神经网络(CNN)进行指纹活性检测。我们的系统是在2009年、2011年和2013年的指纹活性检测比赛中使用的数据集上进行评估的,其中包括近5万幅真假指纹图像。我们比较了四种不同的模型:在自然图像上预先训练并根据指纹图像进行微调的两个CNN、随机权重的CCN和经典的LBP局部二值模式方法。我们证明,预先训练的神经网络可以产生最先进的结果,不需要架构或超参数选择。可以数据集增强来提高分类器的性能,这不仅适用于较深的体系结构,也适用于较浅的体系结构。我们还报告了使用这些大型预训练网络对非常小的训练集(400个样本)的识别准确性。我们的最佳模型的正确分类样本率总体上达到了97.1%——与之前发表的最佳结果相比,测试误差相对提高了16%。该模型在2015年指纹活体检测大赛(LivDet)中获得一等奖,总准确率为95.5%[1]。
1.介绍
生物特征识别的基本目标是根据一个或多个来自物理或行为特征的信号,如指纹、面孔、虹膜、声音、手掌或手写签名,为目标应用程序以可靠的方式自动识别对象。与基于某些信息(PIN、密码等)或物理设备(密钥、卡等)[2]的传统安全方法相比,生物识别技术具有一些优势。然而,为传感器提供一个假的物理生物特征可以很容易地破坏系统的安全性。特别是指纹,可以很容易地使用普通材料,如明胶,硅胶和木胶[2]伪造。因此,一个安全的指纹系统必须正确区分假手指和真实手指(图1)。目前已经有研究者提出了不同的指纹活性检测算法[3]、[4]、[5],它们大致可以分为两种方法:硬件和软件。在硬件方法中,将特定的设备添加到传感器中,以便检测特定的生物活性特性,如血压[6]、皮肤变形[7]或气味[8]。在本研究中使用
的软件方法中,一旦用标准传感器获得样本,就会检测出伪造特征。
图 实验中使用的来自LivDet2009数据库的真指纹和假指纹图像的典型例子。来自[9]
我们从指纹图像中提取出用于区分真假指纹的特征。在[2]和[9]等技术中,分类器使用的特征是基于特定的指纹测量,如脊线强度、连续性和清晰度。相比之下,一些实验中使用一般的特征提取器,如韦伯局部描述符(Weber Local Descriptor, WLD)[10],它是一种由差分激励和方向分量组成的纹理描述符。在[11]中提出了一种新的局部描述符,它利用局部幅度对比度(空间域)和相位(频域)形成二维对比相位直方图。在[12]中,比较了随机权重卷积神经网络(CNN)(例如:未学习的)(在[13]中也进行了探索)和局部二值模式(LBP),其在[14]中报告的多尺度转化在指纹活性检测基准中取得了良好的效果。相对于使用纹理描述符作为特征向量的更复杂的技术,如局部相位量化(LPQ)[15]、带小波变化[16]的LBP和BSIF[17],它们的LBP实现使用原始的、规范的LBP编码方案。此外,各种预处理操作技术,如对比度归一化、频率滤波和感兴趣区域(ROI)提取等都曾尝试过,但均未成功。增强数据集[18][19]通过图像平移和水平反射创建额外样本,成功地提高了分类器对于微小变化的鲁棒性。在本研究中,我们使用与著名的AlexNet[19]相类似的模型,在ILSVRC-2012数据集[20]上进行预训练,对[12]中呈现的工作进行扩展,该数据集包含超过120万张图像和1000个类,然后在应用于指纹图像时进行微调。实验结果表明,虽然预训练模型的目的是检测自然图像中的目标,但与使用随机初始化权值训练模型相比,将预训练模型微调到指纹活性检测可获得更好的效果。此外,我们使用一个更大的预训练模型[21],VGG (ILSVRC-2014[20]中的第二名)来训练我们的系统,使分类器的绝对值精度再提高了2%。
因此,本研究的贡献主要在以下三个方面:
- 针对目标识别任务设计和训练的深度网络,可以实现指纹活体检测的最先进的逼真性。在指纹活性检测中没有采用专门的手工工程技术。因此,我们为深度学习技术提供了另一个成功的迁移学习案例。
- 经过预先训练的深度网络仍需要较少的标记数据,才能在新任务中获得较好的准确性。
- 数据集增强不仅有助于提高深度架构的精度,还有助于提高浅技术(如LBP)的精度。
2.方法论
转移学习是机器学习中的一个研究问题,它致力于存储在解决一个问题时获得的知识,并将其应用于一个不同但相关的问题。
图 一些来自ImageNET数据集的图像,用于对网络进行预训练。尽管它们与指纹图像不同,但使用自然图像进行预处理有助于指纹活性检测。
图 本研究使用的模型说明。红色的方框是唯一不同于最初的VGG-19和Alexnet模型的层。
在这项研究中,我们表明,使用最初设计和训练的模型来检测自然图像中的物体(如动物、汽车、人),是有可能实现最先进的指纹活性检测的。[22]中也探索了同样的想法,为此,作者使用一个预先训练好的卷积神经网络,在CIFAR-10、闪烁风格的Wikipaintings基准测试中实现了艺术水平的表现。他们的实验与我们的实验的一个重要区别是,他们使用的所有数据集都包含与ImageNET数据集(图2)类似的图像,比如对象和场景。在我们的研究中,我们使用了指纹图像,这与那些使用其他领域的图像有很大的不同。
- 模型
表格1描述了本研究中使用的模型。它们都使用数据集增强。此外,我们在图3中显示了模型的体系结构。我们分别使用了同在[20]和[19]中描述的CNN-VGG和CNN-Alexnet一样的架构,除了我们使用2单位softmax层(图中红色所示)取代了去年1000
模型名 |
管道 |
描述 |
CNN-VGG |
16个卷积层 3个全连接层 |
来自[20]的预训练模型,并在活性检测数据集上进行微调 |
CNN-Alexnet |
8个卷积层 3个全连接层 |
来自[18]的预训练模型,并在活性检测数据集上进行微调 |
随机CNN |
随机CNN PCA SVM |
通过CNN提取特征。使用PCA减少特征向量维数,并使用RBF核的SVM分类。 |
LBP |
LBP PCA SVM |
通过LBP提取特征,使用PCA减少特征向量维数,并使用RBF核的SVM分类。 |
表格 该研究所使用的模型介绍
类softmax层,所以网络可以输出2类(如果图像是真实或假),而不是原来的1000类的网络设计。对于随机CNN,每个数据集的架构都不同,它是通过广泛的网格搜索选择的,如[12]所述。
- 卷积神经网络
卷积神经网络[23]已经在各种图像识别基准测试(如MNIST[24]、CIFAR-10[24]、CIFAR-100[24]、SVHN[24]和ImageNet[25])中展示了最先进的性能。经典的卷积网络由卷积层和局部池(即二次抽样)交替组成。卷积层的目的是该层中的每个过滤器通过在输入图像的每个像素上卷积一个模板,提取贯穿整个数据集的输入图像局部区域的特定模式,并将其作为特征映射c输出。然后使用非线性函数f(c)按元素顺序应用于每个特征映射c: a= f(c)。f(c)可以使用一系列函数,max(0;c)是常见的选择。然后,激活结果f(c)被传递到池化层。这一层将信息聚合到一组小的局部区域R中,生成一个汇集的特征映射s(通常尺寸更小)作为输出。将聚合函数表示为pool(),对于每个feature map c,我们有: ,其中是特征映射 c中的池化区域j,i是其中每个元素的索引。在各种类型的池中,最常用max-pooling,它选择区域的最大值。
池化背后的动机是与原始的特征映射c相比,池化映射s对图像中结构的精确位置不那么敏感。在多层模型中,卷积层以池映射为输入,因此可以提取对输入图像的局部变换趋于不变的特征[26][27]。这对于分类任务很重要,因为这些转换混淆了对象的辨识。实现对位置或光照条件变化的不变性、对杂波的鲁棒性和陈述的紧凑性,都是汇聚的共同目标。
图4给出了单层卷积网络的前馈过程。输入样本与3个大小为5x5的随机滤波器进行卷积(为了便于可视化,将其放大),生成3张卷积图像,然后使用最大池化操作对图像进行非线性函数max(x,0)处理,再进行因子大小为2的子采样。
在这个研究中,我们比较了三种不同的卷积神经网络模型。
第一个是随机CNN,它只使用从高斯分布中抽取的随机滤波器权值。虽然可以滤波器的权值可以学习,但是具有随机权值的滤波器性能很好,其优点是不需要学习[28][29][30]。该模型的体系结构与[12]中使用的相同。该方法采用随机权值卷积网络作为特征提取器,利用PCA进一步降低了特征的维数和RBF核的SVM分类器进行分类。对超参数的2000多个组合进行了广泛的超参数微调搜索,如表二所示。每个LivDet数据集(2009,2011,2013)中每个传感器的训练数据集(如Biometrika 2009, Bimetrika 2011等)都通过5x2交叉验证方法[31]选择最佳超参数。
第二个模型是CNN-Alexnet,它与AlexNet[19]非常相似,是在ILSVRC-2012数据集上预训练的。该模型在ILSVRC- 2012竞赛中的分类和定位任务都获得了冠军。他们的训练模型已被用于各种其他基准测试来提高准确性,如CIFAR-10, CIFAR-100。预训练网络为学习指纹活性检测等任务的网络权值提供了一个良好的起点。
流水线单元 |
超参数 |
范围 |
随机CNN |
#层数 |
1,2,3,4,5 |
随机CNN |
#滤波器(每层) |
32,,64,hellip;,2048 |
随机CNN |
卷积滤波器大小 |
5x5,7x7,hellip;,15x15 |
随机CNN |
池化滤波器大小 |
3x3,5x5,7x7,9x9 |
随机CNN |
步长(减缩因数) |
2,3,hellip;,7 |
LBP |
编码 |
标准的或规范的 |
LBP |
#图像大小 |
1x1,3x3,5x5,7x7 |
PCA |
#成分 |
30,100,300,500,800,1000,1300 |
SVM |
正则化参数 |
0.1,1,hellip;,105 |
SVM |
核参数gamma; |
10-7,10-6,hellip;,10-1 |
表格 随机CNN和LBP的超参数搜索范围
第3个模型,CNN-VGG,非常相似于[21]中使用的19层CNN模型,在ImageNet 2014挑战赛检测任务中获得第二名。
对于CNN-ALEXNET和CNN-VGG模型,最后的1000单元的softmax层(最初设计用于预测1000个类)被一个2单元的softmax层所取代,该层为真类和假类打分。利用指纹数据集对预训练模型进行进一步训练。
用于训练CNN-ALEXNET和CNN-VGG的算法时随机梯度下降(SGD),使用大小为5的批梯度下降,使用动量[32][33]0.9和固定大小为10-6的学习率。
图 示例图像中单层卷积网络执行的一系列操作的说明。
- 局部二值模式
局部二值模式(LBP) 是一种局部纹理描述符,在各种计算机视觉应用中表现良好,包括纹理分类与分割、图像检索、表面检测和人脸检测[34]。这是一种广泛应用于指纹活体检测的方法,在本工作中作为基线方法使用。
在其原始版本中,LBP操作符通过对3x3邻域的8个邻域中的每个邻域
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[19946],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。