英语原文共 18 页,剩余内容已隐藏,支付完成后下载完整资料
翻译
1.引言
人脸识别被认为是一种简化的图像分析和模式识别应用,在过去的30年里获得了极大的关注。理解这一趋势至少有两个原因:(1)各种各样的商业和法律要求,以及(2)相关技术的可用性(例如,智能手机,数码相机,GPU,hellip;)虽然现有的机器学习/识别系统已经达到了一定程度的成熟,但其性能仍受限于实际应用[1]的条件。例如,识别在不受约束的环境中获得的面部图像(例如,光线、姿势或面部表情的变化,以及部分遮挡、伪装或相机运动)仍然存在一些挑战。换句话说,现有的技术距离人类视觉系统的能力还很远。
在我们的日常生活中,脸可能是最常见和熟悉的生物特征。随着摄影术的发明,政府部门和私人实体保存了面部照片(从个人身份证件、护照或会员卡)。这些收集物已被用于法医调查,作为参考数据库,以匹配和比较被告的面部图像(例如,行凶者、证人或受害者)。此外,数码相机和智能手机的广泛使用,使面部图像更容易制作每天;这些图片可以很容易地通过快速建立的社交网络(如Facebook和Twitter)分发和交换。人脸识别有着悠久的历史;它激起了神经学家、心理学家和计算机科学家的极大兴趣。与其他生物特征相比,人脸并不是一种理想的形态;它通常不如虹膜或指纹等其他生物识别模式精确,并且可能受到化妆品、伪装和照明[3]的影响。然而,脸的优势使它成为身份识别最受青睐的生物特征之一,我们可以注意到:
自然特征:人脸是人类在对个人进行识别时使用的非常逼真的生物特征,可能是认证和识别目的中最相关的生物特征[4]。例如,在访问控制中,管理员可以很容易地通过身份验证对已批准的人员进行监控和评估,只需使用他们的面部特征。普通雇主(如管理人员)的支持可以提高识别系统的效率和适用性。另一方面,识别指纹或虹膜需要有专业能力的专家提供准确的确认。
非侵入性:与指纹或虹膜图像相比,无需身体接触即可快速获取面部图像;当人们用面部作为生物识别标识时,会感到更放松。此外,人脸识别设备可以以人们普遍接受的[5]友好方式收集数据。
合作少:与虹膜或指纹相比,人脸识别需要用户提供的帮助更少。对于一些有限的应用,比如监视,人脸识别设备可以在没有积极主体参与的情况下识别个体。1871年,在英国的一个法庭上,人们首次尝试通过比较面部照片的一部分来识别面部对象。在犯罪现场有视频或图片的情况下,人脸识别是最重要的执法技术之一。法律专家会进行人工面部图像测试,以匹配嫌疑人的面部图像。自动面部识别技术提高了司法工作人员的效率,并简化了比较过程。如今,与人工智能技术相结合的面部识别技术,能够通过人脸识别一个人,或验证他自称的身份。面部识别可以分析面部特征和其他生物特征,比如眼睛,并将它们与照片或视频进行比较。由于被指控存在广泛的监控,这项有争议的技术引起了反对者的许多担忧,他们担心数据隐私和个人自由受到侵犯。对于其捍卫者来说,人脸识别能够实现准确、快速和安全的身份验证,以防止各种形式的欺诈。据分析公司Mordor-Intelligence[8]的报告,2019年全球人脸识别市场规模预计为44亿美元,到2025年将超过109亿美元。这项技术已经在一些国家流行起来,比如中国。由于人工智能技术的发展,人脸识别技术取得了重大进展。在早期,研究兴趣主要集中在控制条件下的人脸识别,简单的经典方法提供了优秀的性能。今天,研究的重点是在非约束条件下,深度学习技术[9]已经获得了更多的普及,因为它提供了强大的鲁棒性,以应对可能改变识别过程的多种变化。此外,许多学者努力寻找健壮和可靠的数据集进行测试和评估他们提出的方法:找到一个合适的数据集是一个重要的挑战,特别是在3D面部识别和面部表情识别。为了检查这些方法的有效性,需要精确的数据集(i)包含大量的人物和照片,(ii)遵循真实世界的要求,以及(iii)向公众开放。
我们在这次审查中的贡献是:
我们提供了一个自动人脸识别系统的最新回顾:历史,现在和未来的挑战。
我们展示了23个著名的人脸识别数据集及其评估协议。
我们回顾和总结了1990年至2020年近180篇关于人脸识别及其数据采集和预处理的重要问题的科学论文。这些出版物根据不同的方法进行了分类:二维和三维面部识别的整体、几何、局部纹理和深度学习。我们特别关注基于深度学习的方法,这些方法目前被认为是最先进的二维人脸识别方法。
我们根据所实现的架构及其性能评估指标分析和比较了几种深度学习方法。
我们研究了深度学习方法在最常用的数据集下的性能:(i) labelled Face in the Wild (LFW)数据集[10]用于2D人脸识别,(ii) Bosphorus和BU3DFE用于3D人脸识别。
本文着重从三维人脸识别的角度讨论了人脸识别技术的一些新方向和未来的挑战。
2.人脸识别的历史
本节回顾了对人脸识别技术发展做出贡献的最重要的历史阶段(见图1):
1964年:美国研究者Bledsoe et al.[11]研究了面部识别计算机编程。他们设想了一种半自动的方法,在这种方法中,操作人员被要求输入20个计算机测量值,比如嘴巴或眼睛的大小。
1977年:通过添加21个额外的标记(如唇宽,头发颜色),该系统得到了改进。
1988年:人工智能被引入来开发以前使用过的理论工具,这些工具显示出许多弱点。数学(“线性代数”)被用来以不同的方式解释图像,并找到一种方法来简化和操纵它们,而不受人类标记的影响。
1991年:麻省理工学院(MIT)的Alex Pentland和Matthew Turk提出了面部识别技术的第一个成功的例子,Eigenfaces[12],它使用了统计主成分分析(PCA)方法。
1998年:为了鼓励工业界和学术界在这一课题上取得进展,美国国防高级研究计划局(DARPA)开发了人脸识别技术(FERET)[13]程序,该程序向全世界提供了一个规模庞大、具有挑战性的数据库,由850人的2400张图像组成。
2005年:人脸识别大挑战(FRGC)[14]比赛启动,鼓励和开发人脸识别技术,以支持现有的人脸识别举措。
2011年:由于深度学习,一切都在加速,这是一种基于人工神经网络[9]的机器学习方法。计算机选择要比较的点:当它提供更多的图像时,它学习得更好。
2014年:Facebook知道如何识别人脸,因为它的内部算法,Deepface[15]。该社交网络声称,其方法的性能接近人眼的97%。
今天,面部识别技术的进步鼓励了商业、工业、法律和政府应用领域的多种投资。例如:
在其最新更新中,苹果推出了一款面部识别应用,其应用已扩展到零售和银行业。
万事达卡开发了用于在线交易的面部识别框架——自拍支付。
从2019年起,在中国想购买新手机的人将同意由运营商对其面部进行检查。
中国警方使用了一种基于实时面部识别的智能监控系统;2018年,他们利用这个系统在一场音乐会中逮捕了一名“经济犯罪”嫌疑人,他的脸被列在一个国家数据库中,在5万人的人群中被确认。
3.人脸识别系统
3.1.人脸识别系统的主要步骤
在工程中,人脸自动识别的问题包括三个关键步骤[16](如图2所示):(1)人脸的近似检测和归一化;(2)特征提取和精确的人脸归一化;(3)分类(验证或识别)。
人脸检测是人脸自动识别系统的第一步。它通常决定一个图像是否包含一个人脸。如果是,它的功能是跟踪图片[17]中的一个或几个面部位置。特征提取步骤包括从被检测的人脸中提取一个特征向量,该特征向量必须足够代表人脸。面部的个性和区分两个人的特性必须加以检查。值得注意的是,人脸检测阶段可以完成这个过程。
分类包括验证和识别。验证需要将一个面孔与另一个面孔进行匹配,才能授权对请求身份的访问。然而,身份识别是将一张脸与其他几张脸进行比较,这些脸有几种可能性,以找到这张脸的身份。
有时候,有些步骤是不分开的。例如,用于特征提取的面部特征(眼、口、鼻)在人脸检测中经常用到。特征的检测和提取可以同时进行,如图2所示。
根据应用程序环境的复杂性,一些外部因素可能会导致高度的内部面孔身份分布(或较低的界面面孔身份分布),并降低识别的准确性。在这些因素中,我们可以引用数据库大小、低或高光照、存在噪声或模糊、伪装、部分遮挡以及某些通常常见、不可避免和非常具有挑战性的次要因素[18]。在噪声环境下,图像预处理可能是必要的[19-21]。
尽管自动人脸识别系统必须执行上述三个步骤,但每一步都被认为是一个关键的研究问题,这不仅是因为每一步所使用的技术需要改进,而且因为它们在一些应用程序中是必不可少的,如图2所示。例如,人脸检测是激活人脸监测的必要条件,而人脸特征的提取是识别人的情绪状态的关键,这反过来又是人机交互系统(HMI)的关键。每个步骤的隔离有助于评估和最新技术的发展。
本文主要研究特征提取(可能还有特征选择)和分类。人脸的采集与检测是三维人脸识别中的一个关键问题。
3.2.人脸识别评估协议
如前一小节所述,自动人脸识别系统可以在验证或识别模式下运行,具体取决于每个应用程序(如图3所示)。
在验证模式[22]中,系统通过比较一个人在数据库中注册的模型和捕获的人脸来评估他的身份。系统执行一对一的比较,以决定所宣布的身份是真还是假。为了避免不同的个体使用相同的身份,验证往往习惯性地用于积极的认知。人脸验证系统的经典评估方法是受试者工作特征(ROC)和估计平均准确率(ACC)。
ROC分析评估两种类型的错误:真实接受率(TAR)和错误接受率(FAR)。TAR定义为正确超过相似度评分(阈值)的有效比较的分数:
TP:真阳性。
FN:假阴性。
此外,FAR被定义为视点替用特效比较错误地超过同一阈值的百分比:
TP:真阳性。
FN:假阴性。
然而,ACC是一个简化的指标,它显示了正确分类的百分比:
在识别模式[22]中,系统通过搜索数据库中存储的所有面部模型之间的最佳匹配来识别个体。因此,系统执行“一对一”的比较来确定这个个体(如果该个体不存在于数据库中,则会失败),而不提供预先的身份声明。
识别是有害识别应用的一项重要任务;这种识别的目的是防止一个人拥有多重身份。对于两个不同的场景,可以使用两种测试协议,它们是:开放集和封闭集(如图3所示)。
对于前者,训练集不能包含测试恒等式。在开放集人脸识别场景中,建立了假阴性识别率(FNIR)和假阳性识别率(FPIR)等指标来衡量模型的准确性。FNIR衡量的是错误分类为假的病例的比例,尽管它们是真实的病例,而FPIR衡量的是错误分类为真的病例的比例,尽管它们是假的。
而后者则从相同的身份中检索图像进行训练和测试。Rank-N是用于封闭人脸识别的基本性能指标,用于测量模型的准确性,在N-Top匹配中返回有效的用户标识符。通过在累积匹配特性(CMC)曲线上的正确识别率记录主要测量性能。
4.二维人脸识别的可用数据集和协议
为了评估和比较模式识别系统,特别是生物特征识别系统的验证或识别性能,必须向公众提供足够受试者大小的图像基准数据集。在本节中,我们将总结用于测试面部验证和识别系统性能的适当和最新的数据集,这些数据集也可以免费下载或以可接受的努力进行认证。我们主要集中于只适合测试2D人脸识别方法的数据集。图4总结了按出现时间顺序列出的数据集。
4.1.ORL数据库
1992年至1994年,剑桥大学计算机实验室开发了ORL (Olivetti研究实验室)数据集[23]。它被用于一个人脸识别项目的框架中,该项目与剑桥大学工程系的语音、视觉和机器人小组合作进行。它包含了40个人的400张正面面部图像,他们有不同的面部表情(睁开/闭上眼睛,微笑/不微笑),照明条件,有胡子或没有胡子的发型,胡须和眼镜。所有的样本都是在一个深色统一的背景下获得的,受试者处于垂直的正面姿势(有一点侧面运动)。每个样本为92 times; 112像素,灰度图像256张,具有倾斜公差,旋转可达20°,如图5所示。
4.2.FERET数据集
FERET(面部识别技术)数据集[13]于1993年至1996年期间由国防部反毒技术发展项目办公室创建。我们的目标是通过机器开发人脸识别功能,用于协助身份验证、安全和取证应用。在半控制的环境下,在15次会话中获取面部图像。它涵盖了14126张包括1199人的1564组面部图像和365组重复的面部图像(图6)。重复的面部图像是数据库中已经存在的另一组个人的面部图像,通常是在另一天收集的。
最常用的评估协议需要将3323个样本与3816个样本进行匹配的算法,执行大约1260万次匹配。此外,它还可以确定各种图库和探针集的识别分数。可以研究以下几种情况:(1)在相同的光照条件下,在同一天采集个体的标本和探针;(2)采集一个人的标本和探针标本数天;(3)一个人的标本和探查标本的采集间隔超过1年;(4)一个人的gallery和probe samples在同一天采集,但光照条件不同。
该方案提供两种类型的评估:第一种提供带有眼中心坐标的样本,第二种只提供样本,不提供任何指示。
4.3.基于“增大化现实”技术的数据集
Martinez和Benavente于1998年在西班牙巴塞罗那的计算机视觉中心制作了数据库AR (Alex和Robert)[24]。该数
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[603288],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。